使用 Azure 为 3 名以上发言者进行发言者分类
Azure 的批量转录是否支持 2 个以上说话者的说话者日记分类? 我检查了他们的休息 API文档,没有找到任何相关信息。 还有其他方法可以使用 Azure 认知服务来实现这一点吗? ...
Azure 的批量转录是否支持 2 个以上说话者的说话者日记分类? 我检查了他们的休息 API文档,没有找到任何相关信息。 还有其他方法可以使用 Azure 认知服务来实现这一点吗? ...
我在 YouTube 上看了一个演讲视频,但是演讲音量太小,而音效却没有。所以我想我应该下载它,放大演讲音量并删除音效。 我在 Audacity 中打开它,并将整个音频放大 23dB。现在可以听到演讲了,但我不知道如何批量删除音效部分和其他非语音的响亮声音。我不需要将音效与演讲分开,因为播放音效时人不会说话,所以我所要做的就是找到音效所在的位置并静音那些部分。 演讲很长,所以我能不能一次性全部讲完,而不用一个一个地讲? ...
请参阅 Windows 10 中附加的设置。 是否可以通过管理员中的 PowerShell 删除它,或者这样做是否安全? 如果可以这样做,当它们变灰时如何删除它们? ...
我为有特殊需要的儿子安装了 One Note 学习工具,但我能听到的声音只有“Microsoft David”和“Microsoft Zira”,由于口音的原因,他很难听懂。 我尝试下载英语(印度),它显示为默认语言,但在语音沉浸式阅读器中仍然没有显示“Microsoft Heera”和“Microsoft Ravi”选项。 如何让这些语言在沉浸式阅读器中发挥作用? ...
我曾经将我的 TTS 自定义设置为快速而漂亮地朗读内容,这对我来说效果更好,因为我基本上患有注意力缺陷障碍 (ADD) 和轻度诵读困难。 现在我并不是一个专家,但我已经尽我所能去搜寻了......追溯到我最初在终端上发布的内容。 这似乎是正确的方向: https://developer.apple.com/library/mac/documentation/UserExperience/Conceptual/SpeechSynthesisProgrammingGuide/FineTuning/FineTuning.html 也许是这样的: SetSpeech...
我已经尝试让 Cortana 在 Windows 10 中运行很长时间了,但没有成功。我尝试按照 Microsoft 的说明进行操作: 将地区设置为加拿大 ✓ 将语言设置为英语(加拿大)✓ 将语音设置为英语(加拿大)✕ 这是我遇到的问题。在“时间和语言”中的“语音语言”下拉菜单下,唯一的选择是英语(美国)。我尝试下载英语(加拿大)语音语言包,但我在语言选项中找不到选项。我尝试在网上寻找演讲包,但没有找到。 有人知道怎么解决这个问题吗?Cortana 看起来真的很酷,如果可以尝试的话我会很高兴的。提前谢谢。 Windows 信息: Windows ...
我需要在干净的 MS Windows 7 Pro English 下实现西班牙语语音识别功能。 我找到了一些链接,但在我看来它们不是我需要的...... http://windows.microsoft.com/en-us/windows/set-speech-recognition#1TC=windows-7 http://windows.microsoft.com/en-us/windows/language-packs#lptabs=win7 http://www.rose-medical.com/sr-upgrade.html 配置步骤...
尝试在 festival 中发言,但似乎 debian 中缺少 /dev/dsp/。如何添加? festival> (SayText "Hello") Linux: can't open /dev/dsp #<Utterance 0xb669c708> ...
最近我在网上看了很多讲座,但很多讲座让我耳朵很疼,因为教授把含有“s”的单词发音得非常尖锐。这对音乐家等来说是一个非常明显的问题,音响工程师经常在扬声器或歌手上使用“去咝声器”来使声音不那么刺耳。 我想知道是否有办法将去咝声器附加到 Windows 音频输出或特定程序(在 Firefox 中运行的 Flash 实例)的输出,就像 Windows 支持控制面板的“硬件和声音”部分下的“增强功能”(如“低音增强”或“响度均衡”)一样。这可能吗? ...
我在 IE 10 中使用 Windows 7 语音识别,当我说“显示数字”时,它不会对我页面上的所有项目进行编号 - 最多只有 3 或 4 个,通常是地址栏、最小化、展开和关闭按钮,但不是页面或工具栏的任何实际内容。有人知道发生了什么吗? ...
我从下载了另一个 TTS 包Microsoft 语音平台 - 运行时语言(版本 11),但在语音属性中此包没有显示。 下图列出了已安装的所有包,这些包在我的 Windows 8 安装中默认出现。 但它不支持 Windows 8,那么我该如何安装更多包? ...
因此,有两个程序:Windows 语音识别和 Dragon NaturallySpeaking。为了测试这两个程序的准确性并将它们并排比较,我想同时运行它们,对着麦克风讲话,然后让它们口述到两个单独的文本框中。有没有办法在 Windows 上做到这一点?有没有办法让每个程序都有自己的文本框,例如两个记事本窗口,然后让每个程序开始在自己的窗口中书写? ...
我正在尝试使用 eSpeak 的命令行版本: http://espeak.sourceforge.net/ 可以改变声音,但语言发音仍然是美式英语。 例如: espeak.exe -v es "como estas?" 为什么听起来像是美国人在尝试讲西班牙语,而不是西班牙语的发音? ...
Internet Explorer 有一个插件叫 MathPlayer,它是一个数学表达式的文本转语音插件。它可以大声读出数学表达式。 但是,我没有使用 Internet Explorer,因为我使用的是 Linux。是否可以使用数学播放器没有 Internet Explorer? 或者如果可行的话,是否有可以在 Linux 上运行并能做同样事情的类似软件? ...
我正在做一个软件项目,正在研究要使用的文本转语音产品。有人知道目前最先进的文本转语音系统是什么吗?理想情况下,语音应该与美国本土人或英语人士的语音没有区别。我正在寻找带有 SDK 或 API 的产品,以便我可以轻松使用。 只是为了澄清和重复我的问题 - 我并不是在寻找像微软的免费文本到语音合成程序这样的东西,而是在寻找高质量的专业产品。 ...