speech-recognition

触发 Android Google Assistant 时使 Windows 媒体静音或暂停

我希望这是在规定范围内的，因为规则禁止与“手机或智能手机”相关的问题，除非它们与你的计算机接口“ 在 Android 上，当 Google Assistant 被触发时，媒体会静音，同时它会监听命令我怎样才能让 Windows（理想情况下是 Linux，但 Windows 目前是主要目标）媒体在触发时同样静音，这样我就可以向电脑旁边的手机发出命令，而不会让媒体掩盖我的声音，然后媒体会在 Google Assistant 完成其操作后恢复播放？ ...

Admin 2024-10-22

speech-recognition

我在 Windows 11 上设置语音识别麦克风时遇到错误

我在 Windows 11 上设置语音识别麦克风时遇到错误。我在语音识别故障排除时收到错误，设置 -> 时间语言 -> 麦克风启动。 (Error description) Package ID: SpeechDiagnosticCalibrate Path: C:\Windows\Diagnostics\Index\SpeechDiagnostic.xml Error code:0x80004003 Source: engine Context: Admin Privilege 我的电脑识别麦克风装置经理并可以录制声音“Windows 录音...

Admin 2024-10-14

speech-recognition

如何将音频/视频文件转换为 SRT？

我想将音频/视频文件转换为 SRT。我尝试过以下命令： ffmpeg -i sample.mp4 sample.srt ffmpeg -threads 4 -i sample.mp4 -vn -an -codec:s:0.2 srt sample.srt 但后来我得知，这是用来从已有字幕的视频中提取字幕的。有什么办法可以产生来自 mp4/mp3 文件的字幕？提前致谢！ ...

Admin 2024-10-2

speech-recognition

如何设置 Alexa 以支持多个待办事项列表应用程序？

请注意这个问题不是询问如何添加附加列表：)。因此，我尝试设置我的 Alexa 来支持我的家庭需求（主要是待办事项列表和购物清单）和工作需求。但是：看起来您只能通过该应用程序分配 1 项主要待办事项列表技能。我想要支持超过 2 个自定义列表（todoist 是理想的，但不能使用自定义列表，因此上限为 2）。我希望部分/所有自定义工作列表都是私密/独立的（这可以通过不同的应用程序来保护隐私，这更多的是为了方便，而不是为了安全）。这是我努力实现的需求。我已经使用并且很乐意使用各种待办事项技能，目前除了 Alexa 之外，我还使用 Todoist、Ev...

Admin 2024-10-2

speech-recognition

使用 Azure 为 3 名以上发言者进行发言者分类

Azure 的批量转录是否支持 2 个以上说话者的说话者日记分类？我检查了他们的休息 API文档，没有找到任何相关信息。还有其他方法可以使用 Azure 认知服务来实现这一点吗？ ...

Admin 2024-10-2

speech-recognition

在 Microsoft Windows 11 的语音访问中可以定义自己的单词和短语吗？

从https://beebom.com/what-is-voice-access-windows-11-how-use/：语音访问是 Windows 11 的一项新辅助功能，让您可以更轻松地仅使用语音控制 Windows 11 PC。可以在 Microsoft Windows 11 的语音访问中定义自己的单词和短语吗？（即在字典中添加单词或短语，例如“Stack Exchange”） ...

Admin 2024-10-1

speech-recognition

为什么英语（美国）在 Windows 10 中没有语音识别设置？

我有多台 Windows 10 机器，在键盘选项上方，我可以单击“下载文本转语音”或类似内容，以便我可以使用语音识别，但我不再获得该选项。没有下载文本转语音或语音识别的选项。我的国家设置为美国。我的显示语言设置为英语（美国），但是当我尝试激活语音识别时，Windows 说我需要将显示语言更改为英语（美国）。如何让 Windows 10 允许我下载语音识别包？ ...

Admin 2024-8-18

speech-recognition

当有专用显卡或 GPU 可用时，Dragon 或 Windows Speech Recognition 是否会使用专用显卡或 GPU？

龙和 Windows 语音识别是两个流行的程序，用于语音转文本听写和通过语音操作计算机。在我那台设备齐全但已有 7 年历史的笔记本电脑上，这两个程序都可能挂起，具体取决于说话的内容。当我寻找一台新电脑时，知道专用 GPU 是否可以为运行它们提供一些性能优势会很有用。我猜不会，但想确定一下。元：推测这个问题在这里并不是题外话，但如果是的话，请告知应该在哪里重新发布这个问题。 ...

Admin 2024-7-12

speech-recognition

我如何强制 Dragon NaturallySpeaking 中的拼写模式仅识别北约音标字母？

有没有办法配置 Dragon NaturallySpeaking，以便拼写模式仅识别北约音标字母口述字母数字字符？ ...

Admin 2024-7-6

speech-recognition

BestMatch V 在 Dragon NaturallySpeaking 中是否仍与 Natlink 存在性能问题？

http://explosionduck.com/wp/introduction-to-voice-programming-part-one-dns-natlink/说： BestMatch V 与 Natlink 存在性能问题。这篇文章写于两年多前，作者使用的是 Dragon NaturallySpeaking 12.5。在 Dragon NaturallySpeaking 的新版本中，BestMatch V 是否仍然存在与 Natlink 相关的性能问题？ ...

Admin 2024-7-5

speech-recognition

Chrome 语音识别 API 在一个浏览器中停止工作，但在 Canary (MacOS) 中可以工作

我已经使用语音识别 API 几年了（没有什么太复杂的），但是大约一年没有使用之后它就不再在我的主 Chrome 浏览器中工作了：版本 77.0.3865.90（官方版本）（64 位）。我在三个不同的网站上进行测试——两个是我自己的，第三个是Google 官方演示。在我的主 Chrome 浏览器中，没有检测到任何音频。与之相关的错误消息recognition.onerror只是“无语音”。当我使用 Chrome Canary 时，一切都运行正常。我的 Mac 上连接了多个音频输入设备（包括内置麦克风），我尝试过将麦克风设置更改为每个设备。它们在...

Admin 2024-6-28

speech-recognition

我们可以使用 python 在歌曲中查找单词吗？

我是 Python 新手。我想查找某个单词是否是歌曲的一部分例如，如果我有一个押韵的“johnny johnny yes papa, eating sugar no papa”作为 mp3 或 wav 文件。我将输入单词“sugar”和 0 到 5 秒的时间。是否可以检查在给定的 5 秒内是否出现了 sugar 单词？请帮助我。谢谢，Shobha ...

Admin 2024-6-19

speech-recognition

Dragon NaturallySpeaking 在打开麦克风后需要几秒钟才能转录第一个话语，但转录其他话语的速度很快

打开麦克风后，Dragon NaturallySpeaking 需要几秒钟来转录第一个话语，但只要我不关闭麦克风，就可以很快（<0.5 秒）转录后续话语。我怎样才能让 Dragon 更快地转录第一句话？我没有看到任何后台进程可以解释第一个话语转录缓慢的原因。延迟发生在打开麦克风后的第一个话语中。请注意，如果我打开麦克风，等待几秒钟，然后说些什么，在这种情况下就不会出现转录延迟。似乎在打开麦克风后的前几秒钟，Dragon 正在做一些校准或其他事情（我没有看到任何未完成的 CPU 活动）。我的设置如下：我使用 Dragon NaturallyS...

Admin 2024-6-19

speech-recognition

当未插入为配置文件配置的麦克风时，如何在 Dragon NaturallySpeaking 12.5 中导出我的语音命令？

当未插入为配置文件配置的麦克风时，如何在 Dragon NaturallySpeaking 12.5 中导出我的语音命令？当未插入为配置文件配置的麦克风时，“打开词汇编辑器”菜单将变灰：我使用 Dragon NaturallySpeaking 12.5 Professional 和 Windows 7 SP1 x64 Ultimate。 ...

Admin 2024-6-19

speech-recognition

当媒体播放器不提供隐藏式字幕时，如何创建 BBC 广播节目的书面记录？

我不太确定这个网站是否适合提出这个问题。如果不是，请将问题迁移到适当的 SE 网站。在2018 年 6 月 15 日 BBC 国际服务周末正在播放一个节目，我正在尝试获取或创建文本记录。媒体播放器不提供隐藏式字幕功能。我特别感兴趣的是创建从 8:50 开始到 11:30 结束的广播的文本记录。鉴于使用SpeechRecognitionWeb Speech APIChromium 浏览器涉及将录制的音频发送到远程服务器，宁愿避免这种选择。有哪些可行的方法可以获取或创建上述音频媒体的文本记录？ ...

Admin 2024-6-19