speech-recognition

触发 Android Google Assistant 时使 Windows 媒体静音或暂停
speech-recognition

触发 Android Google Assistant 时使 Windows 媒体静音或暂停

我希望这是在规定范围内的,因为规则禁止与“手机或智能手机”相关的问题,除非它们与你的计算机接口“ 在 Android 上,当 Google Assistant 被触发时,媒体会静音,同时它会监听命令 我怎样才能让 Windows(理想情况下是 Linux,但 Windows 目前是主要目标)媒体在触发时同样静音,这样我就可以向电脑旁边的手机发出命令,而不会让媒体掩盖我的声音,然后媒体会在 Google Assistant 完成其操作后恢复播放? ...

Admin

我在 Windows 11 上设置语音识别麦克风时遇到错误
speech-recognition

我在 Windows 11 上设置语音识别麦克风时遇到错误

我在 Windows 11 上设置语音识别麦克风时遇到错误。 我在语音识别故障排除时收到错误,设置 -> 时间语言 -> 麦克风启动。 (Error description) Package ID: SpeechDiagnosticCalibrate Path: C:\Windows\Diagnostics\Index\SpeechDiagnostic.xml Error code:0x80004003 Source: engine Context: Admin Privilege 我的电脑识别麦克风装置经理并可以录制声音“Windows 录音...

Admin

如何将音频/视频文件转换为 SRT?
speech-recognition

如何将音频/视频文件转换为 SRT?

我想将音频/视频文件转换为 SRT。我尝试过以下命令: ffmpeg -i sample.mp4 sample.srt ffmpeg -threads 4 -i sample.mp4 -vn -an -codec:s:0.2 srt sample.srt 但后来我得知,这是用来从已有字幕的视频中提取字幕的。有什么办法可以产生来自 mp4/mp3 文件的字幕? 提前致谢! ...

Admin

如何设置 Alexa 以支持多个待办事项列表应用程序?
speech-recognition

如何设置 Alexa 以支持多个待办事项列表应用程序?

请注意这个问题不是询问如何添加附加列表:)。 因此,我尝试设置我的 Alexa 来支持我的家庭需求(主要是待办事项列表和购物清单)和工作需求。但是: 看起来您只能通过该应用程序分配 1 项主要待办事项列表技能。 我想要支持超过 2 个自定义列表(todoist 是理想的,但不能使用自定义列表,因此上限为 2)。 我希望部分/所有自定义工作列表都是私密/独立的(这可以通过不同的应用程序来保护隐私,这更多的是为了方便,而不是为了安全)。这是我努力实现的需求。 我已经使用并且很乐意使用各种待办事项技能,目前除了 Alexa 之外,我还使用 Todoist、Ev...

Admin

使用 Azure 为 3 名以上发言者进行发言者分类
speech-recognition

使用 Azure 为 3 名以上发言者进行发言者分类

Azure 的批量转录是否支持 2 个以上说话者的说话者日记分类? 我检查了他们的休息 API文档,没有找到任何相关信息。 还有其他方法可以使用 Azure 认知服务来实现这一点吗? ...

Admin

在 Microsoft Windows 11 的语音访问中可以定义自己的单词和短语吗?
speech-recognition

在 Microsoft Windows 11 的语音访问中可以定义自己的单词和短语吗?

从https://beebom.com/what-is-voice-access-windows-11-how-use/: 语音访问是 Windows 11 的一项新辅助功能,让您可以更轻松地仅使用语音控制 Windows 11 PC。 可以在 Microsoft Windows 11 的语音访问中定义自己的单词和短语吗?(即在字典中添加单词或短语,例如“Stack Exchange”) ...

Admin

为什么英语(美国)在 Windows 10 中没有语音识别设置?
speech-recognition

为什么英语(美国)在 Windows 10 中没有语音识别设置?

我有多台 Windows 10 机器,在键盘选项上方,我可以单击“下载文本转语音”或类似内容,以便我可以使用语音识别,但我不再获得该选项。 没有下载文本转语音或语音识别的选项。 我的国家设置为美国。 我的显示语言设置为英语(美国),但是当我尝试激活语音识别时,Windows 说我需要将显示语言更改为英语(美国)。 如何让 Windows 10 允许我下载语音识别包? ...

Admin

当有专用显卡或 GPU 可用时,Dragon 或 Windows Speech Recognition 是否会使用专用显卡或 GPU?
speech-recognition

当有专用显卡或 GPU 可用时,Dragon 或 Windows Speech Recognition 是否会使用专用显卡或 GPU?

龙和 Windows 语音识别是两个流行的程序,用于语音转文本听写和通过语音操作计算机。在我那台设备齐全但已有 7 年历史的笔记本电脑上,这两个程序都可能挂起,具体取决于说话的内容。当我寻找一台新电脑时,知道专用 GPU 是否可以为运行它们提供一些性能优势会很有用。我猜不会,但想确定一下。 元: 推测这个问题在这里并不是题外话,但如果是的话,请告知应该在哪里重新发布这个问题。 ...

Admin

BestMatch V 在 Dragon NaturallySpeaking 中是否仍与 Natlink 存在性能问题?
speech-recognition

BestMatch V 在 Dragon NaturallySpeaking 中是否仍与 Natlink 存在性能问题?

http://explosionduck.com/wp/introduction-to-voice-programming-part-one-dns-natlink/说: BestMatch V 与 Natlink 存在性能问题。 这篇文章写于两年多前,作者使用的是 Dragon NaturallySpeaking 12.5。 在 Dragon NaturallySpeaking 的新版本中,BestMatch V 是否仍然存在与 Natlink 相关的性能问题? ...

Admin

Chrome 语音识别 API 在一个浏览器中停止工作,但在 Canary (MacOS) 中可以工作
speech-recognition

Chrome 语音识别 API 在一个浏览器中停止工作,但在 Canary (MacOS) 中可以工作

我已经使用语音识别 API 几年了(没有什么太复杂的),但是大约一年没有使用之后它就不再在我的主 Chrome 浏览器中工作了:版本 77.0.3865.90(官方版本)(64 位)。 我在三个不同的网站上进行测试——两​​个是我自己的,第三个是Google 官方演示。在我的主 Chrome 浏览器中,没有检测到任何音频。与之相关的错误消息recognition.onerror只是“无语音”。 当我使用 Chrome Canary 时,一切都运行正常。 我的 Mac 上连接了多个音频输入设备(包括内置麦克风),我尝试过将麦克风设置更改为每个设备。它们在...

Admin

我们可以使用 python 在歌曲中查找单词吗?
speech-recognition

我们可以使用 python 在歌曲中查找单词吗?

我是 Python 新手。我想查找某个单词是否是歌曲的一部分 例如, 如果我有一个押韵的“johnny johnny yes papa, eating sugar no papa”作为 mp3 或 wav 文件。 我将输入单词“sugar”和 0 到 5 秒的时间。是否可以检查在给定的 5 秒内是否出现了 sugar 单词? 请帮助我。 谢谢,Shobha ...

Admin

Dragon NaturallySpeaking 在打开麦克风后需要几秒钟才能转录第一个话语,但转录其他话语的速度很快
speech-recognition

Dragon NaturallySpeaking 在打开麦克风后需要几秒钟才能转录第一个话语,但转录其他话语的速度很快

打开麦克风后,Dragon NaturallySpeaking 需要几秒钟来转录第一个话语,但只要我不关闭麦克风,就可以很快(<0.5 秒)转录后续话语。 我怎样才能让 Dragon 更快地转录第一句话? 我没有看到任何后台进程可以解释第一个话语转录缓慢的原因。延迟发生在打开麦克风后的第一个话语中。请注意,如果我打开麦克风,等待几秒钟,然后说些什么,在这种情况下就不会出现转录延迟。似乎在打开麦克风后的前几秒钟,Dragon 正在做一些校准或其他事情(我没有看到任何未完成的 CPU 活动)。 我的设置如下:我使用 Dragon NaturallyS...

Admin

当媒体播放器不提供隐藏式字幕时,如何创建 BBC 广播节目的书面记录?
speech-recognition

当媒体播放器不提供隐藏式字幕时,如何创建 BBC 广播节目的书面记录?

我不太确定这个网站是否适合提出这个问题。如果不是,请将问题迁移到适当的 SE 网站。 在2018 年 6 月 15 日 BBC 国际服务周末正在播放一个节目,我正在尝试获取或创建文本记录。媒体播放器不提供隐藏式字幕功能。 我特别感兴趣的是创建从 8:50 开始到 11:30 结束的广播的文本记录。 鉴于使用SpeechRecognitionWeb Speech APIChromium 浏览器涉及将录制的音频发送到远程服务器,宁愿避免这种选择。 有哪些可行的方法可以获取或创建上述音频媒体的文本记录? ...

Admin