speech-recognition

如何将音频/视频文件转换为 SRT?
speech-recognition

如何将音频/视频文件转换为 SRT?

我想将音频/视频文件转换为 SRT。我尝试过以下命令: ffmpeg -i sample.mp4 sample.srt ffmpeg -threads 4 -i sample.mp4 -vn -an -codec:s:0.2 srt sample.srt 但后来我得知,这是用来从已有字幕的视频中提取字幕的。有什么办法可以产生来自 mp4/mp3 文件的字幕? 提前致谢! ...

Admin

如何设置 Alexa 以支持多个待办事项列表应用程序?
speech-recognition

如何设置 Alexa 以支持多个待办事项列表应用程序?

请注意这个问题不是询问如何添加附加列表:)。 因此,我尝试设置我的 Alexa 来支持我的家庭需求(主要是待办事项列表和购物清单)和工作需求。但是: 看起来您只能通过该应用程序分配 1 项主要待办事项列表技能。 我想要支持超过 2 个自定义列表(todoist 是理想的,但不能使用自定义列表,因此上限为 2)。 我希望部分/所有自定义工作列表都是私密/独立的(这可以通过不同的应用程序来保护隐私,这更多的是为了方便,而不是为了安全)。这是我努力实现的需求。 我已经使用并且很乐意使用各种待办事项技能,目前除了 Alexa 之外,我还使用 Todoist、Ev...

Admin

使用 Azure 为 3 名以上发言者进行发言者分类
speech-recognition

使用 Azure 为 3 名以上发言者进行发言者分类

Azure 的批量转录是否支持 2 个以上说话者的说话者日记分类? 我检查了他们的休息 API文档,没有找到任何相关信息。 还有其他方法可以使用 Azure 认知服务来实现这一点吗? ...

Admin

在 Microsoft Windows 11 的语音访问中可以定义自己的单词和短语吗?
speech-recognition

在 Microsoft Windows 11 的语音访问中可以定义自己的单词和短语吗?

从https://beebom.com/what-is-voice-access-windows-11-how-use/: 语音访问是 Windows 11 的一项新辅助功能,让您可以更轻松地仅使用语音控制 Windows 11 PC。 可以在 Microsoft Windows 11 的语音访问中定义自己的单词和短语吗?(即在字典中添加单词或短语,例如“Stack Exchange”) ...

Admin

为什么英语(美国)在 Windows 10 中没有语音识别设置?
speech-recognition

为什么英语(美国)在 Windows 10 中没有语音识别设置?

我有多台 Windows 10 机器,在键盘选项上方,我可以单击“下载文本转语音”或类似内容,以便我可以使用语音识别,但我不再获得该选项。 没有下载文本转语音或语音识别的选项。 我的国家设置为美国。 我的显示语言设置为英语(美国),但是当我尝试激活语音识别时,Windows 说我需要将显示语言更改为英语(美国)。 如何让 Windows 10 允许我下载语音识别包? ...

Admin

当有专用显卡或 GPU 可用时,Dragon 或 Windows Speech Recognition 是否会使用专用显卡或 GPU?
speech-recognition

当有专用显卡或 GPU 可用时,Dragon 或 Windows Speech Recognition 是否会使用专用显卡或 GPU?

龙和 Windows 语音识别是两个流行的程序,用于语音转文本听写和通过语音操作计算机。在我那台设备齐全但已有 7 年历史的笔记本电脑上,这两个程序都可能挂起,具体取决于说话的内容。当我寻找一台新电脑时,知道专用 GPU 是否可以为运行它们提供一些性能优势会很有用。我猜不会,但想确定一下。 元: 推测这个问题在这里并不是题外话,但如果是的话,请告知应该在哪里重新发布这个问题。 ...

Admin

BestMatch V 在 Dragon NaturallySpeaking 中是否仍与 Natlink 存在性能问题?
speech-recognition

BestMatch V 在 Dragon NaturallySpeaking 中是否仍与 Natlink 存在性能问题?

http://explosionduck.com/wp/introduction-to-voice-programming-part-one-dns-natlink/说: BestMatch V 与 Natlink 存在性能问题。 这篇文章写于两年多前,作者使用的是 Dragon NaturallySpeaking 12.5。 在 Dragon NaturallySpeaking 的新版本中,BestMatch V 是否仍然存在与 Natlink 相关的性能问题? ...

Admin

Chrome 语音识别 API 在一个浏览器中停止工作,但在 Canary (MacOS) 中可以工作
speech-recognition

Chrome 语音识别 API 在一个浏览器中停止工作,但在 Canary (MacOS) 中可以工作

我已经使用语音识别 API 几年了(没有什么太复杂的),但是大约一年没有使用之后它就不再在我的主 Chrome 浏览器中工作了:版本 77.0.3865.90(官方版本)(64 位)。 我在三个不同的网站上进行测试——两​​个是我自己的,第三个是Google 官方演示。在我的主 Chrome 浏览器中,没有检测到任何音频。与之相关的错误消息recognition.onerror只是“无语音”。 当我使用 Chrome Canary 时,一切都运行正常。 我的 Mac 上连接了多个音频输入设备(包括内置麦克风),我尝试过将麦克风设置更改为每个设备。它们在...

Admin

我们可以使用 python 在歌曲中查找单词吗?
speech-recognition

我们可以使用 python 在歌曲中查找单词吗?

我是 Python 新手。我想查找某个单词是否是歌曲的一部分 例如, 如果我有一个押韵的“johnny johnny yes papa, eating sugar no papa”作为 mp3 或 wav 文件。 我将输入单词“sugar”和 0 到 5 秒的时间。是否可以检查在给定的 5 秒内是否出现了 sugar 单词? 请帮助我。 谢谢,Shobha ...

Admin

Dragon NaturallySpeaking 在打开麦克风后需要几秒钟才能转录第一个话语,但转录其他话语的速度很快
speech-recognition

Dragon NaturallySpeaking 在打开麦克风后需要几秒钟才能转录第一个话语,但转录其他话语的速度很快

打开麦克风后,Dragon NaturallySpeaking 需要几秒钟来转录第一个话语,但只要我不关闭麦克风,就可以很快(<0.5 秒)转录后续话语。 我怎样才能让 Dragon 更快地转录第一句话? 我没有看到任何后台进程可以解释第一个话语转录缓慢的原因。延迟发生在打开麦克风后的第一个话语中。请注意,如果我打开麦克风,等待几秒钟,然后说些什么,在这种情况下就不会出现转录延迟。似乎在打开麦克风后的前几秒钟,Dragon 正在做一些校准或其他事情(我没有看到任何未完成的 CPU 活动)。 我的设置如下:我使用 Dragon NaturallyS...

Admin

当媒体播放器不提供隐藏式字幕时,如何创建 BBC 广播节目的书面记录?
speech-recognition

当媒体播放器不提供隐藏式字幕时,如何创建 BBC 广播节目的书面记录?

我不太确定这个网站是否适合提出这个问题。如果不是,请将问题迁移到适当的 SE 网站。 在2018 年 6 月 15 日 BBC 国际服务周末正在播放一个节目,我正在尝试获取或创建文本记录。媒体播放器不提供隐藏式字幕功能。 我特别感兴趣的是创建从 8:50 开始到 11:30 结束的广播的文本记录。 鉴于使用SpeechRecognitionWeb Speech APIChromium 浏览器涉及将录制的音频发送到远程服务器,宁愿避免这种选择。 有哪些可行的方法可以获取或创建上述音频媒体的文本记录? ...

Admin

Win10 不断尝试安装“英语(美国)语音识别”并失败
speech-recognition

Win10 不断尝试安装“英语(美国)语音识别”并失败

几天以来,Windows 10 不断向我发出错误消息“发生了一些事情,我们无法安装某个功能”。 单击错误消息后,我进入管理可选功能。历史记录列出了几次安装失败的尝试English (US) Speech Recognition。安装失败,错误代码为 0x80070422(一如既往的简洁,感谢微软)。 因此问题是: Windows 10 为何尝试安装此组件?我没有要求安装它,而且它对我没什么用。 这个错误是什么意思(即为什么安装失败)? 我该如何告诉 Windows 放弃? ...

Admin