如何将音频/视频文件转换为 SRT?
我想将音频/视频文件转换为 SRT。我尝试过以下命令: ffmpeg -i sample.mp4 sample.srt ffmpeg -threads 4 -i sample.mp4 -vn -an -codec:s:0.2 srt sample.srt 但后来我得知,这是用来从已有字幕的视频中提取字幕的。有什么办法可以产生来自 mp4/mp3 文件的字幕? 提前致谢! ...
我想将音频/视频文件转换为 SRT。我尝试过以下命令: ffmpeg -i sample.mp4 sample.srt ffmpeg -threads 4 -i sample.mp4 -vn -an -codec:s:0.2 srt sample.srt 但后来我得知,这是用来从已有字幕的视频中提取字幕的。有什么办法可以产生来自 mp4/mp3 文件的字幕? 提前致谢! ...
请注意这个问题不是询问如何添加附加列表:)。 因此,我尝试设置我的 Alexa 来支持我的家庭需求(主要是待办事项列表和购物清单)和工作需求。但是: 看起来您只能通过该应用程序分配 1 项主要待办事项列表技能。 我想要支持超过 2 个自定义列表(todoist 是理想的,但不能使用自定义列表,因此上限为 2)。 我希望部分/所有自定义工作列表都是私密/独立的(这可以通过不同的应用程序来保护隐私,这更多的是为了方便,而不是为了安全)。这是我努力实现的需求。 我已经使用并且很乐意使用各种待办事项技能,目前除了 Alexa 之外,我还使用 Todoist、Ev...
Azure 的批量转录是否支持 2 个以上说话者的说话者日记分类? 我检查了他们的休息 API文档,没有找到任何相关信息。 还有其他方法可以使用 Azure 认知服务来实现这一点吗? ...
从https://beebom.com/what-is-voice-access-windows-11-how-use/: 语音访问是 Windows 11 的一项新辅助功能,让您可以更轻松地仅使用语音控制 Windows 11 PC。 可以在 Microsoft Windows 11 的语音访问中定义自己的单词和短语吗?(即在字典中添加单词或短语,例如“Stack Exchange”) ...
我有多台 Windows 10 机器,在键盘选项上方,我可以单击“下载文本转语音”或类似内容,以便我可以使用语音识别,但我不再获得该选项。 没有下载文本转语音或语音识别的选项。 我的国家设置为美国。 我的显示语言设置为英语(美国),但是当我尝试激活语音识别时,Windows 说我需要将显示语言更改为英语(美国)。 如何让 Windows 10 允许我下载语音识别包? ...
龙和 Windows 语音识别是两个流行的程序,用于语音转文本听写和通过语音操作计算机。在我那台设备齐全但已有 7 年历史的笔记本电脑上,这两个程序都可能挂起,具体取决于说话的内容。当我寻找一台新电脑时,知道专用 GPU 是否可以为运行它们提供一些性能优势会很有用。我猜不会,但想确定一下。 元: 推测这个问题在这里并不是题外话,但如果是的话,请告知应该在哪里重新发布这个问题。 ...
有没有办法配置 Dragon NaturallySpeaking,以便拼写模式仅识别北约音标字母口述字母数字字符? ...
http://explosionduck.com/wp/introduction-to-voice-programming-part-one-dns-natlink/说: BestMatch V 与 Natlink 存在性能问题。 这篇文章写于两年多前,作者使用的是 Dragon NaturallySpeaking 12.5。 在 Dragon NaturallySpeaking 的新版本中,BestMatch V 是否仍然存在与 Natlink 相关的性能问题? ...
我已经使用语音识别 API 几年了(没有什么太复杂的),但是大约一年没有使用之后它就不再在我的主 Chrome 浏览器中工作了:版本 77.0.3865.90(官方版本)(64 位)。 我在三个不同的网站上进行测试——两个是我自己的,第三个是Google 官方演示。在我的主 Chrome 浏览器中,没有检测到任何音频。与之相关的错误消息recognition.onerror只是“无语音”。 当我使用 Chrome Canary 时,一切都运行正常。 我的 Mac 上连接了多个音频输入设备(包括内置麦克风),我尝试过将麦克风设置更改为每个设备。它们在...
我是 Python 新手。我想查找某个单词是否是歌曲的一部分 例如, 如果我有一个押韵的“johnny johnny yes papa, eating sugar no papa”作为 mp3 或 wav 文件。 我将输入单词“sugar”和 0 到 5 秒的时间。是否可以检查在给定的 5 秒内是否出现了 sugar 单词? 请帮助我。 谢谢,Shobha ...
打开麦克风后,Dragon NaturallySpeaking 需要几秒钟来转录第一个话语,但只要我不关闭麦克风,就可以很快(<0.5 秒)转录后续话语。 我怎样才能让 Dragon 更快地转录第一句话? 我没有看到任何后台进程可以解释第一个话语转录缓慢的原因。延迟发生在打开麦克风后的第一个话语中。请注意,如果我打开麦克风,等待几秒钟,然后说些什么,在这种情况下就不会出现转录延迟。似乎在打开麦克风后的前几秒钟,Dragon 正在做一些校准或其他事情(我没有看到任何未完成的 CPU 活动)。 我的设置如下:我使用 Dragon NaturallyS...
当未插入为配置文件配置的麦克风时,如何在 Dragon NaturallySpeaking 12.5 中导出我的语音命令? 当未插入为配置文件配置的麦克风时,“打开词汇编辑器”菜单将变灰: 我使用 Dragon NaturallySpeaking 12.5 Professional 和 Windows 7 SP1 x64 Ultimate。 ...
我不太确定这个网站是否适合提出这个问题。如果不是,请将问题迁移到适当的 SE 网站。 在2018 年 6 月 15 日 BBC 国际服务周末正在播放一个节目,我正在尝试获取或创建文本记录。媒体播放器不提供隐藏式字幕功能。 我特别感兴趣的是创建从 8:50 开始到 11:30 结束的广播的文本记录。 鉴于使用SpeechRecognitionWeb Speech APIChromium 浏览器涉及将录制的音频发送到远程服务器,宁愿避免这种选择。 有哪些可行的方法可以获取或创建上述音频媒体的文本记录? ...
我想阻止 Cortana 向 Microsoft 发送语音输入。 但我仍然想使用语音识别,它将使用已安装的“语音识别”功能。 [如果 Cortana 和语音识别不同,我就不需要 Cortana。] 设置、组策略或注册表需要进行哪些更改? ...
几天以来,Windows 10 不断向我发出错误消息“发生了一些事情,我们无法安装某个功能”。 单击错误消息后,我进入管理可选功能。历史记录列出了几次安装失败的尝试English (US) Speech Recognition。安装失败,错误代码为 0x80070422(一如既往的简洁,感谢微软)。 因此问题是: Windows 10 为何尝试安装此组件?我没有要求安装它,而且它对我没什么用。 这个错误是什么意思(即为什么安装失败)? 我该如何告诉 Windows 放弃? ...