我面临的情况是,我花了一整天的时间试图让它工作,但不幸的是我已经没有主意了,我想你们可能会帮助我。
我有两个流,一个是客户的音频流(micMyStream1),另一个是卖家的视频和音频流(MyStream1)。这背后的想法很简单。用户对着麦克风说话,音频被传送给卖家,然后卖家使用视频和音频流回答用户的问题。
到目前为止一切都很好,它现在运行得很好,但有人想出了将用户流中的音频与卖家的音频和视频“合并”的想法,以便让第三个人观看他们之间的整个对话
不幸的是,当我合并一个音频流(可能是用户的音频流)时,对话变得有点尴尬,如下所示:
预期情景:
- 用户:嗨,你好吗?
- 卖家:我很好,谢谢,我能为您做些什么?
- 用户:我想多了解一下你旁边的产品
- 卖家:当然可以,您想了解哪些信息?
- 用户:多少钱?
- 卖家:100块钱
实际情况:
- 用户:嗨,你好吗?
- 用户:我想多了解一下你旁边的产品
- 卖家:我很好,谢谢,我能为您做些什么?
- 用户:多少钱?
- 卖家:当然可以,您想了解哪些信息?
- 卖家:100块钱
似乎一个流比另一个流快得多,所以当我合并音频时,对话对观众来说毫无意义。我尝试以多种方式使用 itsoffset 参数,但没有成功
你们知道我该如何实现这一点吗?我的意思是,我能做些什么来推迟快速流,让对话更接近预期?
这是我正在使用的最后一个 ffmpeg 突击队。
ffmpeg -itsoffset 00:00:07 -i rtmp://<ip>:1935/live/micMyStream1 -i rtmp://<ip>:1935/live/MyStream1 -filter_complex [0:a][1:a]amerge -codec:a aac -ac 2 -strict -2 -f flv rtmp://<ip>:1935/live/bcMyStream1
提前致谢