FFmpeg 仅在一个音频流上与其偏移合并

FFmpeg 仅在一个音频流上与其偏移合并

我面临的情况是,我花了一整天的时间试图让它工作,但不幸的是我已经没有主意了,我想你们可能会帮助我。

我有两个流,一个是客户的音频流(micMyStream1),另一个是卖家的视频和音频流(MyStream1)。这背后的想法很简单。用户对着麦克风说话,音频被传送给卖家,然后卖家使用视频和音频流回答用户的问题。

到目前为止一切都很好,它现在运行得很好,但有人想出了将用户流中的音频与卖家的音频和视频“合并”的想法,以便让第三个人观看他们之间的整个对话

不幸的是,当我合并一个音频流(可能是用户的音频流)时,对话变得有点尴尬,如下所示:

预期情景:

  • 用户:嗨,你好吗?
  • 卖家:我很好,谢谢,我能为您做些什么?
  • 用户:我想多了解一下你旁边的产品
  • 卖家:当然可以,您想了解哪些信息?
  • 用户:多少钱?
  • 卖家:100块钱

实际情况:

  • 用户:嗨,你好吗?
  • 用户:我想多了解一下你旁边的产品
  • 卖家:我很好,谢谢,我能为您做些什么?
  • 用户:多少钱?
  • 卖家:当然可以,您想了解哪些信息?
  • 卖家:100块钱

似乎一个流比另一个流快得多,所以当我合并音频时,对话对观众来说毫无意义。我尝试以多种方式使用 itsoffset 参数,但没有成功

你们知道我该如何实现这一点吗?我的意思是,我能做些什么来推迟快速流,让对话更接近预期?

这是我正在使用的最后一个 ffmpeg 突击队。

ffmpeg -itsoffset 00:00:07 -i rtmp://<ip>:1935/live/micMyStream1 -i rtmp://<ip>:1935/live/MyStream1  -filter_complex [0:a][1:a]amerge -codec:a aac -ac 2 -strict -2 -f flv rtmp://<ip>:1935/live/bcMyStream1

提前致谢

相关内容