惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

F
Full Disclosure
V
Vulnerabilities – Threatpost
Attack and Defense Labs
Attack and Defense Labs
N
News and Events Feed by Topic
SecWiki News
SecWiki News
S
Security @ Cisco Blogs
Schneier on Security
Schneier on Security
B
Blog
TaoSecurity Blog
TaoSecurity Blog
The Last Watchdog
The Last Watchdog
H
Hacker News: Front Page
Hacker News - Newest:
Hacker News - Newest: "LLM"
博客园_首页
D
Docker
cs.AI updates on arXiv.org
cs.AI updates on arXiv.org
Y
Y Combinator Blog
W
WeLiveSecurity
N
News and Events Feed by Topic
F
Fortinet All Blogs
PCI Perspectives
PCI Perspectives
WordPress大学
WordPress大学
CTFtime.org: upcoming CTF events
CTFtime.org: upcoming CTF events
www.infosecurity-magazine.com
www.infosecurity-magazine.com
Recent Announcements
Recent Announcements
Forbes - Security
Forbes - Security
T
Tailwind CSS Blog
Hacker News: Ask HN
Hacker News: Ask HN
爱范儿
爱范儿
腾讯CDC
Last Week in AI
Last Week in AI
月光博客
月光博客
C
Cybersecurity and Infrastructure Security Agency CISA
P
Proofpoint News Feed
Help Net Security
Help Net Security
V
V2EX
C
Cyber Attacks, Cyber Crime and Cyber Security
C
CXSECURITY Database RSS Feed - CXSecurity.com
H
Heimdal Security Blog
L
LINUX DO - 最新话题
GbyAI
GbyAI
The Hacker News
The Hacker News
罗磊的独立博客
S
SegmentFault 最新的问题
H
Hackread – Cybersecurity News, Data Breaches, AI and More
博客园 - 【当耐特】
cs.CL updates on arXiv.org
cs.CL updates on arXiv.org
V2EX - 技术
V2EX - 技术
Cyber Security Advisories - MS-ISAC
Cyber Security Advisories - MS-ISAC
O
OpenAI News
OSCHINA 社区最新新闻
OSCHINA 社区最新新闻

WebRTC

WebSocket 假连接与 gRPC Gateway 自动发现:复杂局域网 WebRTC 的恢复设计 有用 LiveKit 开发过视频语音会议系统的嘛? - V2EX 在 window 如何处理音频 aec? - V2EX 有在生产环境用过的 livekit 的吗?体验怎么样? - V2EX 安卓 WebRTC 如何使用自定义的音频数据? - V2EX 请推荐一个支持在线会议(仅限于音频)的 SFU - V2EX 基于声网 SDK 实现 iOS 端的一对一视频通话 - V2EX webrtc 有什么封装比较好的 c/c++库吗 - V2EX android google 原生 webrtc setVideoProcessor 如何消费 VideoFrame - V2EX 阿里云 RTC QoS 弱网对抗之变分辨率编码 - V2EX I need help froma software engineer who can work with Janus gateway (WebRTC server technologies ) system . - V2EX WebRTC 如何实现美颜功能 - V2EX 白话解读 WebRTC 音频 NetEQ 及优化实践 - V2EX WebRTC 音视频同步原理与实现 - V2EX 求助: serverless-webrtc-chat 在 Firefox 下失败 - V2EX 求助关于 WebRTC 只能在局域网建立成功问题 - V2EX 正在做一个开源 WebRTC 项目,有感兴趣的小伙伴吗。 sharedrop P2P 文件分享 - V2EX webrtc 不是才有的技术,应用领悟主要是网页端,现在安卓版本更新很快,为什么内置浏览器不支持这种几年前就有的新技术,这个不合理 - V2EX Webtorrent 在内网环境进行播种的想法 - V2EX 能否用 WebRTC 做一个局域网的视频播放服务? - V2EX 求助各位大神,国内目前主流浏览器支持 MediaRecorder 吗? - V2EX 公司要测试 webrtc 是不是买个国内阿里云什么的? - V2EX kurento room 服务端 Python 适配时 iceCandidate 内容怎么设置 - V2EX kurento 的 Python 改造问题 - V2EX [ 北京] WebRTC Meetup, 1 月 8 日 node-party @ 微软大厦,报名从速 ! - V2EX 有没有好用的语音直播服务推荐? - V2EX 编译了 WebRTC 和 Janus Gateway 的 API 文档 - V2EX 编译了 iOS 和 Android 平台上最新的 webrtc 需要的可以来用 - V2EX 关于 WEB 在线语音聊天系统 - V2EX awesome-webrtc: http://openrtc.io/ 有用过 WebRTC 的吗?想了解一下开发难度 - V2EX WebRTC 1.0 WebRTC 技术介绍 - V2EX 怎样禁用浏览器的WebRTC?这东西居然能读取本地IP!! - V2EX webtorrent - BitTorrent over WebRTC - V2EX 用 webrtc 写个类似 btsync 的工具可行不? - V2EX http://lynckia.com/licode/ 一套webrtc开源的类库 - V2EX 一个基于 WebRTC 技术的网络电话服务 - V2EX WebRTC World - V2EX PeerCDN - V2EX WebRTC 的一系列技术真的是一个特别好的创业方向 搭建自己的 TURN Server - V2EX WebRTC Book - V2EX SimpleWebRTC - V2EX Sharefest - V2EX PeerJS P2P Chat Demo - V2EX PeerJS - V2EX WebRTC.io - V2EX WebRTCStats - V2EX
light-rtc: 理念与实践 - V2EX
VideoCloudTech · 2021-03-01 · via WebRTC

在与同行交流过程中,发现很多同行对 WebRTC 改动太多,导致无法升级 WebRTC 版本。而 WebRTC 开源社区的快速迭代,让他们感到欣喜又焦虑:开源社区的迭代效果,是不是超过了他们对 WebRTC 的优化效果?我们针对特定场景优化 WebRTC 时,怎么紧跟 WebRTC 开源社区通用的优化?

理念

简言之,把 WebRTC 作为 Framework 使用,而不是 Library,即:WebRTC 仓库轻量化,核心模块插件化。

详细的,WebRTC 作为 Framework 串联核心模块;核心模块既可以以插件形式使用我们的实现,也可以 Fallback 到 WebRTC 的默认实现。目的是减少 WebRTC 冲突的可能性,提高升级 WebRTC 的敏捷性。

目标:一年升级一次 WebRTC,一次花费一个人月。

架构

模块拆解

file WebRTC 的核心模块,包括:

音频

  • ADM 采集、APM 、ACM 编码;
  • NetEQ 与解码、AM 、ADM 渲染;

视频

  • 采集、编码;
  • JB 、解码、渲染;

通用

  • RTP 打包与解包、FEC 生成与恢复、CC 与 Pacer 、ICE 、SDP 信令等。

WebRTC 在长期的演进中,API 已经具备了作为 Framework 的大部分能力。红色的核心模块,已经基本可以插件化,如下面的 API: file

仓库管理

file light-rtc 作为 WebRTC 仓库,我们需要保留两个 Remote,一个是 Alibaba,一个是 Google 。升级 WebRTC 时,我们从 Google 上 Pull 最新代码, 解决冲突,然后 Push 到 Alibaba 。

对插件化的模块,我们需要放到单独的仓库 lrtc-plugin 里,这样有两个好处:

  1. 对 light-rtc 仓库改动少,减少与 Google 冲突的可能性;
  2. 更重要的,让每个开发同学,在每次改动前,更主动、更有意识的思考,放到哪个仓库更合适,否则容易惯性思维,直接改动 light-rtc 。

对 lrtc-plugin 依赖的第三方库,也应该以单独的仓库存在,并保留两个 Remote,比如 Opus,这样,即使修改了 Opus 源码,仍然可以像升级 light-rtc 一样,方便的单独升级 Opus 版本。

模块

Codec

音频编解码器、视频编解码器,是我们最常优化的部分之一:

  • 新的编码工( AV1/SCC/ROI 等)优化视频质量和带宽;
  • 分辨率自适应,使不同能力(编码能力、发送带宽等)的发送端,发送不同分辨率的码流;
  • Simulcast,为不同能力(解码能力、显示能力、接收带宽等)的接收端,提供不同分辨率码流;
  • SVC,提供时域 /空域分层;
  • 新的视频解码实现,规避 Mac 硬解卡死等问题;
  • 新的音频编码器,适配商用接收端; …… file

这部分插件化是相对简单的,只需要实现自己的 [Video|Audio][Encoder|Decoder]Factory 即可。以 Simulcast 为例,在自己实现的 VideoEncoderFactory 里,先用 WebRTC 原始的 VideoEncoderFactory,创建多个 Encoder 对象,然后封装到一个 Simulcast Encoder 里。

ADM

很可惜,ADM(Audio Device Module)没有提供检测设备插拔的功能,需要增加 Callback 接口。

另外,虽然 WebRTC 支持样本数量的监控,但是当前只用于打印日志,如果想在此基础上做更多事情(如:发现采集样本为 0 时,重启采集),则单独做一个 AudioSampleMoniter 的类,比较有利于扩展。 file ADM 是一个适配难点,相信是困扰 RTC 同行的共同难题。不同操作系统、不同机型,都可能有不一样的问题。例如:

  • Mac 3.5mm 耳机插拔时,偶尔崩溃;
  • Mac 获取的设备 ID 在插拔后发生变化,不能做持久化;
  • 联想 X1 电脑,多次插拔后,整个 Audio 后台服务失效;
  • 某些 Windows 机型采集不到声音;
  • 某些手机采音权限问题; ……

这些修改大部分属于 Bugfix,参考“Bugfix”章节。

APM

APM(Audio Processing Module)可能是 light-rtc 相对难处理的部分。

APM 与 NetEQ 一起,可能是 WebRTC 核心模块中,开源价值最大的部分。在我对 APM 有限的认知里,对 APM 常见的优化可能有:

  • 混音后的远端信号,做滤波 /均衡处理。这是业界不少音频算法的必要条件;
  • 利用 Android 手机特性,优化 AECM,尤其是 Double Talk 时的效果;
  • 啸叫检测与抑制;
  • 利用机型特性,优化 AGC,提高语音音量; ……

下图是 WebRTC APM 内部模块的数据流程图: file 从图中可以看出,APM 其实也为插件化做了准备,但是只在近端信号的尾部、远端信号的头部。从 APM 构造函数上也可以看出来: file 滤波 /均衡,可以方便的实现一个 CustomProcessing 的 render_pre_processor 。

其他的优化,遵循轻量化 /插件化的理念,没有现成的插件接口,我们可以创造新的插件接口,如啸叫抑制,以及 AECM 优化的部分算法。

但 APM 仍然会有很多没办法插件化的,只能修改 light-rtc 仓库,如 AECM Double Talk 优化等。

AM

AM(Audio Mixer)的插件化,可以在不修改 light-rtc 的基础上,玩出很多花样:

  • 播放本地文件;
  • 借助语音检测算法,优化语音排序,从而选出更准确的语音做混音;
  • Mono 变成 Stereo,借助 HRTF,可以在多方同时说话时提高说话人辨识度和可懂度;
  • 对 RTP 方案的回放,倍速回放时变速不变调; …… file

FEC

FEC(Forward Error Correction),常见的修改:

  • 调参,如冗余度、MaxFrames 、Table 类型,包括固定参数和动态自适应调参两类,已有的插件接口 WebRTC::FecControllerFactoryInterface 即可满足;
  • RSFEC,需要创造新的插件接口;
  • Opus Inband FEC 。WebRTC 动态配置的 Opus FEC 参数,不能很好的解决弱网时声音卡顿问题。这时,一个办法是把 Opus 独立成仓库,直接修改 Opus 编码器。 file

CC

CC(Congestion Control),包含两个方面,一个是 CC 算法本身,一个是 CC 关联模块。

算法本身,可以用不同的算法实现,如 WebRTC 默认的 goog_cc,也可以是 BBR,甚至是满足 WebRTC::NetworkControllerFactoryInterface 接口的外部插件。

关联模块:

  • 带宽分配:不同场景可能不一样,如视频会议里,需要“保音频、保屏幕”。可以通过 rtc::BitrateAllocationStrategy 实现插件化。

file

  • Pacer 调优:对于屏幕内容,I 帧往往非常大,WebRTC 的 2.5 倍的发送带宽,会导致巨大的首帧时间。具体解法见仁见智。 ……

VideoRender

Android 、iOS 、Mac,WebRTC 都提供了默认的实现,虽然有少量 Bug,但是基本满足需求。

Windows 平台,早期 WebRTC 提供了 D3D 的实现,最新版已经剔除,我们可以在 lrtc-plugin 仓库实现自己的 D3D,或者其他的渲染,如 QT OpenGL 。

VideoProcess

WebRTC 并没有提供视频前处理(如:美颜)、后处理(如:超分辨率)的接口,但是我们完全可以像 rtc::BitrateAllocationStrategy 一样,创造 VideoProcessInterface 接口, 并在 lrtc-plugin 仓库里实现。 file 让 VideoProcessInterface 同时继承 Sink 和 Source 接口,可以方便的把多个对象串联起来。

其他 & Bugfix

其他核心模块,如 JitterBuffer 、ICE 等,目前接触的主要是 Bugfix,还没有发现自己定制重写的必要。

Bugfix,往往只能修改 light-rtc 仓库。一方面,是尽量把 Bugfix 内聚成函数,减少对已有代码的修改;另一方面,尽量把 Bugfix 贡献到开源社区(Issue Tracker),既为开源社区做了贡献,也彻底避免了升级的冲突。

贡献到开源社区,往往比想象的要复杂,但也更能锻炼人。在特定场景,往往只用了 WebRTC 一部分能力,如视频 JitterBuffer,一个 Bugfix 可能只考虑到了 H264,贡献到开源社区时,则需要同时兼顾 VP8/VP9,甚至是将来的 AV1 。在这个过程中,Google 工程师会在 Code Review 中与你亲密切磋,其实是非常好的锻炼机会,进一步提高对 WebRTC 的认识。

参考

WebRTC m74 源码

RSFEC:

  • WebRTC RSFEC 详解和剖析;
  • ARTP 技术探秘之:WebRTC 中支持 RS FEC 。 (以上两篇文章之后将会在本号推送)

CC