肥宅钓鱼网
当前位置: 首页 钓鱼百科

webrtc最全面的指南(你未必知道的WebRTC前世)

时间:2023-08-05 作者: 小编 阅读量: 2 栏目名: 钓鱼百科

你未必知道的WebRTC前世图片来源@视觉中国文丨凡泰极客如果你是一位工程师,想必听过WebRtc,就算没有开发过;如果你是一位互联网用户,大概率使用过WebRTC,虽然可能没有意识到在这个视频为王的时代,我们漫谈一下这个技术的。

图片来源@视觉中国

文丨凡泰极客

如果你是一位工程师,想必听过 WebRtc,就算没有开发过;如果你是一位互联网用户,大概率使用过 WebRTC,虽然可能没有意识到。在这个视频为王的时代,我们漫谈一下这个技术的来龙去脉以及一些有趣的应用。

WebRTC 关卿底事?

文言「底」也表示疑问,是「何」、「什么」的意思。如南唐中主李璟在调侃冯延巳时所写「风乍起,吹皱一池春水,干卿底事?」

如果说 20 世纪人类的书写工具是笔、通讯方式是邮局寄信,那么 21 世纪初人类的书写工具就变成键盘、通讯方式就是电子邮件/短信/即时通信聊天,而从现在开始的可见未来,手机摄像头/VR 设备就是你的书写记录这个世界的工具、实时网络通讯就是你的通讯方式。

视频成了娱乐、学习、商务会议、社交、电商的载体,人们逐渐不再有耐心阅读文字性的信息,现在连购买一件自安装的家具,它都附带二维码,用户只要一扫即打开安装指南的视频,再也不用反复研究纸质说明书里那往往画的非常蹩脚的安装图。

视频不仅是信息的展现方式,它从一部部的 mov、jpeg4、wmv(你硬盘上熟悉而又陌生的文件对不对?)变成一个个的播放器,再变成一个个的 App,然后又从这种单向的“录制 上传 下载  找播放器打开  播放”,变成了“现场录制  边录边播  实时收看”,再变成视频与即时通讯工具、会议工具融合的双向“录制与播放”。

远程视频会议已经成为如今办公的标配

传说中的“实况直播”终于发展到一个“平民化”的阶段。WebRTC,全称 Web Real-Time Communication,就是这么一种基础技术,它促进你用新的“笔”(智能视频设备,例如你的手机)以影像而非文字方式去记录与沟通。

它的奥妙在两部分,自然就是:WebRTC!这不是显而易见的废话吗?还真不是… 但我们先聊一下 RTC,实时网络通讯。

与 RTC 相比,WebRTC 仅仅是针对网页实时通信所建立的标准,其中也只提供了基础的前端功能进行实现。我们并不能简单地将 WebRTC 与 RTC 划等号。

“感觉上很快”就是实时?

WebRTC 强调“实时通讯网络”。网络早已无处不在了,但是否“实时”呢?大部分情况下不是。

首先,当前互联网上最重要最基本的 HTTP 协议并不是为“实时”应用设计的,当你访问一个网站的时候,你发起请求,等候网站的服务器把内容应答送回到你的 PC 或者手机设备,虽然这个应答可以非常快,但本质上是“请求-等候-应答”,这个“等候”,往往是一个不易控制的时间变量。

  • 电子邮件是不是“实时”的呢?显然也不是,虽然相比传统的邮递快了十万八千倍,但是它本质上是“存储-转发”(Store-and-Forward)的机制,是由互联网上很多的邮件服务器以接力的方式,在某个最优网络路径上把电邮从某甲的设备送到某乙的设备,任何中间环节都可能延迟。
  • 聊天工具是不是实时?它相比电子邮件而言,有更加“在线”的会话感 – 一个群里聊天信息来来回回、这边发那边看,好像很“实时”,但它的技术本质依然是“存储-转发”,消息接收方不在线没关系,只要“上线”(打开 App)就能收到,也不需要马上回复。

事实上,对快慢的感觉不能定义实时。网络的低延迟、高带宽固然是实时性的一些保障,但不等同于实时。

用大白话来描述的话,实时视频的目标,是把正在某个地方A发生的人和事,以几乎零延迟、不失真的方式“同步”到另外一个地方 B,让 B 的人瞬间看到、听到,并且反之亦然。人和事都是在不断的变化中,视频需要以“流”的方式源源不断的向远端推送更新,A、B 两地的人虽然隔着十万八千里,但是他们之间的网络能把“视频流”瞬间同步,让彼此感觉近在咫尺,这就是“实时”。

那么现在我们的“实时通讯网络”,距离真正的实时还有多远?

构建元宇宙?无限追求实时

上述问题的简单答案是,有点远。

我们对“实时”的追求是无限的,详细一点的解释,可以借最近热炒的“元宇宙”作为例子。元宇宙,是一个“仿真”或者说“全真”的互联网,它的特点之一,是利用极其强大的实时网络,把物理世界里事物的无限细节信息化并瞬间传播给接收者,使其通过一些特殊设备去复原这些信息并最大程度感受到在原发地事物的原本样子。

这些信息能包括些什么呢?例如有空间感的立体声效(Spatial Audio),让你在一个线上会议室里能听到讲话的人在自己的什么方位,让你在一个虚拟社交沙龙里能听到轻微的背景音乐、左边一群人的闲言碎语、右边吧台上酒保的调酒声;例如能足以让远端设备渲染还原成逼真 3D 效果的人或物的特征数据,大至街景建筑小至毛发与脸部表情,让你在虚拟空间里与其中的物品或人进行互动,像真的一样; 假如有一天我们发明出能收集味道并信息化并在远端通过刺激大脑皮层还原味道的设备,那么这又是一种需要传送的数据。一句话,我们希望把任何物理距离以外的东西,色香味俱全的“同步”到自己的大脑。

如果说我们现在的互联网是 2D 的话(即你只能面对一个屏幕这样的二维平面去交互感知),元宇宙就是下一代 3D 互联网,你“沉浸”在其中,你被实时送达的数据包裹,你的眼耳鼻舌身意“六根”都在里面。不要以为这是科幻,一些技术已经看的到摸得着,简单者如 hubhub,复杂花哨者如 Google 的 Starline。

有兴趣的小伙伴可以去看看 Metaverse Primer

在 Matthew Ball 的“元宇宙入门”( Metaverse Primer)中,提到实时网络是让这一代沉浸式互联网成为可能的8种最核心技术之一。海量数据的极低延迟实时传输能力,目前技术上还是有点遥远。

虽然元宇宙还在“炒作曲线”的不知道哪个点上,可是一些实实在在的商业应用场景确实已经可以基于实时的视频技术进行构建。除了大家熟悉的直播带货、娱乐互动,还有虚拟展会、实时教练培训、远程医疗(Telehealth)等等应用,相信任何线下的场景,只要技术允许,都会有产生线上仿真的一天。

去中心化的通讯方式?

WebRTC 的里的“Web”部分,并非简单无意义的泛指,而是特指 Web Browser(浏览器)。这个标准以及实现它的技术,目前均已内置在各主流浏览器中,理论上让任何用户通过任何 PC、Mac、iPhone、Android 甚至车载系统的浏览器,即可发起彼此之间的直接视频语音通讯。

也就是说,张三和李四,不管人在何方,理论上只要各自有一台设备运行一个支持 HTML5 标准的浏览器,即可以无需经过“中间商”(互联网大平台、电信运营商等等)的通讯服务或渠道而建立这两个浏览器之间的直接连接,实现传说中的“点对点”(Peer-to-Peer)视频通讯和文件分享!如果还有王五、陈六、何七几位呢?欢迎加入,组成一个完全无障碍的、无服务器的、自组织的对等网络,每个人的浏览器都是这个网络的节点,共同进行视频会议、文件分享。

有点像 VR Pro Max 的感觉

无中间商赚差价、无互联网大平台收集通讯各方的隐私数据,个人掌握自己的信息安全,也不依赖任何第三方,是不是忽然有一种自由飞翔的感觉?去中心化、点对点、对等网络,让我们回忆到互联网美好的蛮荒时代 – BT、电驴、迅雷… the good old days…

可惜暂时来说,上述情形只是一种理想,因为互联网的实际环境复杂,例如我们每个人的上网设备实际上都是在某个小区宽带、移动运营商网络、酒店 WiFi、公司局域网等等的后面,互联网实际上是由无数这样大大小小的局部网络通过一系列的网络设备、网络协议进行互联互通的,链路上信息的传递通过不同网络的设备进行层层转发和网络地址/端口的“翻译”转换,最终才到达某个个体设备。

在深圳南山区科技园某公司的员工张某,如何让其浏览器发现并连接北京朝阳区某小区的群众李某的浏览器设备地址,从而建立起点对点直连?没有直接办法。

现有的技术实现方案,依然是中心化的,即张某与李某,不得不通过一个第三方的服务来“发现”彼此的地址,这个环节叫做 Signaling(信令)。

“去中心化”临门一脚,暂时没有现成技术,比较可惜。

区块链WebRTC 有没有的搞?

有一些这方面的研究探索,待有志者进一步深入。

首先是关于技术本身的优化与扩展。例如有人提出利用 Kademlia(一种 DHT/分布式哈希表的算法,被以太坊、Storj 等区块链用于组网)实现信令服务的去中心化。一篇 IEEE 的研究论文则探讨了通过区块链智能合约去提高 WebRTC 的安全性。

区块链能借助WebRtc实现新的突破吗

其次在应用方面,有一种方案提出,在疫情以来远程办公比重日益增加的情况下,出于企业信息安全、合规留痕、工作效率管控等等原因,需要对例如销售、服务等各种发生在公司外部的远程通讯活动进行记录,依靠现有的基础设施提供商的 CDR(Call Detail Record)难以确立单一可信来源、追踪上下文,可以结合区块链与智能合约,对 WebRTC 的通讯记录数据出块,实现单一可信源拷贝、不可篡改以及分布式存储等好处。

很多金融机构的服务,例如开户或者购买理财产品等,需要远程视频见证,也许是区块链 WebRTC 的一个很好的应用场景。

WebRTC的未来与Google的算盘

讲到未来,我们不得不先回顾一下这个技术的历史。

2021 年 1 月 26 日,W3C 正式宣告 1.0 标准(“WebRTC 1.0:Real-Time Communication Between Browser”)。此前 WebRTC 经历了整整 10 年的发展:2011-2014 是这个技术的探索期,大家的主要疑问是:我是否应该尝试这个技术?2015-2019 是这个技术的成长期,随着所有主流浏览器对 WebRTC 的支持,业界的问题变成:我该如何利用这个标准技术?有些什么应用场景?2020 年开始迄今,是这个技术应用的差异化时期。

WebRtc 的标识具有典型的 Google 配色

2020 年的新冠疫情,被认为对 WebRTC 技术产生直接促进性影响。视频会议无处不在,Zoom 变成一个家喻户晓的品牌(在国内市场自然是某些互联网巨头的相应品牌),可以说大众对云端视频会议的认知与接受度得到史无前例的加强。

同样是 W3C 的标准,WebRTC 有没有机会像 HTTP 之于“古典互联网”一样,成为下一代互联网(无论你称它为“实时通讯网络”、“Web3.0”还是“元宇宙”)的基础协议?回答这个问题,得了解一下 WebRTC 背后的真正“操盘手”。

操盘手是 Google – 它不仅推动 WebRTC 成为一个互联网标准,也贡献了大部分的底层开源技术。十年前 Google 干这事的动机是什么呢?大概有这么几个原因:

  • 押注这十年的技术发展,让视频编码技术、视频质量、网络带宽、运算资源都有重大发展,视频成为网上最最重要的应用载体;
  • 很多企业当时的视频会议还是企业内部的、设置使用繁复的、需要专用设备的那种技术。随着云计算的发展,视频会议会不会变成云服务?很有可能;
  • 视频应用需要专门的软件工具(回忆一下十年前五花八门的视频播放器?),Google 不控制计算机操作系统,但是它的 Chrome 浏览器已经开始击败微软和火狐,成为无处不在的存在。把一个视频技术内置于浏览器,给用户带来极大便利,视频内容与网页内容随时交织在一起,打开即看,下载什么视频播放器呢?
  • 最重要一点来了,当年 Google 在视频会议这个领域,毫无优势可言,领先的技术平台提供商并不是 Google。所以,开个源、搅个局,完全没有坏处。

WebRTC 标准与技术,最终赢得了 Firefox、Opera、Apple Safari、Microsoft Edge 以及各种 Chrome 变种浏览器的支持,从这个角度看,是取得巨大的成功。但比较讽刺的是,Google 自己的产品中涉及视频的,似乎都没有太取得商业上的成功。例如视频会议方面,大家甚至都不太想起 Google 也有这方面的产品(而且质量不错),反而 Google 的竞争者们不少都采用 WebRTC 却取得竞争优势。

WebRtc 在各浏览器中的支持程度超过 90%

当 WebRTC 成为公共标准后,Google自己貌似在开始与 WebRTC “脱钩”,开始投资到另一个全新的技术栈:WebTransportWebCodecsWebAssembly。其中 WebTransport 主要基于 QUIC(HTTP/3的传输层协议),带来更低的网络延迟,更适合视频类应用。WebCodecs 内置于浏览器,让其有独立的音视频编码解码能力。WebAssembly,一个已经发展了相当长时间、进入成熟期的开源技术,它不仅让浏览器渲染执行 JavaScript 代码的性能获得“原生”级别的提升,更重要的是它可能支持机器学习方面的结合。

如果 Google 作为 WebRTC 开源技术的主要推手,不再投资到其中,那么 WebRTC 1.0 之后,除了修修补补的小版本,还有持续发展的未来吗?我们基于 WebRTC 打造应用,是否得担心一下?

WebRTC 成为下一代互联网的实时应用基石,估计有点悬,因为确实有潜在的更优解在那里。但是,对于应用开发者,未来几年内,WebRTC可能就是我们的最优解,原因有三:

  1. 不要说 HTTP/3,到了今天互联网的主体还是依赖古老过时的 HTTP/1.1,HTTP/2 还在缓慢的增长中。替换一个积累10年而成熟的标准不容易;
  2. 虽然 Apple 有它的 FaceTime、Zoom(以及国内外的视频服务巨头们)有自己的封闭技术,未必在意 WebRTC,但是对于独立开发者,一个标准的、开放的、互联互通的、工业品质的开源技术,依然是我们最好的选择;
  3. 标准与开源的好处就是,只要有企业能利用它做出杀手级应用、商业成功,就会有人去继续支持维护与创新,接过 Google 的枪。例如会不会有人把 WebRTC 更彻底的去中心化?利用 QUIC 去优化 WebRTC 的低延迟?总是有人会去琢磨。

作为应用开发者,可以做的事情是应用场景的创意发掘与创新,是促进一个标准/技术繁荣有生命力的最佳保证。

杀手级WebRTC应用有哪些?

Alexa,亚马逊的智能音箱 Echo 里的智能助手,采用 WebRTC。

Facebook Messenger、Discord、Amazon Chime、Google Meet/Hangout/Duo,都是基于 WebRTC 的视频通讯工具、视频会议应用。

Clubhouse,2021 年现象级的语音社交工具。

Chrome Remote Desktop,远程桌面工具。对于一般商务人士例如市场、销售等等来说,可能过于技术,难以驾驭。但这种工具为什么没有人深入研究借鉴一下,发展出实时远程销售培训、实时远程机器维修人员培训、实时远程医疗人员培训这样的东西呢?

最后必须特别推荐三个值得关注的 WebRTC 相关公司及其应用场景:

peer5.com

Peer 5,一个基于 WebRTC 的 eCDN(企业内容分发网络),对内容进行网络加速,充分利用到 WebRTC 内置在浏览器中的 P2P 能力。今年8月份被微软收购。这是一个借力新标准、开源技术成就一家创业公司的成功故事。

hopin.com

Hopin,一家英国的独角兽公司,采用 WebRTC 打造“虚拟活动平台”,成立两年成功融资 5 亿 7 千万美元、收购 4 家公司。

stadia.com

Stadia,这是 Google 尝试进军游戏行业的一大尝试,能否成功不去讨论。其有趣的地方是开启 Cloud Gaming 这一领域,也可以称之为“Gaming As A Service”(游戏即服务)或者“On-Demand Gaming”。怎么理解它呢,一直以来我们打 Xbox、任天堂的游戏,都是需要买一个游戏机,打不同的游戏就放进去不同的游戏光盘。 Cloud Gaming,就是你不需要本地的光盘了,游戏在云端运行,然后通过流媒体的方式传输到你的屏幕上,就像你在电视上点播电影一样,但你用游戏手柄可以与“电影”互动。

你怎么看待 WebRtc 在未来的发展?欢迎与我们交流。

,
    推荐阅读
  • 什么人不能吃花胶(什么样的人不适合吃花胶)

    什么样的人不适合吃花胶1、体质偏热、肺功能不好的人不可以食用花胶。因为花胶大补,小孩的身体不适应。

  • 嘲讽技能是什么意思(什么是嘲讽技能的意思)

    嘲讽技能是什么意思嘲讽技能能在短时间内强制对控制方进行普通攻击。不仅可以让敌人不受控制,而且可以让敌人往自己的方向走来并且吸引小兵的仇恨。可以被净化,水银系带,柑橘解除。可以强制对方输出自己吸收伤害保护队友,出了反甲效果很显著,相对来说嘲讽期间虽然没有直接伤害,但是潜在伤害要比眩晕技能更强。非常克制对方AD,即便对方在被嘲讽瞬间逃开一段距离,稍后也会被自动吸引过来。

  • 怎样才能画出漫画中人(画出漫画中人方法)

    与Q版人物的圆润可爱不同,正常人物比较接近现实人物,正常人物的头身比。成熟人物的主要特征是腿部线条比较修长,大腿根部在人物身长的中间位置,或者是稍稍偏上的位置。不同人物的发型和面部随着头身比的变化,人物的面部和发型会呈现不同年龄段的特征。Q版人物最明显的特征就是头部比例很大,因而人物会显得娇小可爱。Q版人物用的头身比为2~45头身。注意大腿根部的位置我们在绘制的日圳吴,要注意人物腰部和大腿根部的位置。

  • 为什么智齿容易发炎 智齿容易发炎吗

    从门牙牙缝开始,由一侧门牙向里数牙齿数目,一般是七颗牙,如果有第八颗,它就是智齿了。有很多的人都遭受过智齿发炎所引起的痛苦。智齿向上生长时若空间不够,则可能横着生长,造成的结果是触碰到周围的一些神经引起疼痛。

  • 怎么选择一双适合自己的运动鞋(你应该如何选择一双合适的运动鞋)

    怎么选择一双适合自己的运动鞋来源:经济日报-中国经济网无论是想参加马拉松比赛训练,还是只为了保持身体健康而进行锻炼,一双合适的运动鞋都十分重要。但是,一双选择错误的运动鞋可能会伤脚,甚至对身体其它部位造成伤害。下面随着经济日报-中国经济网生活频道来了解下应该如何选择一双合适的运动鞋吧。继续穿着过度磨损的鞋进行锻炼也会对身体造成伤害,同时也会增加脚、腿、骨盆和背部受伤的风险。

  • 百分数的计算方法(百分比怎么算)

    百分数是分母为100的特殊分数,其分子可不为整数。百分数表示一个数是另一个数的百分之几,表示一个比值。百分比是一种表达比例、比率或分数数值的方法,如82%代表百分之八十二,或82/100、0.82。百分数只表示两个数的关系,所以百分号后不可以加单位。成和折则表示十分之几,举例如“七成”和“七折”,代表70/100或70%或0.7。而与百分数有密切关联的分数可以作为单独的数量而存在,也可以表达两个数或数量之间的关系。

  • 鱼胶炖什么(鱼胶炖什么吃效果最好)

    鱼胶+糯米,鱼胶15-20克,糯米,枸杞,桔子饼(切丝)适量将所有材料洗净,放入高压锅煮熟,下冰糖调味即可食用功效:美容颜,健脾胃,补血利养气,适合产妇、孕后做月子食用滋补、固元气、康复体质最佳,我来为大家科普一下关于鱼胶炖什么?鱼胶炖什么鱼胶+糯米,鱼胶15-20克,糯米,枸杞,桔子饼(切丝)适量。强化脾胃五脏,提高免疫力。适用于补气血、养容颜,对于气血不足,失于调养,症见神疲体倦,肌肤不泽,面部皱纹者尤佳。

  • skin79bb霜好用吗(最好用的韩国bb霜排名)

    而且痘印、雀斑都能盖住,防晒指数SPF30/PA++,可让隔离、粉底、防晒一步到位,是粉丝们公认的经典。

  • 鸡胸肉蛋白质含量(减脂人的最爱)

    鸡胸肉蛋白质含量根据中国食物成表2016版中记载,每100克鸡胸脯肉中含蛋白质22.4克,脂肪0.2克,碳水化合物2.8克,水分73.6克,能量103大卡。鸡胸肉,是鸡身上最大的两块肉。常见鸡肉,鸡胸肉是在胸部里侧的肉,形状像斗笠,胸脯肉。鸡胸肉蛋白质含量较高,且易被人体吸收入利用,有增强体力,强壮身体的作用,所含对人体生长发育有重要作用的磷脂类,是中国人膳食结构中脂肪和磷脂的重要来源之一。

  • 省考行测判断型题(淮安公务员行测言语题转折文段)

    第三句通过“但”进行转折强调在榴莲的果皮和果肉中有酯类化合物让榴莲咀嚼起来是香的。那第三句是通过但与二句中的臭味进行了对比,所以文段意在说明的是榴莲闻着是臭的但吃起来是香的。在例2所呈现的文段中,作者并未给出他个人对于榴莲味道的判断,而是在转折前后分别描述了榴莲味道臭和香的原因,故而文段的重点是两方面都要概括到的。最后,中公教育希望小伙伴们加油努力,早日实现自己的职业理想。