肥宅钓鱼网
当前位置: 首页 钓鱼百科

webrtc最全面的指南(你未必知道的WebRTC前世)

时间:2023-08-05 作者: 小编 阅读量: 4 栏目名: 钓鱼百科

你未必知道的WebRTC前世图片来源@视觉中国文丨凡泰极客如果你是一位工程师,想必听过WebRtc,就算没有开发过;如果你是一位互联网用户,大概率使用过WebRTC,虽然可能没有意识到在这个视频为王的时代,我们漫谈一下这个技术的。

图片来源@视觉中国

文丨凡泰极客

如果你是一位工程师,想必听过 WebRtc,就算没有开发过;如果你是一位互联网用户,大概率使用过 WebRTC,虽然可能没有意识到。在这个视频为王的时代,我们漫谈一下这个技术的来龙去脉以及一些有趣的应用。

WebRTC 关卿底事?

文言「底」也表示疑问,是「何」、「什么」的意思。如南唐中主李璟在调侃冯延巳时所写「风乍起,吹皱一池春水,干卿底事?」

如果说 20 世纪人类的书写工具是笔、通讯方式是邮局寄信,那么 21 世纪初人类的书写工具就变成键盘、通讯方式就是电子邮件/短信/即时通信聊天,而从现在开始的可见未来,手机摄像头/VR 设备就是你的书写记录这个世界的工具、实时网络通讯就是你的通讯方式。

视频成了娱乐、学习、商务会议、社交、电商的载体,人们逐渐不再有耐心阅读文字性的信息,现在连购买一件自安装的家具,它都附带二维码,用户只要一扫即打开安装指南的视频,再也不用反复研究纸质说明书里那往往画的非常蹩脚的安装图。

视频不仅是信息的展现方式,它从一部部的 mov、jpeg4、wmv(你硬盘上熟悉而又陌生的文件对不对?)变成一个个的播放器,再变成一个个的 App,然后又从这种单向的“录制 上传 下载  找播放器打开  播放”,变成了“现场录制  边录边播  实时收看”,再变成视频与即时通讯工具、会议工具融合的双向“录制与播放”。

远程视频会议已经成为如今办公的标配

传说中的“实况直播”终于发展到一个“平民化”的阶段。WebRTC,全称 Web Real-Time Communication,就是这么一种基础技术,它促进你用新的“笔”(智能视频设备,例如你的手机)以影像而非文字方式去记录与沟通。

它的奥妙在两部分,自然就是:WebRTC!这不是显而易见的废话吗?还真不是… 但我们先聊一下 RTC,实时网络通讯。

与 RTC 相比,WebRTC 仅仅是针对网页实时通信所建立的标准,其中也只提供了基础的前端功能进行实现。我们并不能简单地将 WebRTC 与 RTC 划等号。

“感觉上很快”就是实时?

WebRTC 强调“实时通讯网络”。网络早已无处不在了,但是否“实时”呢?大部分情况下不是。

首先,当前互联网上最重要最基本的 HTTP 协议并不是为“实时”应用设计的,当你访问一个网站的时候,你发起请求,等候网站的服务器把内容应答送回到你的 PC 或者手机设备,虽然这个应答可以非常快,但本质上是“请求-等候-应答”,这个“等候”,往往是一个不易控制的时间变量。

  • 电子邮件是不是“实时”的呢?显然也不是,虽然相比传统的邮递快了十万八千倍,但是它本质上是“存储-转发”(Store-and-Forward)的机制,是由互联网上很多的邮件服务器以接力的方式,在某个最优网络路径上把电邮从某甲的设备送到某乙的设备,任何中间环节都可能延迟。
  • 聊天工具是不是实时?它相比电子邮件而言,有更加“在线”的会话感 – 一个群里聊天信息来来回回、这边发那边看,好像很“实时”,但它的技术本质依然是“存储-转发”,消息接收方不在线没关系,只要“上线”(打开 App)就能收到,也不需要马上回复。

事实上,对快慢的感觉不能定义实时。网络的低延迟、高带宽固然是实时性的一些保障,但不等同于实时。

用大白话来描述的话,实时视频的目标,是把正在某个地方A发生的人和事,以几乎零延迟、不失真的方式“同步”到另外一个地方 B,让 B 的人瞬间看到、听到,并且反之亦然。人和事都是在不断的变化中,视频需要以“流”的方式源源不断的向远端推送更新,A、B 两地的人虽然隔着十万八千里,但是他们之间的网络能把“视频流”瞬间同步,让彼此感觉近在咫尺,这就是“实时”。

那么现在我们的“实时通讯网络”,距离真正的实时还有多远?

构建元宇宙?无限追求实时

上述问题的简单答案是,有点远。

我们对“实时”的追求是无限的,详细一点的解释,可以借最近热炒的“元宇宙”作为例子。元宇宙,是一个“仿真”或者说“全真”的互联网,它的特点之一,是利用极其强大的实时网络,把物理世界里事物的无限细节信息化并瞬间传播给接收者,使其通过一些特殊设备去复原这些信息并最大程度感受到在原发地事物的原本样子。

这些信息能包括些什么呢?例如有空间感的立体声效(Spatial Audio),让你在一个线上会议室里能听到讲话的人在自己的什么方位,让你在一个虚拟社交沙龙里能听到轻微的背景音乐、左边一群人的闲言碎语、右边吧台上酒保的调酒声;例如能足以让远端设备渲染还原成逼真 3D 效果的人或物的特征数据,大至街景建筑小至毛发与脸部表情,让你在虚拟空间里与其中的物品或人进行互动,像真的一样; 假如有一天我们发明出能收集味道并信息化并在远端通过刺激大脑皮层还原味道的设备,那么这又是一种需要传送的数据。一句话,我们希望把任何物理距离以外的东西,色香味俱全的“同步”到自己的大脑。

如果说我们现在的互联网是 2D 的话(即你只能面对一个屏幕这样的二维平面去交互感知),元宇宙就是下一代 3D 互联网,你“沉浸”在其中,你被实时送达的数据包裹,你的眼耳鼻舌身意“六根”都在里面。不要以为这是科幻,一些技术已经看的到摸得着,简单者如 hubhub,复杂花哨者如 Google 的 Starline。

有兴趣的小伙伴可以去看看 Metaverse Primer

在 Matthew Ball 的“元宇宙入门”( Metaverse Primer)中,提到实时网络是让这一代沉浸式互联网成为可能的8种最核心技术之一。海量数据的极低延迟实时传输能力,目前技术上还是有点遥远。

虽然元宇宙还在“炒作曲线”的不知道哪个点上,可是一些实实在在的商业应用场景确实已经可以基于实时的视频技术进行构建。除了大家熟悉的直播带货、娱乐互动,还有虚拟展会、实时教练培训、远程医疗(Telehealth)等等应用,相信任何线下的场景,只要技术允许,都会有产生线上仿真的一天。

去中心化的通讯方式?

WebRTC 的里的“Web”部分,并非简单无意义的泛指,而是特指 Web Browser(浏览器)。这个标准以及实现它的技术,目前均已内置在各主流浏览器中,理论上让任何用户通过任何 PC、Mac、iPhone、Android 甚至车载系统的浏览器,即可发起彼此之间的直接视频语音通讯。

也就是说,张三和李四,不管人在何方,理论上只要各自有一台设备运行一个支持 HTML5 标准的浏览器,即可以无需经过“中间商”(互联网大平台、电信运营商等等)的通讯服务或渠道而建立这两个浏览器之间的直接连接,实现传说中的“点对点”(Peer-to-Peer)视频通讯和文件分享!如果还有王五、陈六、何七几位呢?欢迎加入,组成一个完全无障碍的、无服务器的、自组织的对等网络,每个人的浏览器都是这个网络的节点,共同进行视频会议、文件分享。

有点像 VR Pro Max 的感觉

无中间商赚差价、无互联网大平台收集通讯各方的隐私数据,个人掌握自己的信息安全,也不依赖任何第三方,是不是忽然有一种自由飞翔的感觉?去中心化、点对点、对等网络,让我们回忆到互联网美好的蛮荒时代 – BT、电驴、迅雷… the good old days…

可惜暂时来说,上述情形只是一种理想,因为互联网的实际环境复杂,例如我们每个人的上网设备实际上都是在某个小区宽带、移动运营商网络、酒店 WiFi、公司局域网等等的后面,互联网实际上是由无数这样大大小小的局部网络通过一系列的网络设备、网络协议进行互联互通的,链路上信息的传递通过不同网络的设备进行层层转发和网络地址/端口的“翻译”转换,最终才到达某个个体设备。

在深圳南山区科技园某公司的员工张某,如何让其浏览器发现并连接北京朝阳区某小区的群众李某的浏览器设备地址,从而建立起点对点直连?没有直接办法。

现有的技术实现方案,依然是中心化的,即张某与李某,不得不通过一个第三方的服务来“发现”彼此的地址,这个环节叫做 Signaling(信令)。

“去中心化”临门一脚,暂时没有现成技术,比较可惜。

区块链WebRTC 有没有的搞?

有一些这方面的研究探索,待有志者进一步深入。

首先是关于技术本身的优化与扩展。例如有人提出利用 Kademlia(一种 DHT/分布式哈希表的算法,被以太坊、Storj 等区块链用于组网)实现信令服务的去中心化。一篇 IEEE 的研究论文则探讨了通过区块链智能合约去提高 WebRTC 的安全性。

区块链能借助WebRtc实现新的突破吗

其次在应用方面,有一种方案提出,在疫情以来远程办公比重日益增加的情况下,出于企业信息安全、合规留痕、工作效率管控等等原因,需要对例如销售、服务等各种发生在公司外部的远程通讯活动进行记录,依靠现有的基础设施提供商的 CDR(Call Detail Record)难以确立单一可信来源、追踪上下文,可以结合区块链与智能合约,对 WebRTC 的通讯记录数据出块,实现单一可信源拷贝、不可篡改以及分布式存储等好处。

很多金融机构的服务,例如开户或者购买理财产品等,需要远程视频见证,也许是区块链 WebRTC 的一个很好的应用场景。

WebRTC的未来与Google的算盘

讲到未来,我们不得不先回顾一下这个技术的历史。

2021 年 1 月 26 日,W3C 正式宣告 1.0 标准(“WebRTC 1.0:Real-Time Communication Between Browser”)。此前 WebRTC 经历了整整 10 年的发展:2011-2014 是这个技术的探索期,大家的主要疑问是:我是否应该尝试这个技术?2015-2019 是这个技术的成长期,随着所有主流浏览器对 WebRTC 的支持,业界的问题变成:我该如何利用这个标准技术?有些什么应用场景?2020 年开始迄今,是这个技术应用的差异化时期。

WebRtc 的标识具有典型的 Google 配色

2020 年的新冠疫情,被认为对 WebRTC 技术产生直接促进性影响。视频会议无处不在,Zoom 变成一个家喻户晓的品牌(在国内市场自然是某些互联网巨头的相应品牌),可以说大众对云端视频会议的认知与接受度得到史无前例的加强。

同样是 W3C 的标准,WebRTC 有没有机会像 HTTP 之于“古典互联网”一样,成为下一代互联网(无论你称它为“实时通讯网络”、“Web3.0”还是“元宇宙”)的基础协议?回答这个问题,得了解一下 WebRTC 背后的真正“操盘手”。

操盘手是 Google – 它不仅推动 WebRTC 成为一个互联网标准,也贡献了大部分的底层开源技术。十年前 Google 干这事的动机是什么呢?大概有这么几个原因:

  • 押注这十年的技术发展,让视频编码技术、视频质量、网络带宽、运算资源都有重大发展,视频成为网上最最重要的应用载体;
  • 很多企业当时的视频会议还是企业内部的、设置使用繁复的、需要专用设备的那种技术。随着云计算的发展,视频会议会不会变成云服务?很有可能;
  • 视频应用需要专门的软件工具(回忆一下十年前五花八门的视频播放器?),Google 不控制计算机操作系统,但是它的 Chrome 浏览器已经开始击败微软和火狐,成为无处不在的存在。把一个视频技术内置于浏览器,给用户带来极大便利,视频内容与网页内容随时交织在一起,打开即看,下载什么视频播放器呢?
  • 最重要一点来了,当年 Google 在视频会议这个领域,毫无优势可言,领先的技术平台提供商并不是 Google。所以,开个源、搅个局,完全没有坏处。

WebRTC 标准与技术,最终赢得了 Firefox、Opera、Apple Safari、Microsoft Edge 以及各种 Chrome 变种浏览器的支持,从这个角度看,是取得巨大的成功。但比较讽刺的是,Google 自己的产品中涉及视频的,似乎都没有太取得商业上的成功。例如视频会议方面,大家甚至都不太想起 Google 也有这方面的产品(而且质量不错),反而 Google 的竞争者们不少都采用 WebRTC 却取得竞争优势。

WebRtc 在各浏览器中的支持程度超过 90%

当 WebRTC 成为公共标准后,Google自己貌似在开始与 WebRTC “脱钩”,开始投资到另一个全新的技术栈:WebTransportWebCodecsWebAssembly。其中 WebTransport 主要基于 QUIC(HTTP/3的传输层协议),带来更低的网络延迟,更适合视频类应用。WebCodecs 内置于浏览器,让其有独立的音视频编码解码能力。WebAssembly,一个已经发展了相当长时间、进入成熟期的开源技术,它不仅让浏览器渲染执行 JavaScript 代码的性能获得“原生”级别的提升,更重要的是它可能支持机器学习方面的结合。

如果 Google 作为 WebRTC 开源技术的主要推手,不再投资到其中,那么 WebRTC 1.0 之后,除了修修补补的小版本,还有持续发展的未来吗?我们基于 WebRTC 打造应用,是否得担心一下?

WebRTC 成为下一代互联网的实时应用基石,估计有点悬,因为确实有潜在的更优解在那里。但是,对于应用开发者,未来几年内,WebRTC可能就是我们的最优解,原因有三:

  1. 不要说 HTTP/3,到了今天互联网的主体还是依赖古老过时的 HTTP/1.1,HTTP/2 还在缓慢的增长中。替换一个积累10年而成熟的标准不容易;
  2. 虽然 Apple 有它的 FaceTime、Zoom(以及国内外的视频服务巨头们)有自己的封闭技术,未必在意 WebRTC,但是对于独立开发者,一个标准的、开放的、互联互通的、工业品质的开源技术,依然是我们最好的选择;
  3. 标准与开源的好处就是,只要有企业能利用它做出杀手级应用、商业成功,就会有人去继续支持维护与创新,接过 Google 的枪。例如会不会有人把 WebRTC 更彻底的去中心化?利用 QUIC 去优化 WebRTC 的低延迟?总是有人会去琢磨。

作为应用开发者,可以做的事情是应用场景的创意发掘与创新,是促进一个标准/技术繁荣有生命力的最佳保证。

杀手级WebRTC应用有哪些?

Alexa,亚马逊的智能音箱 Echo 里的智能助手,采用 WebRTC。

Facebook Messenger、Discord、Amazon Chime、Google Meet/Hangout/Duo,都是基于 WebRTC 的视频通讯工具、视频会议应用。

Clubhouse,2021 年现象级的语音社交工具。

Chrome Remote Desktop,远程桌面工具。对于一般商务人士例如市场、销售等等来说,可能过于技术,难以驾驭。但这种工具为什么没有人深入研究借鉴一下,发展出实时远程销售培训、实时远程机器维修人员培训、实时远程医疗人员培训这样的东西呢?

最后必须特别推荐三个值得关注的 WebRTC 相关公司及其应用场景:

peer5.com

Peer 5,一个基于 WebRTC 的 eCDN(企业内容分发网络),对内容进行网络加速,充分利用到 WebRTC 内置在浏览器中的 P2P 能力。今年8月份被微软收购。这是一个借力新标准、开源技术成就一家创业公司的成功故事。

hopin.com

Hopin,一家英国的独角兽公司,采用 WebRTC 打造“虚拟活动平台”,成立两年成功融资 5 亿 7 千万美元、收购 4 家公司。

stadia.com

Stadia,这是 Google 尝试进军游戏行业的一大尝试,能否成功不去讨论。其有趣的地方是开启 Cloud Gaming 这一领域,也可以称之为“Gaming As A Service”(游戏即服务)或者“On-Demand Gaming”。怎么理解它呢,一直以来我们打 Xbox、任天堂的游戏,都是需要买一个游戏机,打不同的游戏就放进去不同的游戏光盘。 Cloud Gaming,就是你不需要本地的光盘了,游戏在云端运行,然后通过流媒体的方式传输到你的屏幕上,就像你在电视上点播电影一样,但你用游戏手柄可以与“电影”互动。

你怎么看待 WebRtc 在未来的发展?欢迎与我们交流。

,
    推荐阅读
  • 三星堆考古发掘的现实意义(主题征文传好三星堆考古的接力棒)

    目前,活动已收到大量投稿,本网将陆续刊发其中的优秀作品。其实,发掘工作从未停止,只是发掘对象不是祭祀坑,而是在遗址内城墙、宫殿等其他功能区开展聚落考古——这也是我到三星堆遗址以来的一项工作。而2019年开始的这一轮发掘工作,相关的多学科研究迄今已经取得了丰硕的成果。我认为,不只是在三星堆,多学科考古在未来一定会成为重要遗址发掘的“标配”。有许多网友猜测,未来三星堆是否会有文字出土?

  • 暴风眼大结局(暴风眼的大结局剧情是什么)

    宋局和秦厅得知这件事情,决定立即逮捕程雷,可以击毙。即便无法引出杰弗里,保护人民群众的安全也是他们首要使命。程雷已经进入人口密集区,马尚启动了备用计划。程雷被制服,马尚根据通话录音试图寻找蛛丝马迹,这是抓捕杰弗里的唯一机会。杜猛盖着鲜红的五星红旗,被葬入烈士陵园。杜伶抱着骨灰盒,马尚、安静等人身穿警服来送别战友。

  • 都柏林机场介绍(场地规模怎样)

    目前,都柏林机场拥有两座航站楼。现今,1号航站楼为所有短途航班服务。该航站楼主要为主流的航空公司如美国航空、美国达美航空、阿联酋航空、阿提哈德航空、美国联合航空、全美航空和爱尔兰航空服务。都柏林机场主营国内、地区和国际定期的客货运航线,为超过30家的航空公司服务,年客运吞吐量达到约3500万人次。都柏林机场是爱尔兰航空、西捷航空、英国君主航空、瑞安航空、汤姆森航空和爱尔兰阿伦航空的枢纽基地。

  • 小米电饭锅怎么连接(安卓版的手机操作步骤如下)

    进入小米智能家庭App,会提示发现1台米家压力IH电饭煲。进入连接状态,进度条从0%往100%递进,此时,Wi-Fi指示灯从黄灯闪烁变为蓝灯闪烁,表示电饭煲正在同手机连接中。连接成功后,Wi-Fi指示灯呈蓝色常亮状态。智能家庭App中会出现已连接的米家压力IH电饭煲图标。若连接失败,可使用尖物持续按住Wi-Fi复位孔里的按钮5秒使电饭煲重新进入网络待连接状态。若智能家庭App无法自动发现米家压力IH电饭煲,可点击右上角加号进行手动添加。

  • 熊的品种有哪些(盘点熊的品种)

    熊的品种有哪些大棕熊,包括阿拉斯加棕熊、欧洲和亚洲棕熊、北美西部的灰熊。棕熊遍布亚、欧、北美三大洲,棕熊体重站立时有9英尺,体长2.5m现存世界上最大的食肉目动物。棕熊的胃口可以说是好极了,荤的、素的都爱吃。美洲黑熊,是北美洲体型型最小,也是非常普遍的熊。居住在北美森林带和墨西哥。除非受到挑衅,通常不会攻击人类。亚洲黑熊其有攻击性,常会为害牛羊。由於各地猎人大量捕猎,留下的已经不多了。

  • 金士顿内存哪个系列的好(8月份内存品牌大陆排名出炉)

    IT之家9月30日消息根据博板堂的消息,2018年8月份的大陆内存SELLIN出货量出炉,金士顿、威刚、金泰克分列前三。据介绍,2018年8月份内存品牌中国区SELLIN各大品牌的总出货数据,相对7月份环比下滑6%左右。8月份内存价格仍有所下跌,全国渠道需求仍一般,电商出货依然不行,整体出货相对有所下降。

  • 如何提高卵子质量()

    红酒比啤酒更有益某研究机构发现,每天喝一小杯红酒,可以让卵子活跃性可以提高20%。但一定要吃煮豆腐,因为煎豆腐的食用油中含不饱和脂肪酸,会破坏植物蛋白活性,让健康减分。无论长效避孕药还是紧急避孕药,都会打乱体内荷尔蒙水平,从而影响卵子质量。离电脑辐射越远越好研究显示,电脑辐射会影响卵子质量,但完全避免电脑辐射又不可能。

  • 2022南京养老金上调时间+人群(南京养老金2021年最新消息)

    调整人群:2021年12月31日前已按规定办理退休手续并按月领取基本养老金的退休人员,可以享受此次养老金调整。调整时间:养老金调整是从1月1日起执行的,所以,养老金上涨兑现的时候,也会补发从1月1日起上涨的养老金。

  • 2022汕尾英语四六级电子成绩报告单下载入口

    根据中国教育考试网在2022年2月24日发布的2021年下半年全国大学英语四、六级考试成绩发布通知,自本次考试起,将提供电子成绩报告单,考生可于2022年3月22日10:00起,登录中国教育考试网,免费查询下载本次考试的电子成绩报告单(证书),电子成绩报告单(证书)与纸质成绩报告单(证书)同等效力。

  • 电表后面红色数字代表度吗 电表的最后一位红色的数字是什么意思

    电表的数字从右向左,黑色的表示整数刻度,红色是小数刻度。经过科学家的努力,感应式电能表诞生了。由于感应式电能表具有结构简单、操作安全、价廉、耐用、又便于维修和批量生产等一系列优点,所以发展很快。