不仅给QQ开美颜变声 这个实验室还改变了老大爷的晚年生活科技

2019-02-14    来源:网络    编辑:新闻在线
不仅给QQ开美颜变声 这个实验室还改变了老大爷的晚年生活

1999 年腾讯发布 QQ 时,吴祖榕成为了第一批用户。左小祥那会还在上高中,两年后,他也成为了拥有 QQ 号的“弄潮鹅”。

同一年,刘杉在美国读博士,那时,让她畅想二十年后的生活未免有点太早。

2005年,腾讯 QQ 的同时在线人数首次突破了 1000 万,仅用了四年时间就达到了 100 倍的增长。在QQ 飞速发展的这一年,吴加入了腾讯,负责QQ客户端的开发工作。四年后,左也加入了腾讯。

那会儿,腾讯虽然有名,却也没有那么有名,至少刘杉在美国还没听过这个企业。

三条线在 2017 年汇成一点,这个“点”就是腾讯音视频实验室。

建团队做标准

2016 年 11月,腾讯音视频技术中心升级为腾讯音视频实验室。

吴祖榕一开始在 QQ 团队负责 QQ 客户端的开发工作,后来带团队,成为 QQ 客户端团队的技术总监。2015年,他负责商业化部门的研发团队管理工作。到了2017年6月,吴轮值到了音视频实验室。

吴到了实验室后,觉得视频标准很重要,腾讯音视频实验室也应参与打造音视频技术标准,所以,腾讯音视频实验室开始全球范围内寻找视频标准的领军人物。

他们把目光投向了曾在多家国际知名企业负责多媒体技术研发的专家刘杉。

刘杉在美二十年,多次担任音视频国际标准组织的主席,她是 200 多个美国和全球专利申请的发明人,其中许多发明已被授权并成为标准基本专利或被内置于多款通信和多媒体产品中。她还是已定稿国际标准Rec. ITU-T H.265 v4 | ISO/IEC 23008-2:2017和正在制定的下一代国际标准VVC的联席主编。

用一句话概括就是,刘杉在全球音视频领域耕耘已久,经验丰富,成绩斐然。

当腾讯向刘杉发出邀请时,她是迟疑的。

2017 年,腾讯在全球 500 强公司中排名第 478 位,相较于刘的几个老东家——半导体全球顶尖 IC 设计公司联发科、娱乐商业巨头索尼和排名第 83 位的华为,好像是这么个意思。

再者,相较于高通、三星、爱立信、诺基亚、LG、华为、联发科等公司在音视频领域的研究积累,腾讯可以说是真的晚起步了,刘杉迟疑也情有可原。

但腾讯对于音视频实验室是有长久规划的。

腾讯音视频实验室是腾讯 SNG 布局 AI 的“三驾马车”之一,腾讯的高级执行副总裁汤道生掌管这里。刘杉一路谈到汤道生,汤对刘说:“第一年没什么要求,只要先把团队组建起来就可以了,但腾讯的目标是出海和国际化,音视频领域一定要做成国际标准。”

要把“孩子”一把拉扯大,腾讯对“孩子”期望还挺高,刘杉觉得,这事可以搞。

2017 年 11 月,刘杉加入腾讯音视频实验室的第一个任务是把视频标准团队组建起来,代表腾讯去标准会上提交提案。短短两个月时间内,新人腾讯挤在一群老牌标准团队里,向 MPEG 122 会议提交了十个高质量的提案。

2018 年 7 月卢布尔雅纳的标准会议上,腾讯音视频实验室的多项技术被 VVC 标准采纳。在 2018 年 10 月澳门的标准会议上,在多项技术提案被 VVC 标准采纳之余,王者荣耀视频片段被纳入 VVC标准制定测试集,确保腾讯重要应用场景将受益于新一代视频压缩标准。

腾讯音视频实验室还在这一年内聚集了其他标准领域的大牛。汤道生原本以为在一年时间里,音视频实验室顶多把路修到“二环”,没想到一下到了“五环”。

一直担任自适应比特率流媒体技术 DASH 工业论坛主席和董事长的伊拉齐·索达加于 2018 年年底加入腾讯音视频实验室,担任首席研究员。在加入腾讯之前,他曾在微软与各种研究和产品小组合作,参与多媒体技术的发展和标准化方面的研究和落地, 也曾负责 Windows 的多媒体交付策略、产品对齐和标准化项目。同时,他也是首个基于 HTTP 的自适应比特率串流解决方案 MPEG CMAF 小组的联合主席。

Vidyo公司知识产权与标准的副总裁斯蒂芬·温格于 2018 年年初加入腾讯音视频实验室,担任知识产权与标准的高级总监。在加入腾讯之前,他曾参与新多媒体技术的标准化组织,尤其是 IETF、ITU-T 和 MPEG。

紧跟国外标准,国内标准建立上也要有一席之地。

音视频编码标准(AVS)是我国具备自主知识产权的第二代信源编码标准,腾讯音视频实验室的 TPG格式已被 AVS2 标准接收,并在参与 AVS3 的标准制定。

至此,你可能发现了腾讯音视频实验室的打法:针对特定标准领域招募大牛,点对点突破。

从与QQ共舞到业务变迁

技术骨干左小祥则经历了腾讯音视频实验室的几个重要节点。左从 2010 年开始负责 PC QQ 基础能力开发,2015 年以后,负责手机 QQ、macQQ 音视频基础功能的开发。

吴祖榕和左小祥告诉雷锋网,在主要服务QQ 的业务上,腾讯音视频实验室构建了新一代SPEAR音视频通信引擎AVC,承载亿级 QQ 用户通信,集成音视频通信SDK,构建丰富的一对一、一对多、多对多的实时音视频通话场景。为了满足越来越年轻化的用户需求,音视频中心提出了低码率下实时视频的美颜功能,将美颜从图片处理提升到视频处理的全新应用场景,还推出了语音变声功能。

移动化浪潮来临时,音视频技术也面临着如何在移动网络下解决各种声音的采集播放问题。最大的挑战是,人是移动的,这代表着网络是波动的,在网络波动的过程中怎么保证低延迟、高清晰,变得比原来更有挑战。

网络层面要求工程师们做更多网络抖动、丢包的测试,算法还得自适应不同网络。到底当前链路上可用带宽有多少?延迟是多少?在实时音视频领域,解决这些问题的一个通用方案是,建立一套模型,估算结果反馈给编码器,告诉应用层策略发送多少冗余信息或者在何时做更多重传。

其中,最核心的技术在于对带宽的估计,如何更准确、实时地发现当前带宽发生的波动,到底是有人跟你抢,还是使用者自身在移动?腾讯音视频实验室花了很多时间打造云端控制的流控。

另一个挑战是,设备更加多样性,人们的使用场景不再是笔记本电脑以及一个摄像头、麦克风。每个安卓厂商、手机厂商采集的播放延迟都不一样,需要做大量适配,多了很多工作量。

移动化解决完后,视频应用面临了爆发,包括点播业和直播业,许多竞争对手涌了进来。

“直播对带宽要求很高,主播跟观众互动的实时性也要很好。友商把我们的客户教育成了音视频专家。有一个客户在南美,他会很直接地告诉我们,现在房间秒开、AGC声音增量或噪声回声消除剪切得不够好,会用非常专业的音视频指标跟你讲,整个行业在被竞争对手推着往前走。”吴祖榕说。

吴祖榕之前碰到一个客户,他的 APP 里同时用了腾讯和其友商的音视频 SDK,今天用腾讯的 SDK 看用户的反馈是多少,明天用友商的 SDK 看用户反馈是多少,直接从用户的反馈数量判断谁的质量好。

吴不怕比较:“在服务产品过程中,大家也会不断定一些关键指标、核心指标,然后找原因,找问题。找完原因、问题解决完之后,我们验证稳定了也会立刻反馈到 To B 服务的SDK质量中,是一个蛮正向的循环。”

云时代下,改变未来

2018 年 9 月 30 日,腾讯正式宣布启动新一轮整体战略升级,并对架构进行大调整,汤道生成了主管腾讯云与智慧产业事业群 CSIG 的老板,腾讯音视频实验室归了 CSIG ,由刘杉和吴祖榕担任实验室联合负责人。

雷锋网了解到,因为 QQ 在国内市场比较饱和,除了平稳支撑 QQ 的业务,腾讯音视频实验室承担了为腾讯云的出海提供服务的重任,并投入更多人力在腾讯云还有 to B 业务上。

1
3