八年,腾讯优图攒了多厚的技术“家底”?

  • 时间:
  • 浏览:180
  • 来源:世界杯买球盘口网址app

记者 | 夕颜出品 | CSDN(ID:CSDNnews)

「AI 技术生态论」 人物访谈栏目是 CSDN 提倡的百万人学 AI 倡议下的重要组成部门。通过对 AI 生态顶级大咖、创业者、行业 KOL 的访谈,反映其对于行业的思考、未来趋势的判断、技术的实践,以及发展的履历。

本文为 「AI 技术生态论」系列访谈的第二十二期,对话海内一流盘算机实验室——腾讯优图总监黄飞跃,回首优图实验室发展历程,泛论盘算机视觉技术希望和未来生长趋势。

百万人学 AI 你也有份!今日起点击阅读原文报名「2020 AI开发者万人大会」,使用优惠码“AIP211”,即可免费获得价值299元的大会在线直播门票一张。限量100张,先到先得!

12 年前,清华大学博士结业的黄飞跃加入腾讯刚建立不到一年的腾讯研究院,带着 5 小我私家的小组,第一个项目是做一款名为“QQ影像”的桌面处置惩罚软件,但由于团队都属于 IT 直男,对于产物一窍不通,于是首个项目以并不尽如人意的了局了结。

12 年后,当初的 5 人团队已经扩大到 数百人的规模,成为盘算机视觉领域鼎鼎有名的优图实验室。但细算起来,优图正式建立的时间其实在 2012 年,这一年,黄飞跃领导的这支团队更名为“优图”,他作为优图团队的卖力人,领导这帮人成为海内盘算机视觉大规模应用最早的一批从业者。

如今,做盘算机视觉的人不会不认识优图这个名字,尤其是人脸识别技术和产物,优图的名声更是响亮。作为腾讯消费互联网业务背后的“隐形 AI 战队”,优图实验室与 腾讯 AI Lab 和微信 AI 团队一起,并列腾讯 AI 三大人工智能团队,为包罗 QQ、微信、腾讯微视等消费互联网产物提供技术支持。

优图在做什么?

2018 年,腾讯宣布战略转型升级,拥抱工业互联网,优图从腾讯内部的一个技术团队开始走向前台,通过腾讯云等对外输出视觉 AI 能力。

黄飞跃对于优图的定位,就是一个盘算机视觉相关技术的研发和落地的实验室,从最开始的图像压缩,到后面的人脸识别,再往后的人体识别、OCR 等一系列技术,优图从最初的围绕腾讯公司内部的需求提供技术支撑,到现在依托腾讯云等产物对外输生产品息争决方案。

有人会好奇,优图到底都做了些什么。实际上,从腾讯内部到 ToC,优图的AI技术早已渗透到我们的日常生活中,留心视察的话会发现,我们平常用到的微信刷脸支付、人脸识别对比、随申码、康健码、微众银行等 App 的人脸核身等,背后都是优图在做技术支撑。好比在微信小法式申请民政服务,检测人脸时泛起的蓝色、绿色等差别颜色的光谱,其实就是在做活体检测,确认是否是本人操作。

天天P图

黄飞跃表现,最近一两年,短视频、泛娱乐场景的视觉AI需求比力旺盛,为此优图打造了一系列泛娱乐方面的解决方案,包罗美颜美妆、人像支解、趣味合成和生成、人脸融合和变装等,你平常打开的美颜软件,说不定就有优图的存在。

让笔者印象比力深刻的,另有在寻找走失儿童场景中,优图可以实现跨年事人脸识别,一两岁时丢失的婴儿,丢失十几年之后的儿童也能被精准识别,这样的“黑科技”也是优图研发的。

相识盘算机视觉技术的人应该知道,跨年事人脸识别对于数据量和模型训练来说都是庞大的挑战,为了充实的从数据中学习人脸自然的跨年事变化纪律,腾讯优图提出了基于 DDL(漫衍式蒸馏学习规则)学习计谋的正则化迁移学习计谋。基于该计谋,算法模型可充实举行跨年事人脸识别学习,从而让难题的跨年事识别越发可靠和精准。用这项技术,腾讯乐成资助警方找回多名被拐凌驾十年的儿童。

“救人一命胜造七级浮屠”,可以造福、利便人类的事情,正是所有技术人的追求,因为这让我们所做的事情变得有了意义。

优图的技术“家底”有多厚?

种种场景下的应用, 固然离不开底层技术的支撑。从团队建立之初做图片压缩,到厥后转到人脸检测和识别,优图不停洞察新技术趋势,积淀下清晰的技术生长门路。

黄飞跃在清华大学读研读博时,所学专业除了人脸识别和人脸检测之外,还包罗人头 3D 重建、人体行动识别等技术。黄飞跃回忆,那时候人脸识别与现在相比有着庞大的差异,十几年前,火爆的专业是网络工程等偏向,盘算机视觉偏向在其时是冷门。

黄飞跃也认可,其时学术的不成熟导致整个盘算机视觉工业链不完整。现在,我们已经可以通过深度学习技术,为许多盘算机视觉问题找到很好的解决方案,好比人脸检测识别,我们能够从几百人的合照中找到 99% 甚至全部的人脸,有遮挡也可以做到,但在其时,深度学习还没有起来,大家更多的是做偏研究的事情,和实际业务联合较少,收罗数据难度大,算法在实际应用中效果差,只能在特定场景和小规模内做有限的应用。

总之,其时的盘算机视觉研究情况很恶劣,人工智能仍处于生长瓶颈期,体系建设没有展开。2008 年,黄飞跃结业时也曾纠结已往做老师还是进公司,看了许多偏向,选择了加入刚建立不到一年的腾讯研究院,起初是随着 leader,厥后才领导着 5 人小组,在渺茫中开始视觉AI的探索之路。

因图像压缩技术声名大噪

上文中也提到,最开始,这支团队卖力一款名叫“QQ 影像”的桌面处置惩罚软件,这是一款和美图秀秀类似的图像治理编辑软件,既有工程又有黄飞跃学习的视觉图像处置惩罚的一系列的能力,所以他认为这两者的联合是一个时机。但这个项目做到 2011年,PC 端开始向移动端转移,但 QQ 影像是 PC 软件,所以失去优势,加上团队都是技术人员,缺乏产物思维,导致产物生长不尽人意。

QQ 影像

2010 年,黄飞跃和团队迁往上海。2011 年下半年,黄飞跃发现“图片二次压缩”技术可能存在极大的价值,可以广泛应用到腾讯内部的众多业务中,好比图片的存储与传输,可有效淘汰存储、降低带宽流量,为公司节约巨额资金及存储空间。随着研究的深入和技术的不停成熟,黄飞跃带着团队开始为腾讯内部其他团队提供图片二次压缩技术——可以将图片像素压缩 20%-30%,大大降低带宽成本。

此时,团队更名为“优图”——这即是“优图实验室”的前身。

优图的图片压缩技术为腾讯缔造了庞大的价值,也为优图带来了声望。

转移到人脸检测识别偏向

2012 年下半年,优图把研究重心转移到人脸检测识别偏向,开始举行人脸技术研发和储蓄。此时正逢腾讯的组织架构调整,原本隶属于腾讯研究院的优图并到了腾讯社交网络事业群旗下。

2013 上半年,优图开始将人脸检测技术输出至 QQ 空间,同时将技术提供应推出爆款“武媚娘”妆容的“天天P图”前身——“水印相机”团队。2014 年,QQ 空间“面貌墙”全量上线,这是业界最早在大规模社交网络平台中人脸识别技术的应用。此时,黄飞跃领导的优图团队只有 20 人不到。

2014 年上半年开始,黄飞跃领导优图团队开始探寻大量人脸识别应用场景,和腾讯征信卖力人挖掘人脸识此外一个创新应用,即通过自照相和身份证照片比对,来确认是否是用户本人(人脸核身)。在乐成打出微众银行这个线上人脸核身案例后,优图将技术逐渐开放给内部凌驾 50 个业务,并在 QQ、QQ 空间、QQ 音乐、财付通、微众银行、天天 P 图等明星产物中乐成落地,也与滴滴、联通等企业告竣互助。

随着业务的生长壮大,腾讯优图也从最开始的 5 人团队,发展为现在的百人以上的规模。

2018 年 9 月 30 日,腾讯宣布组织架构调整,隶属于 SNG 的优图实验室调整归属于 CSIG 云与智慧工业事业群。优图开始和云与智慧工业形成更密切的联动配合,通过腾讯云、微信等输出视觉AI能力,在金融、零售、政务、社区、物流、文旅等领域落地解决方案。

以上就是优图实验室大致的技术生长门路,在这个历程中,黄飞跃领导团队自主研发了许多创新性的盘算机视觉技术和应用。

人脸识别算法迭代

黄飞跃回忆,自 2012 年下半年将重点转移到人脸识别上来之后,优图便开始积累人脸相关技术。那时,优图会使用一些传统的分类 PCA 等方法做检测识别,从而具备了基础的人脸相关能力,包罗人脸检测、人脸五官定位、人脸识别这三要素。

2014 年以后,优图开始跟进深度学习相关技术潮水和趋势,最开始是用深度学习对齐传统的人脸方法。

黄飞跃认为,实际上人脸技术的演进有这几个点,其一是活体检测,优图做了人脸宁静与身份核验、纹理检测、行动识别,以及自主研发的反光活体技术,即手机侧终端随机发出一系列差别的光,凭据光照射用户的情况,和摄像头捕捉到的信息,判断是真的人脸还是一张照片、面具还是视频。这是人脸宁静系列的技术演进。

其二是人脸识别规模的大幅提升,从开始的几千到几万的规模,现在到从数十亿规模中做人脸检测,背后依靠的是深度学习技术。

第三个特点是要联合实际业务场景,好比在疫情期间的口罩检测,就需要做算法和场景交互的设计调整。

八年发展路,不停积累“雪中送炭”的能力

从腾讯内部一个名不见经传的小组,到发展为一个颇有名气的AI实验室,优图花了八年时间,一路走来也并非一帆风顺,他们面临的挑战不仅来自技术层面,另有如何向公司证明技术的价值。

好比让这支团队声名鹊起的图像压缩技术发现之初,优图团队就面临着如何说服公司内部客户、互助同伴和部门用这项技术的问题,为了与 QQ 空间团队互助,他们要经常跑到深圳,甚至恒久派驻人员相识对方的需求。其时,QQ 空间团队关注的技术点许多,如何让图片显示更清晰,PC 端网页的相册照片如何更好地展示缩略图等,都是他们体贴的问题,优图要做的不仅是要把技术“卖”给他们,还要凭据需求给出详细的解决方案。幸亏团队乐成完成任务,渡过了团队建立之初的第一个大关。

2014 年是优图的一个拐点。在这个时间段,虽然优图与 QQ 空间的互助已经取得了一系列结果,优图研发推出的 QQ 空间面貌墙可以资助用户根据人的维度来治理自己的相册、照片,整体的效果体验,包罗准确度、指标都不错,可是实际上线之后,黄飞跃却开始思考另一个问题:优图团队的价值在那里?因为这个能力始终是锦上添花,并不是雪中送炭,离不开的能力。于是,优图开始挖掘一些刚需、有价值的点。

黄飞跃想到了人脸识别。那时候团队已经开始主打人脸识别相关技术的研发,可是存在一定难题。2014 年下半年与微众银行的互助是一个契机。其时,微众银行开业,给自己的定位就是完全线下无网点银行,没有线下网点,线上开户只能通过人脸核身。但其时人脸核身技术层面上不成熟,这就给了优图难过的机缘,从 2014 年 9 月份开始互助,到 2015 年微众银行正式上线,优图攻坚了一系列难题,包罗提高人脸活体的能力,防止人脸照片、视频攻击等,获得了微众的认可,把真金白银的业务交给优图。

八年走过来,优图的生长门路愈发清晰,聚焦于最焦点的能力,好比人脸识别、人脸检测定位等,制止与其他团队的研发“撞车”;另外一方面,一些团队更多地偏重在优图基础能力之上做封装,如与 PCG 互助力,优图卖力提供人脸检测配准的基础能力,PCG 在此之上研发美颜挂件等,提供美颜能力息争决方案。

盘算机视觉迎来第二次热潮

以优图为代表,是海内互联网企业做盘算机视觉技术研发与应用开发的缩影。在移动互联网时代,盘算机视觉乘着东风,迎来第二次生长的热潮。

黄飞跃认为,移动互联网与盘算机视觉之间是相辅相成的关系,这其中有几个原因,一个是正好深度学习的希望和移动互联网生长的时间重合,移动互联网时代的特点是手机上的摄像头,有了传感器,数据越来越多,UGC 数据量急剧增加,带来大量的需求和时机,因此整个移动互联网的工业链、市场空间远远大于 PC 互联网,因为盘算终端无所不在,摄像头获取数据的设备无限大,市场很大会带来更多生长的时机,相关的企业也将越来越多。

然而,我们应该清楚,盘算机视觉技术现在还处于生长较前期的前阶段,能够解决一些问题,可是更多地是做到识别模式,而不是明白,也就是偏感知层面,最终还需要向认知层面努力,建设起对图的深度明白,但现在从技术层面上来说还没有一个特别好的解决方案,跨越感知和认知之间的鸿沟将是一个艰难的历程。

谈到盘算机视觉未来的生长趋势,黄飞跃表现优图将紧跟行业工业的趋势,现在他比力关注的是 5G,5G 将使流量带宽越来越大,手机终端盘算能力越来越强,多媒体的处置惩罚、短视频也可能泛起更富厚的体现形式。另外,AR/VR、短视频等也将成为盘算机视觉应用较多的场景。