百度吴甜:从基础设施到应用、生态、人才造就,AI新基建的基本功

  • 时间:
  • 浏览:210
  • 来源:世界杯买球盘口网址app

文 | 特约视察员 吴甜(百度团体副总裁、深度学习技术及应用国家工程实验室副主任、黄埔学院院长)

编辑 | 文华 李文礼

焦点提示:

1. AI基础设施是构建于云平台基础上,以算力平台和数据平台支撑形成的AI技术开发平台、能力平台、场景技术方案综合的、具备AI宁静保障能力的大型技术系统和工程系统。

2. 在基础设施之上,要不停在应用场景当中发挥应用价值,以此形成正向的循环,能够促进基础平台进一步生长,促进整个AI系统进一步进化。

3. 在AI工业化历程当中,因为其历程链条长、决议庞大,需要社会全方位多方整协力量举行积木式创新,因此共生共赢的生态系统就应运而生了。

4. 重视人才造就,加鼎力大举度造就既懂应用场景,又懂AI技术的复合型新型人才,通过构建相应的教育、培训体系以及职业体系保障,多方位造就AI技术及应用人才。

编者按:本文由4月7日超级沙龙「新基建」系列第三期直播整理而来,有删减。完整直播可戳此回看。

最近这段时间,随着加速新基建的要求提出,新基建的建设现在已经是很是重要的话题了。所以我今天带来的是关于人工智能新型基础设施建设的明白。后面我简称为AI新基建。新型基础设施建设虽然简称“新基建”,但它其实是以5G、人工智能、工业互联网、物联网等为代表的新型基础设施。

本质上来说,它是信息数字化的基础设施。

AI基础设施

首先,我来先容作为AI新基建中最基础,而且也是最重要的硬核部门,AI技术平台及以AI技术平台为焦点构建的一套基础设施。

算力框架与平台先容

我今天以百度的事情为例来先容。

AI技术涵盖的子领域很是广,整个的AI技术系统自己开放性很强,它和应用场景也有很是多的联合,和应用精密相关,而且会随着应用的生长,连续地举行自身进化,所以它并不是一成稳定的,而是一个不停演进演化的系统。

图一

百度大脑是百度AI技术的集大成者,可以看图一简朴地回溯一下百度大脑的生长历程。特别看2018年的时候,百度大脑焦点技术进入到“多模态深度与明白”的阶段。所谓多模态就是综合语音、视觉、文本的明白能力,而且是深度多条理的语义明白。而AI能力在这个阶段也已经开始了多维度、多条理的开放状态。2019年,百度大脑进一步升级为软硬一体AI大生产平台。在这段时间里,百度大脑也进入到了AI的能力和应用场景融合创新的阶段,和各行各业的场景广泛联合成为了AI时代的大生产平台。

图二

AI大生产平台,是一个什么样的平台?这个名字听上去可能会以为有一些黑盒,如果我们打开黑盒去看,整个组成部门最基础的是算力和数据平台。在整个生产平台上,深度学习平台是底座基础。通过深度学习平台,开发者可以去开发自己的AI应用。这里也会提供应大家通用的AI能力,好比语音的、视觉的、自然语言、处置惩罚知识图谱等一系列的AI能力的挪用。

再联合加入景当中,是有大量的应场景需要举行定制训练的需求,所以也开放了定制训练平台。最终整个平台上所积累的能力需要能够和业务系统举行部署和集成,所以也提供了部署与集成的工具宁静台,在此基础上也形成技术解决方案。整个的平台大生产平台自己由AI宁静保驾护航,因为在AI的整个应用历程当中,宁静也是重要的话题。

接下来我们从整个平台的底层向上,逐层来看一看,现在的这些内容的寄义以及希望。

最底层是AI基础架构,这是整个大生产平台的盘算底层。随着AI算法能力提升,它对算力的要求是越来越高的。有这些盘算力的基础资源才有可能对大数据举行盘算,最后发生AI的算法模型。

图三

面临即将到来的AI+5G时代,未来盘算将会无处不在。它会从云扩展到端、边缘等等,在我们身边时刻都能举行种种各样的盘算。在百度大脑上,全新的AI盘算架构,通过芯片层、互联层、系统层以及调理层,举行协同设计和技术创新,最终可以提供百万TOPS量级的强大的盘算力(见图三)。与此同时芯片之间、系统之间,另有设备之间都能够相互毗连,将差别场景中的盘算毗连在一起,从而发生一个综合的更强大的盘算能力。

图四

百度在使用经典的芯片基础上,也有在自研芯片。我先容两款自研芯片,一个是云端通用AI处置惩罚器,百度昆仑,这是一款云上的处置惩罚器。在这款芯片上,我们针对语音、自然语言处置惩罚,另有图像举行了专门优化,优化之后,性能可以越发提升。同时百度昆仑和飞桨等深度学习平台的框架举行了很是好的深度适配,使得编程灵活度更高,能够灵活地支持训练和预测。总体来说,在同等性能下使用昆仑可以在成本上降低10倍。

图五

另有一款是在端上的百度鸿鹄,这是一款专用于远场语音交互的芯片。在100毫瓦功耗情况下,鸿鹄芯片可以支持远场语音交互焦点的阵列信号处置惩罚和语音叫醒能力,这些能力会用在哪呢?主要在车载语音交互、智能家居等场景,会带来低功耗、高性能的盘算能力,也能够给这些场景带来更大的想象空间。

同时鸿鹄芯片在流片的同时就已经实现了量产,现在已经在百度的相应产物当中去使用了

在算力层向上,向下毗连芯片,向上毗连了应用场景的就是深度学习框架及平台。在AI时代能够资助开发者便捷、快速完成深度学习技术的研发,这是深度学习平台的使命,深度学习平台是智能时代的操作系统。在飞桨工业级深度学习开源开放平台上,我们已经构建起了整个全方位、全功效的平台。

图六

图六是飞桨的全景图,它在焦点框架层能够支持开发者举行开发、训练、预测等全流程的研发事情,在飞桨上还公布了百度自己以及百度的行业同伴一起打磨过的工业级的一系列模型,笼罩到了像自然语言处置惩罚、视觉推荐、语音等等,这些主流的AI算法偏向上的官方模型库。

在真实场景中应用的时候,往往还需要有端到端的配套的开发套件,以让场景的整个开发历程越发便捷、便利,而且能够去复用以前已经做好的种种各样的积累。现在飞桨在语义明白、目的检测、图像支解,以及点击率预估这四大场景上都有配套的套件,可以很是便捷地使用。

飞桨平台也提供了相应的工具组件,在平台层使用的时候也提供了服务平台。这样的平台在开发的历程当中提供了便捷的框架,在训练历程当中提供了超大规模深度学习模型训练技术,在部署上也是针对多端、多平台、全面部署高性能推理引擎,同时另有工业级的开源模型库,这些都已经综合提供出来,可以供工业使用。

AI算法偏向的最新希望 语音识别

语音识别应该是AI算法中生长历史比力悠久,现在的可用性、可用水平已经很是高的一项技术。固然它还连续地有技术上的突破。

图七

百度上线了首个基于流式注意力的语音识别线上服务,这也是在国际上首次实现了在线语音识别大规模使用注意力模型。技术使用之后,语音输入法可以到达相瞄准确率50%的提升,在音箱这类产物中,准确率甚至提升到了20%。同时随着端侧的智能设备的广泛使用,在离线的语音识别上,无网状态以及弱网状态现在也有越来越多的需求。百度的语音技术团队,通过系统性的优化,也解决了语言模型裁剪性能损失问题,使得离线模型现在也已经具备了很是高的识别率。

语音合成

图八

我们知道,在语音合成的时候,如果合成出来的声音,比力偏重于机械感,缺少情感,那么听的时间太长就会很是疲惫。所以音色模拟、情感模拟等等方面,都市是语音合成当中需要突破的挑战。百度推出的语音合成技术,用20句话就可以制作专属的语音,定制语音,将声音当中的音色、气势派头、情感等要素映射到差别的子空间,在使用的时候,差别要素可以举行任意组合。

在百度舆图上已经推出了全球首个舆图语音定制功效,大家也可以试一试,只需要录制20句话就可以做成一个小我私家专属的语音包。

视觉明白

图九

百度这些年在OCR物体检测、视频明白、目的跟踪等业界领先的图像与视频技术也多次在海内外顶级赛事中取得了佳绩,而且这些技术也已经在机械制造、金融、医疗、教育等领域获得了很是广泛的使用。

虚拟形象

图十

虚拟形象合成方面,当我们已经对大量的语音、视觉以及文本的明白能力到达了一个很是高的水平之后,AI算法也在实验推进去做虚拟形象的合成,尽可能形成越发自然,越发像人,越发具有富厚情感的虚拟形象。

百度合成虚拟形象技术其实联合了多模态的识别和明白,好比语音的识别、视频的明白,另有面部的、肢体的、嘴型的生成能力,以及语音合成TTS的技术,从而实现了业界首个可以举行量产视频的真人形象的虚拟主播,这也在多个场景当中应用。

好比央视和百度互助打造过AI虚拟主持人小玲,她在央视去年的五四晚会上亮过相;汹涌新闻也和百度一起打造了第一个真人形象的虚拟主播,用在了早晚新闻栏目上;浦发银行和百度互助打造了业内首个金融数字人,它有情感,有专业的银行知识,能够提升银行的客服体验。

基于知识图谱的语义明白

语音视觉等技术在人工智能技术当中属于感知层技术,类比人的这种感知能力。人另有很是强的认知能力,认知能力主要体现在自然语言处置惩罚、知识图谱等语言和知识类的技术上。百度构建了超大规模、多元异构知识图谱,包罗有实体图谱、事件图谱、行业图谱、关注点图谱、POI图谱等等,这些图谱都市凭据需求场景的需要不停地扩充和延展。

图十一

我举一个例子,基于知识图谱的视频与明白,用感知层能力去举行视频的明白的时候,可以通过视觉明白去提取视频当中从视觉视角上看到的特征;语音识别还可以对视频当中人物的一些对话、言论等举行语音上的识别和提取特征;对视频的标题以及周边文本也可以举行文本明白。在这些基础明白之后,我们还可以再去联合知识图谱当中的视频明白子图,在知识图谱当中举行盘算和推理,可以对刚刚发生的明白的标签、明白的特征举行补全、关联等等一系列操作。最终用在产物上,会对整个视频的内容有更深度的明白。这是一个用感知技术和认知技术联合,举行多模态融合的一个很是典型的例子。

那我们再看看对人的语言的明白。如果AI技术能够举行完全充实地明白人的语言的话,这将是迈向通用人工智能的很是重要的技术的突破。固然在这一方面,也是连续不停地有新的突破。

图十二

百度推出的ERNIE是连续学习的语义明白框架,在这个框架下,可以举行知识增强的语义明白。我来解释一下它的寄义是什么?好比说我们想让AI算法明白实体,我们会用百科的内容、网页的内容去举行实体识别任务的结构,然后由预训练模型举行学习,再对场景举行针对性的fine-tuning。这样就可以获得实体识此外更强的明白能力的模型。再庞大一点的任务,好比构建因果关系这样的识别任务,也可以通过技术的方式结构大量的因果知识,然后由大的预训练模型举行学习,再举行任务上的调优学习。

那么整个这样的历程已经将自然语言明白的能力带进了一个新的状态。百度的ERNIE模型已经学习了有13亿以上的知识,也是在NLP任务上全面刷新了任务的效果。现在已经在共计16其中英文章任务上逾越了Bert、XLNet,取得了SOTA效果。我们可以看到图十二里展示出来的就是在不停地加以新的知识让ERNIE模型举行学习的历程中,推动自然语言推断、自动问答、文底细似度和情感分析等任务上有连续不停的效果提升。

AI宁静

图十三

百度大脑也打造了完整的AI宁静体系,从基础的开源技术矩阵到开放行业解决方案,到与学术界、企业、政府、机构等多层面的开放协作,整个的技术产物已经笼罩到了云管端以及大数据和算法层面的一系列宁静风险问题。这样的宁静体系,也是为AI技术的工业应用有一个保驾护航的作用,可以推动AI时代的宁静生态的建设,让大家在使用AI的技术去开展种种各样应用创新的时候,没有宁静的后顾之忧。

以上是作为AI新基建当中最基础的技术平台现在的状态。

AI应用价值

整个新基建也不仅仅是技术平台,另有 AI应用价值的缔造。百度的AI技术应用在互联网产物当中已经有大量的实践,好比AI赋能的智能搜索、信息流推荐、新一代人工智能舆图等,以及AI为焦点能力的智能家居小度系列的产物,另有自动驾驶阿波罗等等。在百度已有的产物上,AI带来了很是多的价值。另一方面AI技术其实也已经体现在面向各行各业的应用价值了。我今天想重点分享一下AI+云赋能工业厘革与创新。

我们先看看这样的一个历程。

图十四

适才在先容深度学习平台时候,也有类似于历程的先容。首先我们需要先去面临大量的数据生产和数据应用。所以在百度云上我们有推出数据工厂。在数据工厂当中,通过数据的众包、加工、标注等一系列的事情举行数据的处置惩罚,也联合百度提供的数据集以及整理的第三方行业数据资源,形成基本的数据集。在应用当中,通过数据的治理、数据评测的平台等,使得整个数据能够形成一个闭环效应,完整的闭环数据会充实资助算法到达最佳的效果。

数据生产之后会进入到模型工厂,在AI技术平台支撑下,可以融合算力、数据算法,联合场景发生模型,最终应用到业务系统当中。整个历程和适才所先容的AI技术平台上的整个历程是很是一致的。

AI技术的场景应用案例

图十五

智能工业巡检,巡检这样的场景是现在为止看到的,对AI技术可以很是快速植入应用并带来价值的场景。

经常有讨论说:AI是不是会大量替代人类的事情,造成人类的失业。实际上在我们现实的生活当中,有很是多的事情耗时耗力,而且需要长年累月的履历积累,而且可能另有一定的危险性。这些事情既需要熟练工又有危险性,好比像高压线上的巡检等一系列事情。现在新一代的年轻人愿意投入到这类事情中的人在变少。那么AI应用于智能工业巡检,在针对场景界说的问题上,一般来说现在能看到的就是应用图像的分类、支解、检测等方法,能够快速准确识别。图十五中,这几个例子有宁静帽的佩带检测,尤其是矿井里的宁静帽佩带检测,它可能会解放我们人类的许多事情,另有烟火的警报、仪器表的读数识别等等方面。

这方面在应用AI算法之后,相当于训练成为有履历的巡检师傅,可以大幅淘汰人工投入,也降低了人工学习的成本。

图十六

智能质检。在一线的质检工厂里头,工人天天要举行长时间的事情,尤其是这种细密零件质检,零件很是小,而且需要在强光下举行。长时间的在强光下看微小的瑕疵,也容易造成工人们眼睛的疲劳。我们看到这样的一个例子,这家工厂需要天天对出厂的2000多万个产物,举行所有的检测事情,天天都是凌驾10小时的高负荷事情,要检查多达1万多个零件。基本上每分钟每个工人需要检测19个,还需要对每个零件从多个差别的角度、差别的缺陷举行分类。我们提供了一个AI赋能的外貌缺陷视觉检测设备,它通过百度的AI技术和语音技术,自动对物体外貌的缺陷举行巨细、位置、形状的检测,并根据品质分门别类地分好。

它总体上可以资助节约90%的人员成本。整个设备自己相比起原来的事情桌这样的设备来说,可以将占地面积淘汰80%,漏检率也是大幅降低。

图十七

固然适才这两个都是以感知层视觉技术为主的。其实感知层技术加上认知层技术,也可以在智能媒体上发挥作用,通过热点发现、智能写作、智能勘误、以及智能公布整个的全流程,助力新闻的生产历程。

AI在抗疫中的应用案例

我今天其实还带来了几个在疫情期间,在整个的抗疫历程当中,对疫情的筛查、治理带来资助的解决方案。

图十八

首先是AI测温,AI测温是一套可以非接触、举行远距离多人测温的设备。现在也已经在数百个场所部署,资助全国各地完成了700万人次的初筛事情。

整个AI测温的历程分为几个方面,首先在行人途经的时候,通过红外的热像仪捕捉到温度,通过检测摄像头来不停监测,对远距离的戴口罩的人脸举行检测。这套方案现在也在百度企业内部署,形成企业入场方案。测温之后还可以举行人脸的识别、智能监控,而且如果同企业的报备系统买通,可以自动识别是否切合复工入场的要求。这里所接纳的AI技术,就是人脸检测跟踪算法,可以实现精准的人脸定位。纵然是戴上口罩,现在也可以把身份识别出来。

已往的两个月,大家应该也都感受到了,社区事情者在整个的抗疫治理历程当中,需要做许多一线的机械的事情。百度推出的基于智能对话技术的外呼系统可以资助举行人员的随访,对人举行批量的外呼。人工智能语音随访可以通过自动的外呼系统,触到达人群,和他们举行交流和信息的收罗,还可以举行防控的相关提醒。这些信息可以立刻形成结构化数据分析陈诉,为后续的一系列决议或治理举行支撑性的资助。

整个外呼系统所接纳的技术包罗有语音技术、自然语言处置惩罚技术以及知识图谱等等。

图十九

我们知道在医护人员最忙碌的时候,照顾护士信息的数据收罗、挂号、录入等也是医护人员天天很是重要的事情。百度和相关的同伴一起打造了语音床照顾护士数据收罗系统,通过这样的设备举行语音录入就可以了。

医护人员不用摘掉手套,不用摘掉口罩,不用脱下防护服,就可以轻松对着设备举行语音录入,很快就可以输入大量的照顾护士信息。这个历程当中,新冠肺炎相应的真实临床数据,有很是多的医疗专用词汇,专业医疗符号,我们的语音系统也可以快速举行定制训练。在医护语音录入场景中,可以到达语音识别准确率92%以上。在烟台市感染病医院多个科室已经举行了部署使用。

图二十

另外,病毒分析和疫苗研发也是抗疫事情中的很是重要的一个事情。在2019年百度曾提出了LinearFold算法,这个算法可以将病毒的全基因组RNA二级结构分析的时间从55分钟缩短到27秒,大幅地提升了 RNA二级结构分析的速度。现在也是在和许多的机构在举行互助,希望AI算法能够助力医学科技。

图二十一

最后我还想分享的一个是飞桨和连心医疗开源了肺炎CT影像分析模型,这个模型的开源,能够提升在CT影像肺炎筛查当中的医护人员的事情效率。这个模型自己,对病灶的检测精度可以到达92%,召回率97%,湘南学院隶属医院现在已经在应用当中了。这些都是AI技术和场景联合之后所带来的一系列的价值。

这些技术在不停地发生应用价值,而这些应用价值恰恰是新基建很是重要的。

AI生态系统

在与宽大的行业同伴举行互助的历程当中,我们也看到了对于大量的企业来说,业务创新和应用落地历程当中,其实也存在着一系列的挑战。

图二十二

好比说研发方面,AI技术的应用门槛其实挺高的,开发周期往往是不太可控的。有履历的技术人员可以让开发周期缩短,但有如果是比力缺乏履历的研发团队,它有可能会经由比力长的时间才气够验证,获得最佳的效果。在许多的企业举行了AI加持的产物息争决方案的研发之后,市场营销,以及相应的整个历程,也是需要有大量资金投入的。我们也希望这些AI技术能够更便利地被宽大的企业所使用。

所以百度大脑开放平台其实构建了多条理开放的能力。

最基础有飞桨深度学习平台,面向场景有定制开发的平台以及开放的能力,和最后的部署集成一整套历程。现在在百度大脑开放平台上,已经开放了248项能力,整个百度大脑的日挪用量凌驾万亿。在百度大脑开放平台和飞桨平台上举行开发的开发者,凌驾了180万,公布的模型也已经有10多万以上,这些模型都在大量场景当中在使用。

我们可以看到这样的AI生态系统其实也在形成,AI工业化落地的整个链条比力庞大,角色也许多。在整个生态系统当中,我们能看到从硬件供应商到技术平台,到软件供应到应用开发,到最后的终端场景,是一个多层的完整的生态系统。那么这样的一套生态系统,现在已经形成了,而且在我们的基础设施上不停地发挥着作用。适才我所先容的大量的应用场景当中,所落地的应用和方案也有很是多都是在百度大脑的生态系统中研发落地的。

AI人才造就

除了技术平台、终端场景以及生态角色,贯串始终的另有一个很是重要的就是人工智能、工业智能化相应所需要的人才。在AI人才当中,基础的理论人才、算法人才等等都很重要。但在整个应用落地历程当中,这类人才会越发重要,他们就是既懂应用场景,又懂AI技术的复合型人才。这些人才在大的技术平台型公司里一般都市有,但想让AI技术和工业去广泛的联合时,我们会发现这类复合型人才会需要各个终端场景以及生态当中的生态企业,去不停造就和积累起来相应的人才。

技术界限和业务明白自己之间是存在鸿沟的,怎么样能够弥补鸿沟?就是需要这些复合型人才来做到这样的一点。所以百度也有推出一系列对于AI人才、应用型人才的造就计划。

我今天先容其中的一个项目,这个项目叫做首席AI架构师造就计划。怎么界说首席AI架构师,我们认为在企业当中懂自己的业务场景,懂应用当中的挑战与难题,又懂AI技术和算法,同时能够去落地实施的综合性人才是企业当中的首席AI架构师。对于需要把AI技术应用起来,举行智能化转型的企业来说,这一类架构师是很是重要的。我们推出了黄埔学院这样的一个项目,在这个项目当中学员会与深度学习技术专家举行面临面的深度交流;会有深度学习、技术落地的关键认知的传承;以及会去和学员们一起剖析场景需求与AI技术联合的典型案例。最后综合AI思维、工具、方法和技术解决方案,解决实际的场景问题,在实际的场景当中能够发生应用价值。

最后举行一个小结。新型的基础设施建设,不但单是有业务平台就可以实现的,它其实是一个全方位的事情。就似乎我们在建设高铁,高铁的硬件设施就像今天在建设的AI基础设施,AI基础设施就是构建在云平台基础上,以算力平台和数据平台支撑形成的AI技术开发平台、能力平台。而场景技术方案综合的,以及AI宁静保障的,是夯实有力的大型技术系统和工程系统。

在这样的基础之上,要不停地发生应用场景当中的应用价值,需要AI加持连续创新,在应用中发挥充实的价值,以此形成正向的循环,它也会促进基础平台进一步生长,促进整个AI系统进一步进化。但在AI的工业化历程中,因为它的历程链条长,角色庞大,也需要社会全方位地多方整协力量举行积木式社会的创新。因此共生共赢的生态系统也就应运而生了。

最后在基础设施、应用、生态三者形成的闭环当中,我们还需要去重视人才的造就,促成应用越发繁荣,需要加鼎力大举度造就既懂应用场景又懂AI技术的复合型新型人才,也需要构建相应的教育培训职业体系,多方位造就AI技术及应用人才,这也是AI加速工业智能化的重要组成部门。以上就是我对AI新基建的明白,也是基于AI建设新基建,生长工业智能化所需要思量的几个重要的偏向。

相关阅读:

AI下半场,最基础的是缔造价值,而不是算法或产物 | 超级沙龙

“超级看法”栏目现提倡“特约视察员入驻”计划,邀请各赛道的创业者、大公司业务线带头人等一线的商业践行者,在这里分享你的创业体悟、干货、方法论,你的行业洞察、趋势判断,期待能听到来自最前沿的你的声音。

接待与我们联系,微信:cuiyandong66;邮箱:guanchayuan@36kr.com。