AI开源的硬核战场:领军者百度如何亮剑?

  • 时间:
  • 浏览:164
  • 来源:世界杯买球盘口网址app

AI 开源的黄金时代已来,百度的开源理想要实现了吗?

《西部世界》中的 AI 机械人引发了人们对于 AI 技术的惊骇——因为它描绘出了一个机械人拥有意识和意志的世界。埃隆·马斯克不止一次在公然场所重申了他对超级 AI 潜在崛起的担忧。他说:“请记着我的话,AI 比核武器危险得多。”

核武器没有开源,而 AI 开源的战场却硝烟弥漫。

近几年来,全球科技巨头不约而同地在做同一件事:将旗下的 AI 项目开源,与全世界的开发者共享。对这些 AI 科技巨头而言,为什么要开源其最先进的技术呢?

今天我们来聊聊 AI 与开源的故事。

1

AI 开源是科技公司的价值手刺

AI 的火热,得益于大批乐成的开源深度学习框架的不停涌现。

2015 年,谷歌推出深度学习框架 TensorFlow,它是在 DistBelief 的基础上研发的第二代人工智能学习系统,现在已生长为最受接待的深度学习框架之一,被广泛地应用于语音识别或图像识别等多项机械学习和深度学习等领域。

在谷歌开源 TensorFlow 一年以后,百度宣布开源其深度学习平台飞桨(英文名 PaddlePaddle)。飞桨生长到现在,已经具备了开发便捷的焦点框架、支持超大规模深度学习模型训练、多端多平台部署的高性能推理引擎和工业级开源模型库等领先技术。飞桨是中国首个也是现在海内唯一开源开放、功效完备的工业级深度学习平台,正是因为它的泛起,百度成为继 Facebook、谷歌和 IBM 之后世界上又一个开源深度学习框架的科技公司。

从传统看法来看,开源深度学习框架的决议很奇怪。许多科技公司对于自己的产物、技术一直是保密的,焦点算法更是秘而不宣。为什么要开源深度学习框架?

首先看市场需求。AI 具有较高的技术门槛,对于多数中小企业难以恒久自主研发。而在工业互联网的浪潮下,谁能率先拥抱 AI ,谁就能在未来生长的不确定性中赢得更多主动权。所以借助成熟的、开源的深度学习框架是许多公司的首选。

其次,对于开源的公司而言,这是一次绝佳的展示时机。将深度学习框架开源,嵌入到其他公司的产物中去,以便更好地扩大巨头的领域。以 TensorFlow 为例,当一个用户在使用它的数据库时,能越发顺畅地毗连谷歌的云服务。也就是说,在使用这个免费的工具时,用户会很自然地被引导到需要付费的服务。

这就是为什么处于技术前沿的公司要公然自己的重要技术,这既是对人工智能领域的资源争夺,也是提升自己在行业内话语权的绝佳时机。

2

飞桨开源,诚意更大

开源是一张王牌,可以让企业走近价值链的中心。

IDC 公布的 2019 年下半年《深度学习框架宁静台市场份额》陈诉显示,在深度学习平台市场,谷歌、Facebook、百度三强鼎立态势稳固,已占据靠近 80% 的市场份额,其中百度的市场份额在已往半年里增长迅猛,占比提升 5.98 个百分点。AWS、微软等外洋平台的份额下滑显着。

能在猛烈的市场竞争中保持稳步增长,与百度多年来深耕 AI 关系密切。百度的血液里有两个词很是关键:一个是搜索,2010 年以前百度靠搜索技术打下山河;另一个就是 AI,从 2010 年以后,AI 成为百度最鲜明的竞争力。

在 AI 领域,百度做了两件很是牛的事,一是开源了深度学习平台飞桨,它是中国首个、也是当前海内唯一开源开放的深度学习平台;另一件是开源了自动驾驶平台 Apollo。前者让百度在外洋巨头垄断的深度学习平台的市场份额里硬是撕出了一道口子;后者则奠基了百度在全球自动驾驶生态里的焦点职位。

百度其实一直走在深度学习研究和应用的前沿,对于深度学习而言,百度在一开始就掌握住了机缘。早在 2012 年百度就将深度学习 DNN 模型乐成应用到语音识别、OCR 等任务中。随后在 2013 年,百度建立了深度学习研究院(IDL)。自此,百度全面进入深度学习阶段,在深度学习的框架开发、平台建设以及应用创新方面都走在行业前列,在企业内的应用具有很高的实用性、很大的规模化特色。

百度为什么要开源深度学习平台飞桨?

对于深度学习框架的价值,百度首席技术官(CTO)王海峰曾经如此表现:“在智能时代,深度学习框架起到了承上启下的作用,下接芯片,上承种种业务模型、行业应用。”

海内绝大多数企业,基本是依赖外洋框架,并不掌握最焦点的技术。他们通常是基于 TensorFlow、PyTorch 之类的外洋框架和模型举行训练,然后再举行部署,加上边缘的工具等,就可以直接使用(例如 XDL,其后台实际上就是 TensorFlow)。因此,虽然海内有一些企业声称自己有深度学习框架,但很少有企业敢于将深度学习框架开源。

百度为什么敢?

一位亲历百度开源的工程师曾感伤道:“到现在为止,我仍然坚定的认为,百度是中国最适合做技术的公司。”百度飞桨的开发,是一行一行的代码敲出来的,具有完全自主知识产权。独立研发一个深度学习平台,需要深厚的深度学习专业功底、极强的软件开发履历和大量的时间,和独立写出一个操作系统的难度相差无几,而百度将飞桨百万行代码整体开源,足可见其对技术的自信和对开源的诚意。停止现在,全球规模内做得比力乐成的深度学习框架,也只有谷歌、Facebook 和百度。

固然,TensorFlow 和飞桨也有很大的差别。

飞桨的焦点框架接纳基于编程逻辑的组网范式,对于普通开发者而言更容易上手,切合他们的开发习惯。同时,飞桨支持声明式和下令式编程,兼具开发的灵活性和高性能,网络结构自动设计,模型效果逾越人类专家。

飞桨突破了超大规模深度学习模型训练技术,实现了世界上首个支持千亿特征、万亿参数、数百节点的开源大规模训练平台。据相识,TensorFlow 只支持千亿级规模的模型参数训练,是飞桨的十分之一。

飞桨不仅兼容其他开源框架训练的模型,还可以轻松地部署到差别架构的平台设备上。同时,飞桨的推理速度也是全面领先的。好比,在质检线上,一个零件停留的时间可能只有数十毫秒,因此,速度快就有更大的优势。飞桨适配的国产硬件(华为、寒武纪等)更多,同样都是跑在华为麒麟芯片上,飞桨的速度会比 TensorFlow 更快。在与北京大恒图像视觉有限公司的互助中,使用百度飞桨支解库 PaddleSeg,可在收集数据后快速地完成模型训练和部署,联合传统算法对隔膜生产中的缺陷举行实时的检测和分类。

PaddleSeg 集成了富厚的数据增广方法和最新的网络模型,使用利便、功效强大。训练出来的模型有良好的泛化能力,能检测出差别工艺和差别亮度的图像的缺陷 20 余种,分类精度到达 0.98,预测速度 0.12ms/img,支解模型 iou0.82。安装调试时间也缩短到 2 周,质检设备的通用及易用性都获得了较大的提高。

百度飞桨已累计服务了 150 多万开发者,这一数字约占中国软件平均从业人数的 1/4。此外,其定制化训练平台上企业用户凌驾 6.5 万,公布了 16.9 万个模型,2019 年第二季度百度飞桨深度学习平台开发者下载量环比增加 45%。

虽然当下飞桨的生态规模和外洋框架想比另有一些差距。但对于海内的开发者而言,深度学习平台飞桨的开源,提供了一个跟国际潮水技术比肩的选择。

3

Apollo 在自动驾驶生态的特别职位

百度除了开源深度学习平台飞桨之外,在应用层面还开源了自动驾驶平台 Apollo。

百度自动驾驶研发项目启动于 2013 年,早年技术焦点是“百度汽车大脑”,包罗高精度舆图、定位、感知、智能决议与控制四大模块;2014 年,正式启动“百度无人驾驶汽车”研发计划,一年后,建立自动驾驶事业部建立,大规模投入研发。

2017 年 7 月,百度 Apollo 公布 1.0 版本并正式对外开源,历时两年零五个月后,Apollo 5.5 版本公布,重点即是开放了“点到点都会自动驾驶”能力,以及面向量产落地自动驾驶场景的解决方案。

与以往版本比,Apollo 5.5 增加了三项新能力,划分是:

语义舆图深度学习方法。该方法是将高精舆图加上交通规则、车辆信息等语义,然后生成图片,用深度学习的 CNN 网络举行学习,从而应用于包罗感知、预测在内的多个模块中。

Apollo 还对计划算法举行了更新。通过灵活的换道计谋、智能的路权处置惩罚以及优化的速度决议几个方面的提升,提高问题的可求解性。

Apollo 5.5 引入最新的、基于非线性速度计划的数学表述,在优化器和优化器求解上做了大量的革新,保证在有限时间内也可以求出最优解。

在 CVPR(全球盘算机视觉及模式识别领域顶级学术集会)2019 集会期间,百度 Apollo 公然了海内唯一的自动驾驶纯视觉都会门路闭环解决方案——百度 Apollo Lite。据悉,这是一套自动驾驶纯视觉都会门路闭环解决方案,能够支持对 10 路摄像头、200 帧 / 秒数据量的并行处置惩罚,单视觉链路最高丢帧率能够控制在 5‰ 以下,实现全方位 360° 实时情况感知,前向障碍物的稳定检测视距到达 240 米。

前不久,知名投资咨询公司广证恒生公布了《自动驾驶专题研究之企业评估指标体系——立体分析企业焦点竞争力》,对海内外数家自动驾驶公司举行排名分析,百度以 3.6 分的综合评分位居世界第一,谷歌旗下的自动驾驶企业 Waymo 以 0.2 分之差紧随其后。

Apollo 平台是百度自动驾驶的技术基石。自公布至今,Apollo 平台共举行了 8 次迭代,划分是 1.0、1.5、2.0、2.5、3.0、3.5、5.0、5.5。以最新的 Apollo 5.5 为例,不仅在开放数据的基础上新增了资助自动驾驶车辆快速学习交通规则,明白路面情况的语义舆图深度学习方法,还为开发者开放了一个“技术库”,提供传感器标定和深度学习模型训练的服务,进一步提升开发效率。

停止现在,百度 L4 级别自动驾驶都会门路测试里程已经突破 300 万公里,已经在 23 个都会举行测试,智能汽车专利 1237 项,位列全国第一。

百度测试车队行驶在长沙的街道上

在保定,百度智能交通信控系统资助保定交通延误时间淘汰 20%~30%。而在长沙“两个 100 公里”项目建设中,百度 Apollo 到场 135 公里车路协同门路革新。据悉,该项目建成后可直接支持进一步开展 Robotaxi 业务,从而加速推进自动驾驶规模化、商业化的落地历程。

此外,百度与重庆告竣战略互助,围绕自动驾驶、智能都会、智能政务、区块链等多层面告竣互助。2019 年 9 月 12 日,百度 Apollo 来到“渤海之滨”狮城,与沧州市人民政府正式签署战略互助框架协议,双方将自动驾驶、智能交通、电子政务等多个方面展开全面互助,配合打造“智能沧州”。

除了 Apollo 自动驾驶平台,百度还在车联网和车路协同领域不停推出新产物。据相识,2019 年,百度 Apollo 在全球 97 个国家拥有 3.6 万名开发者,是 2018 年的 2.4 倍。Apollo 现在共拥有 177 位生态互助同伴,拥有 56 万行开源代码。Apollo 自动驾驶平台已成为全球最强大、最开放、最活跃的自动驾驶平台。

百度在 AI 和开源上的投入,有目共睹。

4

将 AI 开源举行到底

据相识,谷歌开源 TensorFlow 的想法最初是由是其首席架构师 Jeff Dean 提出的,他认为通例的科学生长缓慢,阻碍了公司的创新。开源 TensorFlow 能够加速研究人员与科学界的实时协作。谷歌之外的人才也能改善源代码,通过更广泛地分享机械学习技术,还能为该领域造就越发专业的人才。

“我们决议开源后,代码运行更快了,可以做更多的事情,也越发便捷。”TensorFlow 团队卖力人 Rajat Monga 说。

百度 CTO 王海峰也曾在多个场所提出开源开放对人工智能时代的重要价值。他认为,一方面,人工智能技术的生长和突破需要所有人齐心协力、配合推动,因此开源、开放就尤为重要;另一方面,人工智能技术会赋能各行各业,开源、开放让各行各业可以便捷地使用人工智能,让社会各界都受益。

在百度,许多人对开源文化颇有感慨。一位百度开源卖力人曾在一篇文章中写道,他所在的工程效率部门, 2017 年至今都在整体组织和推进百度开源的事情,包罗引入开源、内部开源和对外开源。而他也看到,在开源世界内里,中国公司和中国人不再仅仅是以索取者的身份泛起,领先企业华为、阿里巴巴、百度、腾讯等在开源界的声音也越来越大,投入和实际孝敬也越来越多。对开源的玩法越来越熟悉,玩得也越来越溜,在遵守社区规则、明白社区精神的前提下,逐步走上了前台和中心。“这是很是令人欣喜的变化。”

除了以上提到的飞桨和 Apollo 的开源,百度另有许多很是有代表性的开源项目,好比 2019 年春晚红包中扛住超大用户压力、数次流量波峰的转发引擎——百度的统一七层流量转发平台 BFE、中国首个开源的边缘盘算框架 BAETYL 等等。

此外,除了将重磅技术开源外,各大巨头也通过收购的方式加紧自己的开源生态建设。2018 年 10 月,微软以 75 亿美元的价钱收购 GitHub,这个举措被认为是微软拥抱开源与结构企业市场的关键;2019 年 7 月,IBM 宣布以 340 亿美元的价钱收购红帽(Red Hat),红帽将成为 IBM 混淆云部门的一部门。海内对开源生态也体现出前所未有的重视。腾讯收购 Codig.net,推出腾讯云开发者平台;阿里巴巴收购 Teambition,支持开发者团队相同协作。

2019 年 12 月 6 日,开源中国获得百度最新战略投资。百度除了把飞桨入驻到 Gitee 之外,其他百度系优秀的开源产物也将陆续入驻。

开源生态之争,寸土寸金。云 + AI 的行业配景之下,对于开发者生态的重视,让开源事业迎来了春天。开源社区和代码托管平台是科技公司与开发者建设联系的关键点,自然成为了必争之地。“一流企业定尺度,二流企业做品牌,三流企业做产物”,想要在未来竞争的商业市场里占据话语权,就需要加速产物的研发和迭代速度,让产物被更多人喜欢和使用,并努力地到场开源组织和尺度的制定。

5

写在最后

当下,越来越多的企业开始意识到开源的重要性,中国的互联网企业也需要像百度一样,给开发者足够信任的时间和空间去做开源项目、维护开源项目,究竟在开发者数量占绝对优势的配景下,我们需要让世界看到中国的开源气力。

百度笃信于此,并时刻做好“领路人”的准备。

彩蛋环节:

对于开源,你有哪些看法,接待在评论区讨论,点赞最多的评论我们会送出一台小度在家智能屏。停止到 1 月 13 日。

点个在看少个 bug