全球呼吸机告罄!马斯克线上接单,车企受命转产,跨界行得通吗?

  • 时间:
  • 浏览:3
  • 来源:安图在线

这两天,全球规模最大的语义评测角逐 SemEval 2020 效果出炉,百度基于飞桨平台自研的语义明白框架 ERNIE 一举斩获 5 项世界冠军,席卷视觉媒体的关键文本片段挖掘、多语攻击性语言检测和混淆语种的情感分析。

SemEval 是全球规模规模最大、参赛人数最多的权威语义评测竞赛。其由国际盘算语言学协会(Association for Computational Linguistics, ACL)的 SIGLEX 主办。自 2001 年起,SemEval 已乐成举行十四届,在业界和学术界具有极高影响力。此次 SemEval 将和自然语言处置惩罚领域的顶级集会 COLING 团结举行。

ERNIE 是此次五项世界冠军背后的「趁手利器」。去年,ERNIE先后完成两版重大升级。ERNIE 1.0 提出知识增强的语义表现模型,而 ERNIE 2.0 则构建了连续学习语义明白框架,在中英文 16 个任务上逾越业界最好模型。今后,ERNIE 模型再次革新,以历史上首次逾越 90 大关的结果登顶自然语言处置惩罚领域最权威的 GLUE 评测榜单。本次角逐,ERNIE 再度创新,再立战功,夺得五项世界冠军。

让 AI 更懂「轻重」:视觉媒体的关键文本片段挖掘

该任务由美国休斯顿大学、Adobe 美国研究院团结举行,旨在自动挖掘海报、广告、传单等视觉媒体中文本的关键片段,对其举行重点设计,提升宣传效果。由于人们对于同一文本重要内容的判断纷歧致,在没有唯一尺度的情况下,该任务存在极大的难度。

百度 ERNIE 团队接纳多种技术手段解决这个难题:首先 ERNIE 模型作为语义信息提取模块,对各片段重要性举行建模;然后针对关键片段尺度不统一的问题,设计了更贴近目的的 5 Label 的 Pairwise 损失函数;最后从数据出发结构了多种针对性的语义特征以及数据增强计谋,最终以 5 项指标全部第一的结果获得冠军。

角逐中,主办方 Adobe 希望将赛题的解决方案应用于 Adobe Spark,赋予其海报自动设计能力,以到达更好的宣传效果。如下图所示的「ERNIE」、「轻重」的黑白效果就是自动挑选的效果。百度 ERNIE 团队接纳 ERNIE 让 AI 更懂文字的「轻重」,释放宽大视觉设计者的劳动力,使其能够更专注于对焦点内容的设计。此外,该项技术已应用于百度搜索,能够动态分析出用户查询内容中的重要片段,使其返回更精准的搜索效果,让百度更懂您。

让世界更有 AI:多语攻击性语言检测

该任务由多个国家的研究机构团结举行。其中包罗了英国剑桥大学、美国 IBM 研究院、以及来自德国、丹麦、卡塔尔的多所著名大学和研究院。该任务包罗了三个子任务:

第一个子任务是在对英语、丹麦语、希腊语、阿拉伯语和土耳其语等包罗五种语言的社交媒体举行攻击性检测。百度 ERNIE 团队构建了大规模的多语预训练模型,充实挖掘海量的多语无监视文本,用相同的模型来学习所有语种的语义表现,使模型具备跨语言的明白和分析能力。同时,接纳 Multi-lingual Fine-tuning 的方法,使用其他语言的知识辅助建模,最终以五项语言平均分第一名的结果取得冠军。

另外两个任务是在英语情况中对攻击性语言的类型和目的划分举行越发精致化的分析。百度 ERNIE 团队通过数据蒸馏的技术,从更多无监视的网络文本中学习多种模型的 Soft Label,划分以 F1 凌驾第二名 1.0% 和 4.4% 的绝对优势取得了冠军。

随着网民人数的不停增加,网民态度态度差别、文化水平及道德素质乱七八糟的状况便摆在我们眼前。网络暴力和网络人身攻击现象由此而生。政府、社交网站、搜索引擎、兴趣社区都在鼎力大举研究如何检测出社交媒体攻击性行为,资助人们构建一个越发和谐友爱的网络情况。百度的研究者也希望通过这一技术,能够让世界充满 AI,少一些偏见。

让 AI 更有情感:混淆语种的情感分析

该任务的主办方包罗谷歌研究院、美国休斯敦大学以及印度的多所高校等。在角逐中,主办方搜集了源于社交网络的语料片段,测试参赛者对于相关语料片段的情感分析能力。这些语料中都包罗一种特殊的语言现象:语码混用——即一段语料中同时混有多种语言。主办方致力于探索时下的 AI 技术对于这一类新问题的解决能力。

差别于传统的情感分析,随着互联网上的内容越来越富厚,夹杂着差别语种的内容不停发生。这些内容中可能混淆着中文、英文等多种语言。针对此类文本内容,传统的基于单语语料的情感分类模型已经无法发挥作用。针对此问题,百度的研究者首先使用 ERNIE 举行 Zero-Shot 情感分类。为了充实使用多语种语料的信息,还引入了基于反抗学习的多语种模型,进一步地提升了多语种情感分析的效果。最终在印度语/英语混淆任务上以 F1 值凌驾第二名 1.9% 的绝对优势获得第一。

随着 AI 技术日新月异的生长,已经逐渐的走进千家万户。在解决日常生活需求之余,让 AI 可以更通情达理、更知性,并感知用户的喜怒哀乐、提供贴心的服务,也是一个有温度的 AI 应该告竣的目的。百度始终希望通过 AI 让庞大的世界有更多的贴心。

百度 ERNIE 团队在 SemEval 2020 取得五项世界冠军并非偶然,这得益于团队在语义明白领域的深厚积累。现在,ERNIE 语义明白技术已广泛地应用于百度内外多个产物和技术场景,在百度搜索、小度音箱、信息流推荐等一系列产物应用中发挥了重要作用,大幅提升了产物的技术效果和用户体验,逐步赋能各行各业。

赋予机械「认知」能力,是人工智能中最具挑战的问题。自然语言处置惩罚是认知智能中的重要领域。深入明白语言,让机械具备人类的思考和明白能力意义重大。百度在自然语言处置惩罚领域已有二十年的积累与沉淀,具备了最前沿、最全面、最领先的技术结构,不仅专注于前瞻技术探索,更致力通过技术应用解决实际问题。