“AlphaGo之父”获最新一届ACM盘算奖

  • 时间:
  • 浏览:201
  • 来源:世界杯买球盘口网址app

克日,2019 年 ACM 盘算奖颁出,由于在盘算机游戏领域取得突破性希望,“AlphaGo 之父”、DeepMind 首席科学家、伦敦大学学院教授 David Silver 获得最新一届的 ACM 盘算奖。

David Silver 是深度学习领域的先驱人物,他在人工智能领域的一系列结果中,又以领导打造了 AlphaGo 最为人所知:David Silver 通过巧妙地联合深度学习、强化学习、蒙特卡洛搜索树和大规模盘算的思想,开发了 AlphaGo 算法,AlphaGo 战胜了顶尖的人类棋手,更是被公为人工智能(AI)研究的一个里程碑。

(泉源:ACM)

凭据 ACM 官方报道,最初,AlphaGo 会经由来自人类专业棋手履历的小规模训练,然后,它会通过强化学习来不停改善性能。AlphaGo 之后, David Silver 和他的团队缔造了更新颖的方法,来实现更高的性能和通用性,AlphaZero 就此降生。与 AlphaGo 差别,AlphaZero 完全通过与自己玩游戏来举行学习,不需要任何人类数据或先验知识(游戏规则除外)。而且,AlphaZero 同时在国际象棋、将棋和围棋游戏中有凌驾人类的体现,证明晰其 AI 算法的通用性。

早在 David Silver 于艾伯塔大学(University of Alberta)攻读博士学位时,他就开始探索开发一种可以掌握围棋智慧的盘算机法式,这也成为了他后续一直在专注的研究兴趣。在 2013 年的 NeurIPS 集会上,Silver 展示了一种算法,它可以在雅达利游戏中展现到达人类水平的技巧。这个法式学会了在游戏历程中仅仅通过视察像素和分数来玩游戏。

2015 年, David Silver 和他的同事公布开创性论文“Human Level Control Through Deep Reinforcement Learning ”,在这个研究中,他们将强化学习与人工神经网络相联合,论文揭晓在 Nature 杂志上,且至今被引用近 1 万次,对该领域发生了庞大影响。随后,Silver 和他的同事继续用新技术革新这些深度强化学习算法,这些算法仍然是机械学习中应用最广泛的工具之一。

2016 年 3 月,团队开发的 AlphaGo 击败世界围棋冠军李世石,这被被誉为 AI 里程碑式的时刻。同年,剖析 AlphaGo 背后技术的论文 “ Mastering the Game of Go with Deep Neural Networks and Tree Search ” 公然公布在Nature杂志上。

AlphaGo 和 AlphaZero 之后,DeepMind 的游戏 AI 探索的另一个重点是征服《星际争霸 II》。就在去年,由 Silver 向导的 DeepMind 团队开发了 AlphaStar,它掌握了多人即时战略游戏《星际争霸 II》,这类游戏被认为是游戏 AI 需要攀缘的岑岭。

现在,在 DeepMind——这家谷歌旗下最星光熠熠的 AI 公司,David Silver 和他的同事仍在寻求将机械学习和神经科学方面的希望举行技术融合,以构立功能强大的通用学习算法。David Silver 在深度强化学习上的诸多事情也已被应用于提高英国电网效率、资助谷歌数据中心降低功耗、为欧洲航天局筹谋太空探测器轨迹等领域。DeepMind 团队还将继续推进这些技术,并为其找到更多的应用场景。

-End-

编辑:黄珊

参考:

https://www.acm.org/media-center/2020/april/acm-prize-2019

https://deepmind.com/research/publications/human-level-control-through-deep-reinforcement-learning

https://www.nature.com/articles/nature16961