谷歌的深刻人工智能(A.I.)技术已被证明是非常聪明的。DeepMind的AlphaGo系统在今年早些时候击败了全球击败了排名排名的去球员Lee Sedol。以前,它发挥了突破并导航了一种像厄马一样的迷宫。
但现在DeepMind软件看起来更通用。如今,谷歌深度实验室推出了另一个看起来墙壁的壮举,但实际上是谷歌A.I的力量的证据。实验涉及培训一个小虫子来踢足球进球。它特别有意义,因为其他主要技术公司,如亚马逊,苹果,Facebook和微软,也急于提高这一领域的能力。
Deepmind在很大程度上在谷歌的母公司中在字母表中做了自己的东西。但该技术正在实施到真实产品中。
“我们还建立了一种大规模分布的深层RL [钢筋学习]系统,称为Gorila,利用谷歌云平台来加快训练时间按数量级;该系统已应用于谷歌的推荐系统,“谷歌Deepmind的大卫银在今天的博客文章中写道。
强化学习通常涉及试验和错误学习。Google DeepMind将这种方法与深入学习相结合,这意味着在大量数据上培训人工神经网络,并让它们在新数据上进行推断。
在今天的博客文章中,银色描述了一些实验室最近的研究。
“我们还开发了许多深入的RL方法,以便连续控制问题,如机器人操纵和运动,”他写道。“我们的确定性政策梯度算法(DPG)为DQN提供了连续的模拟,利用Q-Network的差异来解决各种连续控制任务。异步RL在这些域中也表现良好,并且在增强分层控制策略时,可以解决挑战性问题,例如蚂蚁足球和54维人形障碍物,没有任何动态的知识。“
银牌写的深度集团将在未来几个月内发出的迷宫软件释放。