这是alphago的历史胜利方式

  • 发布时间:2023-02-01 14:14:17
  • 来源:

2016年3月15日将我们在预期的专家提前10年的人工智能给我们带来了一个里程碑:alphago是由谷歌深度创建的基于AI的计算机,在比赛中击败了世界冠军Go Player Lee Sedol。去是最古老的游戏之一 - 简单的概念,尤其是壮观的师父。五场比赛中的最终得分为4-1,但在alphago拍摄了3-0领先之后,很清楚我们在一个新的时代。Sedol自己在比赛之后说:“我从未想过我会失败。这太令人震惊了。“

这可能听起来很熟悉,让你回到IBM的深蓝色殴打国际象棋冠军卡斯帕洛夫在1997年。但在封面下,AlphaGo与深蓝色不同,因为1997年推出的DVD来自Netflix电影下载。深蓝色的力量来自蛮力计算 - 从字面上评估每个可能的移动的可能结果。播放时,蛮力搜索不是一个选项。即使与国际象棋相比,可能播放的数量太大了。Go Board上大约有10170个剧集。要将这种令人惊讶的号码放入角度,我们的整个宇宙只包含约1080个原子。这就是为什么Go被视为人工智能(AI)研究的圣杯。Go赢得胜利不是评估各种可能的举动,它需要战略 - 根据Sedol本人,Alphago的战略是“优秀的。

但足够的游戏。这里有更广泛的影响。我们可以期待商业应用的类似进展,例如自动驾驶汽车。Demis Hassabis是谷歌的机器学习团队,以前说:“我们使用的方法是通用的;我们的希望是,有一天他们可以扩展到帮助我们解决一些社会的最艰难和最紧迫的问题,从气候建模到复杂的疾病分析。“

这些机器学习方法也对我们在日常工作中的非结构化和复杂的业务流程和决策任务的执行方式产生重大影响。

企业已经使用AI和机器学习,每天提供数百万有价值的建议和观察。众所周知的例子包括亚马逊的产品建议,来自Netflix的电影建议,以及Google的个性化搜索结果。在企业中,示例包括客户定位,领先评分,机会风险分析,销售预测和流失预测。因此,随着AI已经提供日常业务价值和alphago在新闻中的胜利,我们在企业计算中为我们的自然问题是,我们应该在企业中的AI和机器学习中预期什么?

alphago是什么新的?

与以前技术的alphano是什么区别于其学习能力。alphago使用两个互补的深神经网络学习:一个决定哪个动作更有前途(数据科学家说这个“减少了搜索空间的宽度”),另一个了解了一个关于潜在游戏的可能性的“直觉”,将导致胜利(“减少了深度搜索空间“)。这两个网络学习 - 或者我们可以说训练 - 首先通过分析专业人士扮演的许多过去比赛。这被称为“通过示例学习”或“监督学习”。基于该基础,alphago然后通过对自身的游戏来改善 - 数百万游戏在令人眼花缭乱的速度下我们大多数人都无法想象。这种自我游戏被称为“加强学习”。如果你记得1983年电影战争游戏,其中一台电脑“决定”不开始通过闪电速度的不同场景来开始第二次世界大战,只要了解世界毁灭的每种场景都会导致世界毁灭,你就有了这种情况自我游戏。alphago不会喂食获胜模式。相反,它摘要并总结了实际播放的模式。通过这种方式,Alphago真的是关于玩游戏的“智能”。

学习系统可以提供哪些新功能?

不久前,即使是最先进的超级计算机也无法跟上一个四岁的孩子在照片中识别猫。不再。随着AI的快速进步,我们看到了许多任务的突破,考虑了适用于计算机的强大挑战 - 不仅仅是图像中的对象识别,而且自驾电,通过自然语言回答,编写报纸文章,甚至绘画和绘画。

复制动作人类认为只有开始。AI经常考虑人类忽略的选项。例如,在alphago的前三场比赛中,它使“令人惊讶的”移动典型的人类专业人士不会考虑。当时,一些观察者将动作确定为错误。然而,有20个步骤证明了这些令人惊讶的举动是出色的创新策略。我相信去专业人士将研究这些举措,并在这样做,扩大他们认为在未来的人类冠军中的一系列选项。从这个意义上讲,AI是创造性的,帮助人类实现更多。

肯定有局限性?绝对地。

虽然在20世纪50年代开始的AI研究,但真正的学习系统仍在他们的初期。alphago很快就会学到了这一点。alphago只需要五个月的时间,从击败2级专业到击败塞米尔,一个9级冠军。这一进展将采取才华横溢的人。但如果我们比较alphago到那个有才华的人,那条路径都是不同的。Alphago能够在五个月的跨度中播放数百万游戏,其中一个人只能每年玩1000左右的游戏。所以alphanago和ai一般,是在学习方面的数据效率低下。您可能会认为这是一个实际点,因为AI系统能够扮演数百万游戏。但请记住,对于许多外部游戏外的应用,自我游戏并不实用,使学习重要的障碍。因此,它仍然是AI科学家的激烈研究领域。

此外,Go是AI对AI相对简单的任务,因为即使是其令人生畏的选项,它也定义了很好。每个玩家都有关于游戏状态,过去的动作和可用未来移动的完整信息 - 没有不确定性。将其与桥类似的游戏对比,每个玩家都必须猜到关于未知卡的猜测,或者扑克的扑克诈唬的能力增加了新的曲折。对于像Go这样的游戏,每种举动都是确定性的,最终的奖励是明确的,无论是胜利还是损失。在现实世界中,特别是对于企业的许多情况,只有部分信息可用,最终奖励很难量化。

什么是企业的alphago?

正如我在最近的一篇文章,数据科学,自动驾驶应用程序和会话UI的兴起中提到的,“自动驾驶”企业应用程序 - 能够以有用的方式寻求数据,应用智能和现有结果 - 是新的边疆。随着AI的增加,许多企业应用程序将更像是人类助理。他们将检测相关的上下文变化(位置,目标客户,时间),并在最有帮助的那一刻提供相关信息。用户及其应用程序之间的互动将更加自然,更像与可靠的人类助手交谈,而不是持久的无穷无尽的打字和单击。随着AI分析持续运营的结果,例如营销活动,铅交换,销售会议,电子邮件流动,与客户成功团队的互动,或客户流失的互动,价值随着时间的推移而增长。

你可能会发现自己在思考,“当然,如果我有无限的时间才能过度报道,我也可以看到有用的趋势。”当然,就是这一点。AI允许由机器处理繁琐的任务,让人们专注于更适合我们作为人类的任务。这使我们回到了AI系统,如alphago,Excel存在的位置,其中存在“编纂规则”。Go选项可能是如此似乎是无限的,但游戏规则很清楚。即使是10170可能的动作也不包括通过向他们展示您的猫的照片来抛出对手。让机器处理乏味手段意味着人们可以使创造性直觉的跃迁仍然远离AI。

现实世界需要人工智能和人类智慧的互补性。由于问题空间受到限制,AI在计算,记忆,甚至推理中蓬勃发展。人类在感知,决策,破坏性创造力和人际关系中擅长。企业的成功需要如此多的世俗任务:更新数据记录,监测数据库的变化,评估实时导致营销活动,检测到哪些客户可能流失,否则这些都是自动化的候选人,特别是AI的候选人,因为它们需要一个能够学习危重观察和无关的异常之间的差异。因此,人类可以专注于需要人类智能独特火花的任务:创造一个前所未有的广告系列,一对一会赢得客户,或设计下一代AI。 Palintir是一家为美国政府反恐努力和金融业创建分析软件的公司提供了一个精致的例子,建立了他们所谓的“人机共生”。

在离开人类/ AI团队合作主题之前,我们应该承认人员和机器也犯错误。因此,团队的力量不仅仅是为了达到新的高度,而且还可以减少错误。保护机器可以提供从琐碎的琐碎的范围,例如当消息内容意味着附件时发出警告您的电子邮件系统,以救生,如商业喷气式飞机的驾驶舱中的响亮“摊位”警告。没有人在他们的手机上使用语音识别或自动纠正的人则需要提醒计算机犯错误。机器和人类必须共同努力,以提供最佳结果。

令人印象深刻的是,正如alphago胜利的那样,我们在AI系统的发展中是早期的。这意味着我们也很早就了解人员和AI系统加入势力的最佳方式。但正如alphago所做的创新举动,那么将点燃最好的去参与者之间的新思维和创造力,我们很自信,明天的AI将引发那些拥抱其价值的人的新创新。

雷唐是预测和预测分析公司Clari的首席数据科学家。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如有侵权行为,请第一时间联系我们修改或删除,多谢。
  • Copyright ©2014-2021 水缘网v3ujbzcqei@gmail.com All Rights Reserved