谷歌今天是开放式源语法,一段自然语言理解(NLU)软件,您可以用来自动解析句子,作为其Tensorflow开源机器学习库的一部分。该版本包括用于培训新模型的代码,以及用于解析英语文本的预先训练模型。
解析器,由名称parsey mcparseface,可以自动p out at word是名词或动词或一个形容词,就像你的三级英语老师一样,是世界上最准确的,谷歌说,殴打它自己的技术。它几乎与人类语言学家一样准确。所以这是世界自然语言研究的大量大问题。
但这对谷歌本身来说也很重要。
“我们在内部评估技术的方式实际上非常不同。我们对基准的关心更少,更重要的是,他们如何影响下游系统的性能。我们的目标是提高用户体验,“谷歌研究产品经理Dave Orr本周早些时候在加利福尼亚州山景谷歌总部接受谷歌总部采访时。
以上:来自Google的SyntaxNet的Parsey McParseface解析的句子的示例。如果您认识到这句话,那就是因为它出现在我昨天写的文章中。
图像与Tensorflow本身一样,语法主要在C ++中执行。既然它在谷歌的墙上可用,那么社区以外的人都可以得到改善,可以帮助公司找到新的人才以及带来Google产品的改进。一般来说,语言解析与产品评论相关 - 应用评论,餐厅/美食点评,购物评论 - 以及互联网搜索和谷歌现在正在进行的Android棉花糖的一部分。
“这真的很重要,因为语言有时是微妙的,这并不一定要明白人们所说的话,有些事情是非常背景,”谷歌研究团队领导Tania Bedrax-Weiss告诉VidtureBeat。“当你在谈论崩溃时,它是否是汽车崩溃,或者在一个应用程序中,或者某人只是累,他们说,'我正在崩溃。“崩溃”一词的所有这些上下文含义都非常微妙,需要相当多的理解。我们实际上可以开始培训此数据,并做得非常有趣的事情。“
与更传统的机器学习方法相比,奥尔说,一种称为深度学习的人工智能,已被证明在谷歌的语言理解更有用。该方法通常意味着在许多数据上培训人工神经网络,例如,谷歌搜索 - 然后让它们做出关于新数据的推论。谷歌已经为图像认可和语音识别雇用了深入的学习,现在它在语言理解世界中显而易见。实际上,神经网络是语法的关键,它带来了代号“神经症”。
有关SyntaxNet的更多信息,请在Github上查看库以及相应的Google Research博客文章。