我的1999东人

第798章图灵测试(第2页)

 

而后者之所以没有迅速发展起来，主要是因为数据获取非常困难。

第一，当时没有机读资料。

第二，很多文学明珠不同版本分散在不同国家，并且其翻译常常不是一一对应。

当然还有很多其它原因就不一一细说了。

但，这个困难在互联网时代被改变了。

它的出现，让研究机构可以轻易获得全球的机读资料。

而且数据量还在随着互联网的发展，每年呈几倍，甚至十几倍的增长。

在庞大的数据支持下，从1994年到2004年的十年里，语音识别的错误率减少了一半。

而机器翻译的准确性提高了一倍。

其中20的贡献来自方法的改进，80来自数据量的提升。

再就是今年2月份，在美国召开的全球机器翻译系统大赛。

鸿蒙和googe通过数据驱动的方法，取得了50以上的BLeu分数。

比著名的南加州大学、iBm沃森实验室等研究机器翻译几十年的顶尖研究机构领先了5。

而提高这五个百分点在过去需要研究510年的时间。

在到英文的翻译中，鸿蒙的得分比第三名领先了17，同样采用数据驱动方法的googe比第二名领先了15，这个差距已经超出了一代人的水平。

而鸿蒙和googe都是成立不超过十年的新公司。

在人工智能研发上的底蕴肯定没有南加州和沃森实验室深厚。

但我们却超过了他们。

原因是我们比他们更优秀吗？

不是。

那么差距是怎么产生的？

很简单。

作为全球最大的两个搜索公司，鸿蒙必应和googe都拥有庞大的搜索数据库。

&t;divtentadv>而且我们每年都在对全球所有的图片、图书、报刊数据化。

这让我们掌握着全球最大的数据库。

南加州大学和iBm沃森实验室虽然人才比我们多，研究基础比我们深厚。

但他在数据量上远远不如必应和googe。

所以，他们落后了。

这次比赛的结果在人工智能领域产生了巨大的影响。

从我们得到的消息来看，全球绝大部分科研机构都放弃了传动的鸟飞派方法，改用了数据驱动的方法。

也就是说，2005年将成为全球人工智能领域的分水岭。

从今年开始，鸟飞派将被彻底抛弃，数据驱动将成为唯一的主流。

我相信，随着数据量的不断累积，人工智能会变得越来越智能化和实用化。

将会对社会的方方面面产生深刻的影响。”

完全进入自己节奏的徐良，已经不需要稿子了。

这一刻，他完全放下了双方的身份。

全然把台下的人当成了听众。

而他们也彻底被徐良言语中的内容吸引了全部的注意力。

“未来的农业，将彻底摆脱华夏几千年来，消耗大量人力物力，精耕细作的农业模式。

取而代之的是智能化农业工厂。

在这个工厂里，安装着大量的射频芯片，收集温度、湿度、土壤肥力等所有数据，汇集到人工智能大脑。

然后由智脑按照需求通过滴灌的方式，根据农作物的需要，注入水分和肥料。