二维码
七七商网logo图片

客服QQ二维码

自然语言理解技术(自然语言理解新突破科学家让AI不止看懂字面意思)

   日期:2022-11-25 23:20:23     浏览:5    

相信目前大家对于自然语言理解技术方面的知识都特别想要了解,那么老赵也是在网络上收集了一些关于自然语言理解新突破科学家让AI不止看懂字面意思方面的知识分享给大家,希望能够帮助您解决问题。

*** 次数:9278347 已用完,请联系开发者***

编译 | 贞逸

他们认为,人工智能系统必须超越对词语字面意思理解的范畴。他们在书中用案例显示了,自然语言理解系统能够帮助人工智能理解世界、向人类解释他们的知识并在探索世界的过程中学习。

《人工智能时代语言学》

例如一个歧义语句的案例:“开刀的是她父亲”。这句话有两种理解方式,她的父亲是医生去操作开刀手术,或者她的父亲是被医生开刀的患者。

有些语句单独看充满了歧义,但人类能够通过语境来解决这些歧义。我们通过说话者的语气、语境和对话的一般逻辑以及生活基本常识的线索来构建上下文。当我们的直觉和知识未能帮助我们理解句子的时候,我们会提出疑问。对我们(人类)来说,确定上下文的过程是很容易的。但是让计算机用程序思维来理解相同的过程并不简单。

科学家提出了两种方式来尝试解决这个问题。

知识库提供了可靠(reliable)和可解释(explainable)的语言分析方法。但后来它们逐渐“失宠”了,因为它们需要太多的人力来设计特征、创建词汇结构(lexical structures)和本体(ontologies),以及开发将所有这些部分结合在一起的软件系统。研究人员认为知识工程(knowledge engineering)的瓶颈是手动工作(manual effort,大量的人工操作且不能穷举所有结果),他们尝试寻求其他方法来进行语言处理(language processing)。

“公众认为任何试图克服这种所谓的知识瓶颈的努力都是徒劳的,这深刻影响了人工智能的发展道路,特别是自然语言处理,使该领域远离了理性主义、基于知识的方法,并促成了经验主义的出现。”McShane和Nirenburg在《人工智能时代的语言学》中写道。

近几十年来,机器学习算法(machine learning algorithms)已经成为神经语言程序学(Neuro-Linguistic Programming,NLP)和自然语言理解(Natural Language Understanding,NLU)的核心。

部分科学家逐渐开始使用第二种方式,利用知识学习系统(knowledge-lean systems)来训练机器学习模型,使人工智能通过统计关系来处理语境问题。在训练过程中,机器学习模型需要处理大量的文本资料,并根据单词与单词相邻位置的方式来调整其参数。在这些模型中,语境是由单词序列之间的统计关系决定的,而不是单词背后的含义。不过,数据集越大,例子越多样化,这些数字参数就越能捕捉到单词彼此之间的各种出现方式(能够记录单词与单词的排列参数)。

知识学习系统之所以得到普及,主要是因为大量的计算资源和大型数据集可以被用来训练机器学习系统。通过维基百科等公共数据库,科学家们已经能够收集庞大的数据集,并针对翻译、文本生成和问答等各种任务,设置机器学习的专项训练。

今天,我们的深度学习模型可以生成文章长度的文本序列,回答科学考试问题,编写软件源代码以及回答基本的客户服务查询。这些领域之所以能取得进展,是因为深度学习架构(LSTMs,Transformers)得到了改进。更重要的是,神经网络研究每年都有新的进展。

但是,虽然更大的深度神经网络可以在特定任务上逐步取得进展,但它们并不能解决“通用自然语言理解(general natural language understanding)”这一更宽泛的问题。这就是为什么各种实验表明,即使是最复杂的语言模型也无法回答有关世界是如何运作的简单问题。

在McShane和Nirenburg的书中,他们把目前人工智能系统解决的问题描述为“唾手可得的水果(low-hanging fruit)”任务。一些科学家认为,继续沿着神经网络的道路前进,最终会解决机器学习正面的语言学问题。但McShane和Nirenburg认为,还有更根本的问题需要解决。

“当前的系统不像人类,它们不知道自己在做什么以及为什么这样做。它们解决问题的方法也不像人类,而且它们不依赖于世界、语言或机构的互动。”他们写道,“相反,它们在很大程度上依赖于将通用机器学习算法应用于越来越大的数据集,并得到现代计算机惊人的速度和存储容量的支持。”

人工智能

身为认知科学家和计算语言学家的McShane表示,机器学习必须克服几个障碍,其中首先是意义的缺失(真正让计算机了解学习的意义,而不是单纯的背答案)。

“统计/机器学习(The statistical/machine learning,S-ML)方法并不试图计算意义(compute meaning)(目前的计算机学习仅能进行数据处理,并不能真正理解数据的含义)。”McShane说。“从业者(部分研究人员)认为单词(在句子中)足够代表它的含义,但事实并非如此。当涉及到完整的上下文意义时,一个句子中的单词(意思)只是冰山一角。对人工智能来说,混淆词语的含义就像把船开向冰山一样令人担忧(人工智能在不能完全正确理解语言指令含义的时候,会导致后续的一系列错误)。”

在大多数情况下,机器学习系统通过缩小任务范围或扩大数据集来回避处理词义的问题。但是,即使一个大型的神经网络能够“创作”一段长文本并保持语义的连贯性,它仍然不能理解它所“写”的词句的含义。

“人们可以搭建一个看起来十分“智能”的系统,但实际上它们(人


特别提示:本信息由相关企业自行提供,真实性未证实,仅供参考。请谨慎采用,风险自负。


0相关评论
相关行情
推荐行情
点击排行

(c)2015-2030 版权©七七商网 77b2b.com版权所有

赣ICP备2021011510号-15