资讯
首页  >  专题  >  环球科学  >  环球科学<前沿资讯>

利用计算方法了解婴儿是如何理解语言的


图片来源:CC0 公共域
词语的含义会因为说话者的发音不同而发生变化。比如日语并不区分“r”和“l”的发音,因此“rock”和“lock”听起来发音是一样的。值得注意的是,婴儿在开始学习说话前就已经适应了母语的发音。例如生活在日语环境下的一岁婴儿会比生活在英语环境下的一岁婴儿更难辨别出“rock”和“lock”的区别。
对于婴儿早期语言学习的现象,最初一个有影响力的科学解释提出婴儿会用一种被称作“分布学习”的统计聚类机制,把发音归为类元音和类辅音两个母语发音种类。
然而,婴儿学习类辅音和类元音的发音分类这一想法最近被一篇发表于《美国科学院院刊》(Proceedings of the National Academy of Sciences)的新研究挑战了。

图片来源:Pixabay
这项研究由多家机构的认知科学家和计算语言学家组成的团队共同完成,研究引入了一个基于大规模模拟婴儿语言学习过程的定向建模框架。这个方法利用具有高计算效率的机器学习技术,将学习机制系统性地和适应母语发音的可检验假设关联起来。
“关于婴儿究竟在学什么的假设在此前激发了研究人员们尝试,他们希望能了解这个神奇现象,”这项研究的主要作者、马里兰大学马里兰高级计算机研究所(UMIACS)的博士后Thomas Schatz说道,“而我们的研究打算从关于婴儿是如何学习的假设开始。”
除了Schatz,这项研究的作者还包括马里兰大学语言学副教授,同时任职于UMIACS的Naomi Feldman;爱丁堡大学信息学院语言、认知与计算研究所的Sharon Goldwater教授;巴黎高等师范学院(ENS)的研究工程师以及初创公司Langinnov和Gazouyi的联合创始人Xuân-Nga Cao;以及在ENS带领一个认知机器学习研究组的Emmanuel Dupoux教授。
在这项研究中,研究人员通过在真实的语言输入上训练一种具有高计算效率的聚类算法来模拟婴儿的语言学习过程。他们从目标语言的自然语言记录中,以固定时间间隔提取的类似声谱的听觉特征,并将这些特征提供给算法。研究中使用的语言是美式英语和日语。

图片来源:CC0公共域
研究人员表示,该算法建出一个关于日本婴儿早期发音知识的候选模型。接着,他们针对经过训练的模型提出了两个问题:“模型是否可以解释学习日语和英语的婴儿辨别说话发音的不同”和“模型是否有学习类似元音和类似辅音的发音分类”。
关于早期的发音学习,占主导地位的科学解释和这些问题的答案应该是可以匹配的(两个答案都是“是”或者都是“否”)。事实情况是,研究人员发现第一个问题的答案是肯定的:模型确实解释了婴儿对发音的辨别情况,特别是说明了日本婴儿区分“rock”和“lock”这两个词非常困难的现象。然而,第二个问题的答案确实是否定的:他们发现模型在学习发音单位时方法太过简单,再加上单词发音在听觉上也不稳定,导致无法去对应类元音和类辅音的发音分类。
这个结果对此前已有的文献提出质疑,同时重新解释早期的发音学习模式。将分辨发音类别的分布学习模式扩展到真实的学习环境是非常困难的。这可能更好地解释了为什么研究人员否定了“婴儿学习的是发音类别”的观点,但赞同“婴儿如何通过纯分布学习(传统的解释)来学习发音”的观点。
Schatz表示,认知科学领域通常不会使用大规模的模型,但是近年来先进的计算能力、庞大的数据集以及机器学习算法,让使用大规模模型的方法变得比以往更可行了。
Schatz和Feldman都在UMIACS的计算机语言学与信息处理实验室(CLIP)工作,Feldman目前担任实验室主任一职。Feldman表示,CLIP实验室和位于巴黎的认知机器学习实验室所拥有的稳定强大的计算资源,对于该研究项目起到了重要作用。
总而言之,研究人员相信,基于计算的建模方法——以及不断努力进行的大规模实验数据采集,包括大规模记录婴儿在家的语言学习环境,以及大规模测试婴儿的语言学习结果——这将会开启研究人员对早期语言学习更深的探索。
翻译:雷兰昕
审校:巢栩嘉
引进来源:University of Maryland
本文来自:中国数字科技馆
特别声明:本文转载仅仅是出于科普传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的“来源”,并自负版权等法律责任;作者如果不希望被转载或其它相关事宜,请与我们接洽。
[责任编辑:环球科学]
分享到:
文章排行榜
©2011-2021 版权所有:中国数字科技馆
未经书面许可任何人不得复制或镜像
京ICP备11000850号-1 京公网安备11010502039775号
信息网络传播视听节目许可证0111611号
国家科技基础条件平台
./t20210304_1043677_taonews.html
Baidu
map