搜索
写经验 领红包

孩子们存储15兆字节的信息来掌握他们的母语信息(1m存储多少汉字)

导语:孩子们存储1.5兆字节的信息来掌握他们的母语

孩子们存储1.5兆字节的信息来掌握他们的母语

学习母语似乎并不费力。一分钟前,我们还在咿呀学语。接下来我们在学校背诵小马丁·路德·金的《我有一个梦想》演讲或罗伯特·弗罗斯特的《火与冰》。但是加州大学伯克利分校的一项新研究表明,出生到18岁之间的语言习得是认知能力的非凡成就,而不是人类与生俱来的。

研究人员计算出,从婴儿期到成年早期,学习者吸收大约1250万比特的语言信息——大约每分钟2比特——来完全掌握语言知识。研究发现,如果转换成二进制代码,这些数据将填满1.5 MB的软盘。这一发现,挑战了人类语言习得毫不费力、机器人掌握语言也很容易的假设。

加州大学伯克利分校教授史蒂文·潘塔多西说:“我们的研究是第一个对语言习得量进行量化的研究。”“它突出表明,儿童和青少年是出色的学习者,每天吸收超过1000比特的信息。”例如,当看到“火鸡”这个词时,一个年轻的学习者通常会问“火鸡是鸟吗?”是的,或没有?火鸡会飞吗?是还是不是?”等等,直到完全理解“火鸡”这个词的意思。位,或二进制数字,是计算中一个基本的数据单位,计算机存储信息和计算只用0和1。该研究使用了8位到1字节的标准定义。“当你想到一个孩子必须记住数百万个0和1(在语言中),这说明他们一定有非常令人印象深刻的学习机制。”

他们通过计算模型运行各种关于语言语义和语法的计算,得出了他们的结果。值得注意的是,这项研究发现,语言知识主要集中在单词的意义上,而不是语言的语法。“很多关于语言学习的研究都集中在语法上,比如词序,”Piantadosi说。“但我们的研究表明,语法只代表了语言学习的一小部分,而主要的困难在于学习这么多单词的意思。”把重点放在语义与语法上,将人类与机器人区分开来,包括语音控制的数字助手,如Alexa、Siri和谷歌Assistant。“这确实凸显了机器学习者和人类学习者之间的差异,”Piantadosi说。“机器知道单词组合在一起,以及它们在句子中的位置,但对单词的含义知之甚少。”

关于双语者是否必须存储两倍的信息,Piantadosi说,这在单词意义的情况下是不可能的,因为许多单词的意思在不同的语言中是共享的。他说:“像‘mother’这样的普通名词在不同的语言中含义是相似的,所以你不需要把所有关于它们含义的信息都学两次。”

本文内容由快快网络小凡整理编辑!