斯坦福大学语言学教授孙朝奋:研究语言是要了解人

字体大小:

人工智能语言模型ChatGPT,声称能够“解读”与回应人类语言的程式。对此,美国斯坦福大学语言学教授孙朝奋担心,将来没有真正“理解”人类语言能力的机器人。

研究语言到底是为了什么?理解它?规范它?还是要破解它?

对美国斯坦福大学语言学教授孙朝奋而言,语言学有不同的研究,包括理论语言学、应用语言学、历史语言学、社会语言学、心理语言学等,但是“最终极的研究目标可能还是为了了解人,人的认知系统。”

孙朝奋受2023年“陈六使中华语言文化教授基金”邀请担任访问教授,即将主讲两场公开演讲。借此机会,记者电邮采访孙朝奋教授,请他分享个人治学之路,以及对语言发展的看法。

如今翻译软件的技术已相当成熟,最近最受关注的人工智能语言模型ChatGPT,更声称能够“解读”与回应人类语言的程式,使用者惊讶于它的“理解能力”,甚至担心它会为学生代笔写作业,或制造伪学术文章欺骗读者。

对于人工智能,孙朝奋说:“我不太知道怎么样才算是破解语言。几年前我曾问过一位计算机系的教授,得知中文机器自动分词的准确率已经达到93%左右,在某种意义上来说,这是很了不起的成就。但是,我又一想,这不就是差不多每行(以20字为一行计)都可能有一个或更多的错吗?!行行都有错,这算不算是‘破解了’汉语?每行一个错是不是太多了一点?所以,我不太清楚人工智能是不是已经帮助人类完全打破了语言之间的隔阂了。

“目前新出了ChatGPT,机器依靠大数据自动生成语言,毋庸置疑,取得了惊人的进步。但是我还是在想,这算是机器‘理解了’人类语言吗?能够自动分词(听得懂和看得懂)和生成句子(能写),甚至能自动编(提升准确率),作为一个语言生成系统的确已经非常了不起了!可我怎么觉得好像机器其实并不‘知道’自己在做什么,输出的大多不是经过程序编码预设的句式,就是从数据库搜索出来的现成的句子或片段,当然还有自动把数据库中的语言点建立新联系的编码能力。可我可能还是比较保守,甚至有点杞人忧天,有点恐怖感,担心将来没有真正‘理解’人类语言能力的机器人,作为一个‘冷血’的机器人,不知道对人类会带来什么样的后果。”

语言本来就很复杂,加上它会随社会文化演变,新词生生灭灭,这就需要研究者不断探索其规律。

语言创新建立于共鸣基础

为了落实教育,规范化似乎不可避免,孙朝奋认为,人类语言和人类的生活方式及周围环境密切相关,但无论有没有政府规范,语言的变化都会受制于约定俗成,如果每个人各说各话,交流沟通就无法成立。

“语言创新也是建立在听说两方共鸣的基础之上,否则只是说者有意,听者无知,就无所谓语言创新了。在我看来,规范也许是教育普及的必然结果。这可能还有个反作用的问题,规范在某种程度上反过来会减少了语言变化的可能性与变化速度。例如,英语规范以后,thru和nite之类更符合口语音值的拼写方法就是流行不起来了,尽管gh两个字母和实际音值毫不相干,我们一般都还是沿用through和night的标准拼法。更有意思的是,手机短信流行大量的缩写,不知道将来LOL(laugh out loud)、OMG(Oh my god)之类的缩写,会不会对英语的规范造成新的冲击?”

孙朝奋本科在中国华东师范大学修读英语。他于1981年前往美国,本打算修读英语,但1982年他加入加利福尼亚大学伯克利分校王士元教授的语言研究实验室实习一年,接触了语言学研究。1983年他在俄勒冈大学攻读应用语言学硕士期间,上了一门改变他治学道路的实证研究课。教课的是知名语言学家Givon,他在以色列长大,父母是西班牙移民到以色列的犹太人,有双母语——希伯来与西班牙语,个人也研究印第安与南岛语言。

回忆求学之路,孙朝奋说,当时美国学校里中国学生不多,Givon教授出题要他探讨现代汉语的词序。因为1970年代美国语言学界出现新观点,认为现代汉语从主语+动词+宾语的语序演变成主语+宾语+动词的语序,一旦成立,中文就是世界上唯一从主动宾演变成主宾动的主要语言。不过吉万怀疑这个假设。

孙朝奋说:“我在图书馆找到了一本台湾出版的中文童话故事以及一位大陆作家写的中篇小说,作为我的真实语料(当时还没有电子语料库),用老师的方法做了个实证研究。交功课以后,老师肯定了我的努力,虽然给了我一个A,但那是我在美国上研究生院第一次用英文写论文,行文不够规范。吉万教授认为我的研究数据应该发表,帮我把论文仔细修改了一遍,然后就联名发表了这篇论文。

“论文出来以后,美国语言学界逐渐就没人再提汉语是主宾动语言的假设了。我很兴奋,来美国上学写的第一篇论文就发表了,得到了很大的激励,也对研究汉语语法产生了浓厚的兴趣。当时我只是学了点研究方法和老师的理论,可毕竟还是个研究汉语的新手,老师本人也不懂中文,我们只论证了汉语不是主宾动语言的事实,对很多相关汉语句型的分析,多有很不到位的分析。所以我念完硕士就去康奈尔大学读语言学博士,跟随梅祖麟教授学习汉语史。毕业后,就进入了汉语研究的领域,主攻方向是功能语法和汉语的演变。”

比较不同语言启发大

如果用一句话形容汉语,孙朝奋回答:“汉藏语系中的汉语与欧洲语言相比之下,名词和动词的语法标记显得很少。”

比较不同语言,能够得到巨大启发,精通多语对于语言研究非常有帮助。孙朝奋认为,语言是人类所有的共同特征,不同语言多有共通之处,精通多个语言,对研究语法,会有很多不可多得的优势。他举例说,英语语法对汉语语法研究的发展有过非常大的影响。尽管中国传统国学有文字学与音韵学等研究,但文言语法研究要迟至19世纪末晚清驻欧外交官马建忠出版《马氏文通》才出现。黎锦熙教授1924年的《新著国语文法》则是现代汉语语法的第一本专著。

孙朝奋说:“从‘利’这个角度来看,(中)国人从学习外语开始,知道了语法的重要概念,黎先生借鉴英人纳斯菲尔德(Nesfield)的《英语语法》,洋为中用,首创现代汉语的语法学。从‘弊’这个角度来看,从马建忠到现在,经过了一百二十多年,虽然汉语语法研究已经有了一个坚实的理论基础,可是现行的汉语语法书,还是基本上沿用欧洲语言传统的语法概念,多自上而下的研究,对于欧洲语言没有的汉语句式或语法现象,以及一些汉语最基本的语法概念,中国语言学界还各有各说,至少还尚存不少多有争议的盲区。”

孙朝奋到新加坡的华语演讲题目为“为何华语不说‘祝你生日很快乐’?——英语和华语形容词的异同”,英语演讲的题目则为“汉语定式句的四个特性”。

华语演讲由南洋理工大学人文学院中华语言文化中心、南洋大学毕业生协会与《联合早报》主办。

 孙朝奋华语演讲:为何华语不说“祝你生日很快乐”?

 3月19日(星期日)

 下午3时至4时30分

 新加坡报业中心大礼堂(1000 Toa Payoh North S318994)

 报名:扫描QR码

 或bit.ly/zbtls2023

 

 孙朝奋英语演讲:

 汉语定式句的四个特性

 3月21日(星期二)

 下午5时30分至7时

 南洋理工大学

 SHHK Conference Room #05-57(48 Nanyang Avenue S639818)

 报名:bit.ly/ntutls2023

LIKE我们的官方脸书网页以获取更多新信息