5月29日下午,文学院“松洲讲堂”社会语言学系列第八讲“码上创新:以语义编码思路解锁中文编码新未来”在博东110开讲,法籍华人、百宝箱之友协会会长夏诠真应邀作为主讲人。讲座由中国语言文学系主任、国家语言文字推广基地(闽南师范大学)办公室主任肖模艳主持,文学院语言学及应用语言学专业、国际中文教育专业研究生参加了讲座。


讲座伊始,夏诠真从汉字字形、书写媒介和机器代号系统展开汉字的历史演变。从上世纪八十年至今,四十年来只有字被正式编码(unicode),所有的信息是以“句=unicode+unicode”的结构来进行记忆的。然而,字是组词的元素,词才是文本的最小理解单位,人阅读时靠词看懂文章,机器翻译时必先断词,也即需要将“句=字+字”的结构改变为“句=词+词”的结构。基于此,夏诠真创立了“汉语百宝箱”,在文章诞生阶段便使用“概念码/词句码”去记忆文章的含义,为翻译机器节省了困难易错的新词工序,从而避免了机器翻译时将“海内存知己”断词为“海/内存/知己”等一系列错误。
在互动交流环节中,现场气氛热烈,师生们踊跃提问,围绕词典研发的底层逻辑、应用领域及实践挑战等话题展开了深入探讨。有学生表示,讲座中介绍的HSK系统令人印象深刻,对其功能和应用前景充满期待,并希望该系统能尽快落地应用。


“汉语百宝箱”系统以“一词一单位”为底层逻辑,立足汉语特性进行研发,不仅突破了西方信息编码体系的传统框架,更彰显了文化自信与创新精神。这一理念既拓展了基地科研工作的学术视野,也为在场师生带来了深刻启发。