| 【中文题名】 | 基于现代汉语和中介语语料的复合词语义提取和自组织聚类分析研究 |
| 【英文题名】 | The Study of the Semantics Withdraw of the Compound Words from the Modern Chinese Corpus and the Interlanguage Corpus and Self-Organization Clustering Analysis |
| 【学科专业】 | 语言学及应用语言学 |
| 【论文级别】 | 硕士论文 |
| 【投稿时间】 | 2007-10-11 |
| 【中关键词】 | 复合词,分布表征,语义表征,语义提取,自组织聚类,心理词典 |
| 【英关键词】 | the compound words,the distributional representation,the semantic representation,the semantics withdraw,self-organization clustering,the mental lexicon, |
| 【分类导航】 | 语言、文字>汉语>语义、词汇、词义(训诂学)>>> |
| 【论文摘要】 |
联结主义(Connectionism)自二十世纪八十年代后期以来是认知心理学的主导理论之一,它被广泛应用于包括语言学在内的各个领域。联结主义分布表征的观念和对学习机制解释的合理性被语言习得研究者广泛看好,目前,联结主义已经成为解释语言习得的主导流派之一。
本文在国外联结主义理论和神经网络模型研究比较成熟、联结主义引入语言习得研究的理论比较成熟的情况下,将联结主义的分布表征理论、语义提取和自组织聚类的方法引入汉语作为第二语言的留学生复合词习得研究中。着力于从理论和方法上两个方面更新的研究视点。
文中介绍了联结主义理论看待习得问题的优势,利用联结主义自动提取语义表征模型WCD,做了一系列从现代汉语和中介语语料自动抽取语义的实验,对抽取出来的语义进行自组织聚类分析,并参照联结主义的理论,以此为留学生和汉语母语使用者的心理词典的假设,考察了它们的异同和发展过程。实验研究发现,初级水平的留学生还不能很好识别同家族复合词的近义、同形关系。随着水平的提高,留学生掌握同家族复合词的数量慢慢增加,他们的语义系统逐渐发展,到了高级水平,留学生能够比较好的识别同家族复合词的近义、同形等关系,但是仍然不如汉... |
| 【论文题纲】 |
|
摘要 |
3-5 |
|
Abstract |
5-9 |
|
1 序言 |
9-11 |
|
2 理论背景 |
11-21 |
|
2.1 第二语言习得理论 |
11-13 |
|
2.2 联结主义 |
13-17 |
|
2.3 神经网络 |
17-21 |
|
3 研究状况 |
21-31 |
|
3.1 汉语复合词和语素的语言学研究 |
21-24 |
|
3.2 复合词和语素的语料库的统计研究 |
24 |
|
3.3 复合词的习得与认知研究 |
24-28 |
|
3.4 基于联结主义的自组织模型和语义提取的研究 |
28-31 |
|
4 问题提出 |
31-33 |
|
4.1 研究基础 |
31 |
|
4.2 研究内容 |
31-32 |
|
4.3 拟解决的关键问题 |
32-33 |
|
5 语义表征抽取和自组织聚类 |
33-54 |
|
5.1 实验一:现代汉语语料的语义抽取和自组织聚类 |
33-43 |
|
5.2 实验二:中介语语料的语义抽取 |
43-48 |
|
5.3 实验三:中介语分等级语义抽取和聚类对比分析 |
48-52 |
|
5.4 小结 |
52-54 |
|
6 综合讨论 |
54-57 |
|
6.1 联结主义对语义的看法,对透明度的看法 |
54-55 |
|
6.2 联结主义对语言材料的看法 |
55 |
|
6.3 联结主义对心理词典的看法 |
55 |
|
6.4 联结主义理论和模型对复合词习得研究方法的启示 |
55 |
|
6.5 对留学生的复合词学习和对外汉语教学的启示 |
55-57 |
|
7 总结 |
57-59 |
|
7.1 结论 |
57 |
|
7.2 本文存在的问题和改进办法 |
57-58 |
|
7.3 下一步的目标假设 |
58-59 |
|
参考文献 |
59-65 |
|
附录 |
65-74 |
|
附录一 |
65-67 |
|
附录二 |
67-72 |
|
附录三 |
72-74 |
|
致谢 |
74 |
|
| 【DOI】 | LunWen.ID:2.2008.222537 |