| 【中文题名】 | 基于网络的智能答疑系统的研究与实现 |
| 【英文题名】 | Research and Implementation of Web-based Intelligent Question Answering System |
| 【学科专业】 | 应用数学 |
| 【论文级别】 | 硕士论文 |
| 【投稿时间】 | 2005-7-28 |
| 【中关键词】 | 智能答疑系统,自然语言,信息检索,句子相似度,FAQ,库 |
| 【英关键词】 | intelligent question answering system,natural language,information retrieval,sentence similarity,FAQ base, |
| 【分类导航】 | 工业技术>自动化技术、计算机技术>自动化基础理论>人工智能理论>> |
| 【论文摘要】 | 自动问答系统是当前自然语言处理领域的热点和难点,它综合运用自然语言处理、信息检索等技术,对用自然语言描述的问题,自动生成简洁、准确的答案。让计算机完全理解人类语言是非常困难的,因此目前还没有出现成熟的自动问答系统。本文研究的基于网络的智能答疑系统,是基于特定领域,即远程教学领域的自动问答系统。该系统服务于用户远程学习中的即时疑难问题解答,可有效提高远程教学的质量。
本 系 统 采 用 B/S 体 系 结 构 来 实 现 , 主 要 包 括 问 句 理 解 分 析 、 FAQ (frequently-asked question)库问句匹配、学科文档库答案自动获取三个模块。问句理解分析模块采用分词和词性标注、关键词提取及扩展、问句类型类别确定等自然语言理解技术,实现对用户提问意图的准确理解;FAQ 库问句匹配模块主要采用本系统改进的句子相似度计算方法来实现用户问句的解答,该模块主要用于实现用户常问问题的快速、准确解答;学科文档库答案自动获取模块在对学科文档库建立倒排索引的基础上,采用高效的信息检索模型对索引库进行检索,返回与用户查询表达式相似度较高的文档作为候选文档,针对从文档中直接获取答案难度较大这一问... |
| 【论文题纲】 |
|
摘要 |
2-3 |
|
Abstract |
3-8 |
|
第1章 绪论 |
8-14 |
|
1.1 论文的目的和意义 |
8-9 |
|
1.2 国内外研究情况和发展趋势 |
9-12 |
|
1.2.1 国外的研究情况 |
9-10 |
|
1.2.2 国内的研究情况 |
10-11 |
|
1.2.3 存在的主要问题 |
11-12 |
|
1.3 论文的工作 |
12 |
|
1.4 论文的组织 |
12-14 |
|
第2章 基于网络的智能答疑系统总体设计及知识库组织 |
14-21 |
|
2.1 智能答疑系统总体结构设计 |
14-15 |
|
2.2 智能答疑系统知识库的组织 |
15-19 |
|
2.3 智能答疑系统知识库的自学习功能及其实现 |
19-21 |
|
第3章 问句语义理解与问句语义符号表示的研究 |
21-34 |
|
3.1 本系统分词与词性标注实现 |
21-26 |
|
3.1.1 本系统分词与词性标注模块结构图 |
21 |
|
3.1.2 本系统分词方法 |
21-22 |
|
3.1.3 歧义切分类型的识别和处理技术 |
22-25 |
|
3.1.4 基于规则和统计相结合的词性标注方法 |
25-26 |
|
3.2 用户问句的语义识别 |
26-32 |
|
3.2.1 问句预处理 |
27 |
|
3.2.2 问句类型 |
27-29 |
|
3.2.3 关键词提取 |
29-30 |
|
3.2.4 关键词扩展 |
30 |
|
3.2.5 问句所属知识单元的确定 |
30-32 |
|
3.3 用户问句的语义符号表示 |
32-34 |
|
第4章 FAQ 库问句匹配实现策略与核心技术的研究 |
34-48 |
|
4.1 FAQ 库问题检索实现流程 |
34 |
|
4.2 常用句子相似度计算方法 |
34-38 |
|
4.2.1 基于词向量空间模型的 TF-IDF 相似度计算 |
35-36 |
|
4.2.2 基于语义词典的相似度计算 |
36-38 |
|
4.3 基于特定领域的加权语义相似度计算方法的研究 |
38-39 |
|
4.4 基于特定领域的加权语义相似度计算在本系统的应用 |
39-46 |
|
4.4.1 词语权重计算研究 |
39-40 |
|
4.4.2 计算机学科领域知网构建 |
40-44 |
|
4.4.3 词语相似度计算 |
44-46 |
|
4.4.4 基于特定领域的加权语义相似度计算方法的应用 |
46 |
|
4.5 FAQ 库问句匹配实现算法 |
46-48 |
|
第5 章学科文档库答案自动获取实现策略与核心技术的研究 |
48-62 |
|
5.1 学科文档库答案自动获取流程 |
48 |
|
5.2 信息检索模型 |
48-51 |
|
5.2.1 布尔模型 |
49 |
|
5.2.2 向量空间模型 |
49-51 |
|
5.3 本系统信息检索模型设计 |
51-52 |
|
5.4 学科文档库预处理及其索引建立 |
52-58 |
|
5.4.1 HTML 文档的自动采集和扫描算法 |
52-54 |
|
5.4.2 文档的特征提取及权重计算 |
54-56 |
|
5.4.3 索引库建立 |
56-58 |
|
5.5 文档答案抽取实现 |
58-60 |
|
5.6 学科文档库的答案自动获取实现算法 |
60-62 |
|
第6章 基于网络的智能答疑系统的实现 |
62-68 |
|
6.1 系统运行模式的选择 |
62-64 |
|
6.2 系统运行环境及开发工具的选择 |
64-65 |
|
6.3 系统实现 |
65-68 |
|
总结与展望 |
68-70 |
|
致谢 |
70-71 |
|
参考文献 |
71-75 |
|
攻读硕士学位期间发表的论文及科研成果 |
75 |
|
| 【DOI】 | LunWen.ID:2.2008.387365 |