| 【中文题名】 | web文档性质分类的研究与应用 |
| 【英文题名】 | Application and Practice of Development Based on Collaboration |
| 【学科专业】 | 计算机应用技术 |
| 【论文级别】 | 硕士论文 |
| 【投稿时间】 | 2005-7-7 |
| 【中关键词】 | 文本分类,内容分类,性质分类,结果分类代理,查询优化,结果优化 |
| 【英关键词】 | Text classification,Content classification,Character classification,Agent of result classification,Inquiry optimization,Result optimization, |
| 【分类导航】 | 工业技术>自动化技术、计算机技术>计算技术、计算机技术>计算机的应用>计算机网络>一般性问题 |
| 【论文摘要】 | WWW 是一个开放性的全球分布式网络,网上的资源没有统一的结构和管理,导致了信息查找和使用的困难。网页的自动分类可以在较大程度上消除网上信息杂乱的现象,并方便用户准确地定位所需的信息和分流信息,已成为一项具有较大实用价值的关键技术。同时,互联网络的发展对网络信息发现服务提出了更高的要求,仅按内容对网页进行分类的技术已不再适应人们的需要,因此需要开发适合我国国情的中文 Web 文档分类技术,更好地帮助用户使用和管理网络信息。
本文就是针对以上情况对 Web 信息分类技术所进行的深入研究,在总结和分析文本分类技术和基于内容的 Web 文档分类技术的基础上,提出性质分类的新概念,并分析性质分类的意义、可行性、具体算法以及该技术在搜索引擎结果优化中的应用。主要研究内容包括:
1.总结文本分类的过程和 Web 文档的结构特点,在此基础上阐述基于内容的 Web 文档分类算法,其中包括基于网页文本的分类、基于超链接的分类和基于查询目志的分类等,详细描述了 KNN 算法、SVM 算法、贝叶斯算法和决策树算法,并比较和分析各种分类方法的优缺点。
2.提出 Web 文档性质分类的新概念,通过对大量网页的结构特点研究,... |
| 【论文题纲】 |
|
摘要 |
3-4 |
|
Abstract |
4-5 |
|
目录 |
5-7 |
|
引言 |
7-9 |
|
第一章Web 文档分类技术概述 |
9-16 |
|
1.1 文本分类技术 |
9-11 |
|
1.1.1 文本分类概述 |
9-10 |
|
1.1.2 文本自动分类问题的一般性描述 |
10-11 |
|
1.1.3 文本分类的意义 |
11 |
|
1.2 Web 文档分类技术 |
11-14 |
|
1.2.1 Web 信息的基本特点 |
11-12 |
|
1.2.2 Web 文档分类方法概述 |
12-13 |
|
1.2.3 特征抽取 |
13-14 |
|
1.2.4 特征选择 |
14 |
|
1.2.5 分类器 |
14 |
|
1.3 本章小结 |
14-16 |
|
第二章 基于内容的Web 文档分类 |
16-26 |
|
2.1 内容分类的含义 |
16 |
|
2.2 基于内容分类的具体算法 |
16-24 |
|
2.2.1 基于网页文本分类的算法 |
16-22 |
|
2.2.2 基于超链接分类的算法 |
22-24 |
|
2.2.3 基于查询日志的分类方法 |
24 |
|
2.3 各种分类方法比较 |
24-25 |
|
2.4 本章小结 |
25-26 |
|
第三章 基于性质的Web 文档分类 |
26-39 |
|
3.1 性质分类概念的提出 |
26-30 |
|
3.1.1 性质分类概念的产生背景 |
26-28 |
|
3.1.2 性质分类的体系结构 |
28-30 |
|
3.2 性质分类的可行性分析 |
30-35 |
|
3.3 性质分类方法的研究 |
35-38 |
|
3.3.1 基于超文本的性质分类算法 |
35-37 |
|
3.3.2 基于超链接的性质分类算法 |
37-38 |
|
3.3.3 基于文件格式的性质分类 |
38 |
|
3.4 本章小结 |
38-39 |
|
第四章 两种分类方法的比较 |
39-42 |
|
4.1 相同点 |
39-40 |
|
4.2 不同点 |
40-41 |
|
4.3 本章小结 |
41-42 |
|
第五章 性质分类在搜索引擎结果性质分类中的应用 |
42-50 |
|
5.1 搜索结果的排序方法 |
42-44 |
|
5.2 利用代理对搜索结果进行性质分类 |
44-45 |
|
5.3 搜索结果分类代理的结构的实现 |
45-47 |
|
5.3.1 搜索结果分类代理 |
45 |
|
5.3.2 基于查询优化的搜索结果分类代理 |
45-46 |
|
5.3.3 基于结果优化的搜索结果分类代理 |
46-47 |
|
5.4 搜索结果分类代理的用户界面 |
47-49 |
|
5.5 本章小结 |
49-50 |
|
第六章 总结与展望 |
50-52 |
|
参考文献 |
52-56 |
|
致谢 |
56-57 |
|
在学期间公开发表论文及著作情况 |
57 |
|
| 【DOI】 | LunWen.ID:2.2008.370665 |