| 【中文题名】 | 智能网页信息过滤系统AIFS的研究与实现 |
| 【英文题名】 | Research and Implement of an Adaptive WebPages Information Filtering System (AIFS) |
| 【学科专业】 | 系统分析与集成 |
| 【论文级别】 | 硕士论文 |
| 【投稿时间】 | 2006-4-5 |
| 【中关键词】 | 信息过滤,自然语言处理,人工智能,WinPcap,中文分词,文本表示 |
| 【英关键词】 | information filtering,natural language process,artificial intelligence,winpcap,chinese segmentation,document representation,genetic algorithm, |
| 【分类导航】 | 工业技术>自动化技术、计算机技术>计算技术、计算机技术>计算机的应用>计算机网络>一般性问题 |
| 【论文摘要】 | 基于WWW 的主要信息过滤对象是网页,其中文本是网页信息的主要表达方式。然而现在可用的网页信息过滤系统一般都是手工输入过滤关键字,仅通过简单的字符匹配查找,或是人工导入要过滤的网络端口或链接地址(URL)。显然这样的过滤机制太过笨拙,而且查准率和查全率都很低,面向文本内容识别的智能化信息过滤系统正拭目以待。
本文介绍了信息过滤技术的发展现状、存在问题和信息过滤方法,并详细讨论了信息过滤的关键技术和一个完整的自适应过滤系统所必须具有的组件。文中设计的智能网页信息过滤系统名为AIFS,是基于内容理解的中文文本网页的主题探测和过滤。该系统紧密结合了人工智能在信息处理的四大应用:知识获取、知识表示、自然语言理解和机器学习。本文是以AIFS 系统的实现为依托,对智能信息过滤系统的关键技术进行了深入探讨。其中,网络数据处理章节讲述了Windows 下的网络数据包捕获库WinPcap 的原理和实现,并分析了从以太网数据帧中提取网络文本数据的全过程。文本数据处理章节介绍了中文分词和文本表示,详细描述了在AIFS 系统中涉及到的分词算法(如正向最大匹配法、逆向最大匹配法、最大概率法和设立切分标记法)以及基于向量空间模型的... |
| 【论文题纲】 |
|
摘要 |
4-5 |
|
ABSTRACT |
5-8 |
|
1 绪论 |
8-11 |
|
1.1 课题目的和意义 |
8-9 |
|
1.2 本文的主要研究内容和章节安排 |
9-11 |
|
2 信息过滤方法 |
11-18 |
|
2.1 信息过滤基本原理 |
11-12 |
|
2.2 信息过滤系统的基本构成 |
12-13 |
|
2.3 WWW 信息过滤的研究现状 |
13-15 |
|
2.4 信息过滤与人工智能 |
15-18 |
|
3 智能网页信息过滤系统AIF |
18-22 |
|
3.1 AIFS 简介 |
18-19 |
|
3.2 AIFS 系统设计 |
19-21 |
|
3.3 AIFS 的关键技术 |
21-22 |
|
4 网络数据处理 |
22-30 |
|
4.1 以太网工作原理 |
22-24 |
|
4.3 网络协议分析 |
24-27 |
|
4.4 网络数据处理的实现 |
27-30 |
|
5 文本数据处理 |
30-47 |
|
5.1 中文分词 |
30-36 |
|
5.2 文本表示 |
36-45 |
|
5.3 实验分析 |
45-47 |
|
6 自适应处理 |
47-59 |
|
6.1 用户反馈接口 |
47-49 |
|
6.2 基于GA 的机器学习 |
49-59 |
|
7 总结与展望 |
59-62 |
|
7.1 总结 |
59 |
|
7.2 展望 |
59-62 |
|
致谢 |
62-63 |
|
参考文献 |
63-67 |
|
附录 攻读硕士学位期间发表论文 |
67 |
|
| 【DOI】 | LunWen.ID:2.2008.372372 |