基于XML的Web挖掘
| 论文之家 | 代写论文 | 发表论文 | 站点地图 | 收藏本站 |
您现在的位置: 硕士论文 >> 电子论文 >> 计算机 >> 互联网技术 >> 正文
基于XML的Web挖掘
作者:王石 Publish: 2005-7-7 Hits:-
【中文题名】 基于XML的Web挖掘
【英文题名】 Web Mining Based on XML
【学科专业】 电路与系统
【论文级别】 硕士论文
【投稿时间】 2005-7-7
【中关键词】 Web挖掘,XML,挖掘结构化数据,,,
【英关键词】 Web mining,XML,Mining structural data,
【分类导航】 工业技术>自动化技术、计算机技术>计算技术、计算机技术>计算机的应用>计算机网络>一般性问题
【论文摘要】 随着Internet的飞速发展,它成为了迄今为止最密集、最丰富的信息来源。那么从这些海量数据中找到使用者感兴趣的信息逐渐成为人们关注的焦点。作为从 Web 文档和 Web 活动中抽取感兴趣的潜在的有用模式和隐藏信息的有效技术,Web 挖掘悄然兴起,备受关注。而XML由于具有可扩展性、结构化和有效性等特性,建立了一种传输结构化数据的方法,从而使用户能够对Web信息实施精确查询与模型抽取。因此XML与Web挖掘的结合将在数据挖掘领域内进行的研究推向了一个新的高潮。 本文首先从Web挖掘研究背景入手,介绍了数据挖掘相关概念,相比HTML而言XML 在 Web 挖掘应用中的优越性,以及 Web 挖掘的内涵和复杂性分析,Web 挖掘原理、特点、分类等等。 接着,阐述了如何实现Web内容挖掘的问题。 提出了使用标准web技术——HTML、半结构化数据模型、XML、Java——开发的一种基于 Web 的数据挖掘方法。利用对象交换模型OEM将Web页转换为XML文档,然后用Java实现从XML文档中抽取感兴趣的信息。通过选择可靠的数据源以及在这些数据源中选取与内容相关但与格式无关的引用点,可以实现数据抽取的任务...
【论文题纲】
中文摘要 3-4
英文摘要 4-5
目录 5-6
第一章 绪论 6-8
引言 6
1 问题的提出 6-7
2 本文研究思路及组织 7-8
第二章 研究背景 8-12
2.1 数据挖掘研究综述 8-9
2.1.1 数据挖掘的提出 8
2.1.2 数据挖掘组件 8
2.1.3 数据挖掘任务 8-9
2.2 XML 技术概述 9-11
2.2.1 HTML 的缺点 10
2.2.2 XML 的描述 10
2.2.3 XML 与 HTML 的比较 10-11
2.3 Web 挖掘技术 11-12
第三章 Web 挖掘的内涵及复杂性分析 12-15
3.1 Web 挖掘原理 12
3.2 Web 挖掘的特点 12-13
3.3 Web 挖掘的分类 13-14
3.4 Web 挖掘的难点及解决方法 14-15
第四章 Web 内容挖掘及其java 实现 15-22
4.1 总体设计思想 15
4.2 对象交换模型 OEM 15-16
4.3 用 XML 存储映射半结构化数据 16-19
4.4 用java 实现基于 XML 的 Web 内容挖掘 19-22
第五章 结构化数据的挖掘 22-26
5.1 相关概念 22-23
5.2 树的匹配 23
5.3 模式树的生成 23-24
5.4 从有序树中挖掘频繁引导子树 24-26
结语 26-27
参考文献 27-29
附录 29-39
【DOI】 LunWen.ID:2.2008.370663
付费论文:有参考文献 300元
1、注册会员             2、购买本文            3、下载文章 
注:此文为收费论文,需付费购买。每页大约1000字。
代写论文流程
载入中…
Web lunwenjia
热门搜索:Web挖掘 论文 XML 挖掘结构化数据
互联网技术最新论文
互联网技术热门论文