基于自然语言处理和机器学习的文本分类及其应用研究
| 论文之家 | 代写论文 | 发表论文 | 站点地图 | 收藏本站 |
您现在的位置: 硕士论文 >> 电子论文 >> 自动化 >> 自动化基础 >> 正文
基于自然语言处理和机器学习的文本分类及其应用研究
作者:王懿 Publish: 2006-8-21 Hits:-
【中文题名】 基于自然语言处理和机器学习的文本分类及其应用研究
【英文题名】 NLP and ML Based Text Classification and Its Applications
【学科专业】 计算机软件与理论
【论文级别】 硕士论文
【投稿时间】 2006-8-21
【中关键词】 特征降维,文本分类,自然语言处理,机器学习,,
【英关键词】 Feature Reduction,Text Classification,Natural Language Processing,Machine Learning,
【分类导航】 工业技术>自动化技术、计算机技术>自动化基础理论>人工智能理论>自动推理、机器学习>
【论文摘要】 本文讨论了基于自然语言处理和机器学习的文本分类任务,提出了文本分类中新的特征降维方法,并结合两种不同的机器学习算法,观察了不同的降维方法和机器学习算法相组合完成文本分类的性能随特征空间维数变化的现象,并尝试探讨了造成这种现象的原因。具体描述了完成分类任务所需要的自然语言处理、降维和机器学习的算法及其理论基础。设计了紧凑的数据结构和算法过程来实现本文提出的降维方法。分析了文本分类对搜索在效果和效率上的帮助,阐述了文本分类在信息过滤中的应用,并结合招聘信息服务系统的设想分析了其在主动信息服务方面的应用。本文还分析了文本分类各个阶段可能的改进发展方向。 文本分类分为两个阶段完成,分别采用了自然语言处理和机器学习的技术。因此,文本分类在理论研究上的价值体现在对这两种技术的推动。然而文本分类的意义远不如此。分本分类对于提高网上信息检索的效果和效率很有帮助,是推进个性化服务,改进信息获取模式的重要方面,也是内容安全的基础。因此好的分类性能是关注的焦点。研究文本分类任务的理论和工程问题,将具有重要意义。
【论文题纲】
摘要 4-5
Abstract 5-6
目录 6-8
第一章 引言 8-12
1.1 文本分类的应用背景 8-9
1.2 文本分类的定义 9-10
1.3 本文工作 10-11
1.4 本文的安排 11-12
第二章 文本分类的主要阶段、性能评价 12-65
2.1 概述 12-13
2.2 文本分类第一阶段—文本表示成向量 13-38
2.2.1 概述 13
2.2.2 中文文本预处理 13-30
2.2.3 经典的特征降维方法 30-33
2.2.4 基于均值方差的特征降维方法 33-37
2.2.5 权值计算,向量生成 37-38
2.2.6 小结 38
2.3 文本分类第二阶段—学习机器的训练 38-63
2.3.1 机器学习概述 38-56
2.3.2 支持向量机 56-60
2.3.3 Knn 60-61
2.3.4 多分类问题 61
2.3.5 小结 61-63
2.4 分类性能的评价 63-65
2.4.1 性能评价的方法 63
2.4.2 性能评价的指标 63-65
第三章 文本分类的工程实现 65-82
3.1 试验设置 65
3.2 体系结构 65-68
3.3 核心数据结构—词表 68-71
3.4 主要算法过程 71-78
3.4.1 文本预处理 71-72
3.4.2 特征降维 72-75
3.4.3 向量生成 75-76
3.4.4 训练学习机器,计算文本的类别 76-77
3.4.5 统计性能评价指标值 77-78
3.5 性能评价的试验结果及其分析 78-81
3.6 小结 81-82
第四章 文本分类的应用 82-87
4.1 在网上信息检索中的应用 82-83
4.2 在特定领域的应用 83-87
第五章 展望、小结 87-90
5.1 分类体系的改进 87
5.2 反馈的引入 87
5.3 降维后空间大小的确定 87-88
5.4 效率的提高 88
5.5 小结 88-90
参考文献 90-93
发表的论文 93-94
致谢 94-95
【DOI】 LunWen.ID:2.2008.387899
付费论文:有参考文献 300元
1、注册会员             2、购买本文            3、下载文章 
注:此文为收费论文,需付费购买。每页大约1000字。
代写论文流程
载入中…
Web lunwenjia
热门搜索:特征降维 论文 文本分类 自然语言处理 机器学习
自动化基础最新论文
自动化基础热门论文