基于语义特征提取的PU文本分类的研究与实现
| 论文之家 | 代写论文 | 发表论文 | 站点地图 | 收藏本站 |
您现在的位置: 硕士论文 >> 电子论文 >> 自动化 >> 自动化基础 >> 正文
基于语义特征提取的PU文本分类的研究与实现
作者:谭新 Publish: 2007-8-7 Hits:-
【中文题名】 基于语义特征提取的PU文本分类的研究与实现
【英文题名】 Research and Development of PU Text Classification Based on Semantic Feature Selection
【学科专业】 计算机软件与理论
【论文级别】 硕士论文
【投稿时间】 2007-8-7
【中关键词】 PU问题,文本分类,特征提取,WordNet,,
【英关键词】 
【分类导航】 工业技术>自动化技术、计算机技术>自动化基础理论>人工智能理论>>
【论文摘要】  本文研究的是基于语义特征提取的PU文本分类问题。PU分类的特点是训练集只标识了正例,而没有标识其他类别,然而常用于文本分类的特征提取方法需要类别的概率信息,因此无法应用于PU问题。大多数现有的PU分类实现都没有对特征提取做过多的研究,只是应用最简单的文档频率方法,去掉出现频率较小的词条。本文针对PU问题需要,提出了一种基于本体的语义特征提取方法,意图通过改进特征提取来提高PU分类器的性能。 本文利用WordNet实现了语义特征提取:首先找到文档的语义集合,然后去掉不含有文档语义的词条。这样既达到了特征提取的降维目的,又没有丢失文档的语义信息。实验表明,面向PU问题的语义特征提取是有效的。语义特征提取相对于文档频率方法能得到更好的分类器性能指标(评估参数F1),特别是在正例较少的情况下,大大改善了现有PU分类的效果。
【论文题纲】
提要 4-7
第一章 绪论 7-11
1.1 研究背景 7-8
1.2 课题来源 8-9
1.3 本文所做工作 9-11
第二章 文本分类基础篇 11-25
2.1 定义 11
2.2 历史和现状 11-12
2.3 文本分类的流程 12-13
2.4 常见的文本分类技术 13-25
2.4.1 文本表示 13-16
2.4.1.1 基本思想 13-14
2.4.1.2 权重计算 14-15
2.4.1.3 文本表示的过程 15-16
2.4.2 特征提取 16-20
2.4.2.1 基于评估函数的特征提取方法 16-18
2.4.2.2 考虑相关性的特征提取方法 18-19
2.4.2.3 语义特征提取 19-20
2.4.3 分类算法 20-23
2.4.3.1 K-最近邻算法 20-21
2.4.3.2 朴素贝叶斯 21-23
2.4.3.3 支持向量机 23
2.4.4 分类器性能评估 23-25
第三章 PU文本分类 25-30
3.1 什么是PU分类 25
3.2 相关工作 25
3.3 PU分类的两步框架 25-26
3.4 ONE-CLASS SVM 算法 26-27
3.5 PEBL算法 27-30
3.5.1 寻找可信反例 28
3.5.2 构造分类器 28-30
第四章 本文提出的面向PU问题的语义特征提取 30-36
4.1 面向PU问题的语义特征提取 30-32
4.2 语义特征提取应用于ONE-CLASS SVM算法 32-33
4.3 语义特征提取应用于PEBL算法 33-36
第五章 语义特征提取的PU分类器实现及结果分析 36-52
5.1 实验设计 36-41
5.1.1 实验数据 36
5.1.2 实验1 36-38
5.1.3 实验2 38-41
5.1.4 分类器性能评估方法 41
5.2 工具介绍 41-43
5.2.1 LIBSVM介绍 41-42
5.2.2 WordNet介绍 42-43
5.3 实现细节 43-47
5.4 实验结果及分析 47-52
5.4.1 实验1 结果分析 47-48
5.4.2 实验2 结果分析 48-52
第六章 结论 52-53
参考文献 53-56
摘要 56-59
ABSTRACT 59-63
致谢 63-64
导师及作者简介 64
【DOI】 LunWen.ID:2.2008.388735
付费论文:有参考文献 300元
1、注册会员             2、购买本文            3、下载文章 
注:此文为收费论文,需付费购买。每页大约1000字。
代写论文流程
载入中…
Web lunwenjia
热门搜索:PU问题 论文 文本分类 特征提取 WordNet
自动化基础最新论文
自动化基础热门论文