人工智能在数据清洗中的应用
| 论文之家 | 代写论文 | 发表论文 | 站点地图 | 收藏本站 |
您现在的位置: 硕士论文 >> 电子论文 >> 自动化 >> 自动化基础 >> 正文
人工智能在数据清洗中的应用
Form: 论文之家 作者:陈扬 Publish: 2006-12-27 Hits:-
【中文题名】 人工智能在数据清洗中的应用
【英文题名】 Application of Artificial Intelligence on Data Cleaning
【学科专业】 计算机科学与技术
【论文级别】 硕士论文
【投稿时间】 2006-12-27
【中关键词】 数据清洗,数据质量,机器学习,贝叶斯,元数据,ETL
【英关键词】 Data Cleansing,Data Quality,Machine Learning,Bayes,Meta Data,ETL,Data Warehouse,
【分类导航】 工业技术>自动化技术、计算机技术>自动化基础理论>人工智能理论>>
【论文摘要】  随着业务的不断拓展,大量的生产管理、技术质量、财务成本等各个领域的数据不断产生。如何充分利用这些数据和系统,提高数据的质量,为决策支持系统提供正确的数据,实现从数据到信息、信息到知识的提炼,从而为企业的生产经营作出正确决策提供服务,是摆在我们信息技术人员面前的一大课题。 数据清洗,也称做数据净化,从数据中检测和去除错误及不一致的数据部分以改善数据质量。 本文针对CATT项目数据的数据质量问题以及用户的特殊需求,建立了数据清洗过程的元数据模型,对清洗过程用到的数据库对象和知识库对象进行管理,并创新性的在公司数据仓库项目中引入人工智能方法参与数据清洗。 在本项目的元数据模型中,把知识元数据分为逻辑和信息两大类。逻辑是一种规则,是加工信息的具体方法,由设计人员进行具体设计和实现。信息是对现实世界中具体事物的抽象反映,可以由程序自动更新。对数据的清洗操作,利用规则对清洗后的数据进行的验证等等都属于逻辑。而各种数据,包括脏数据,清洗后的数据,验证后的结果,清洗过程中要用到的数据字典等等都数据信息范围。 本文中的人工智能模块使用了贝叶斯文本识别方法,通过朴素贝叶斯分类器识别客户的...
【论文题纲】
摘要 4-6
ABSTRACT 6-8
目录 8-10
第一章 绪论 10-21
一 引言 10
二 重要概念及应用现状 10-16
三 数据清洗的问题 16-19
四 本文研究的内容 19-21
第二章 数据清洗的途径 21-26
一 数据分析 21-22
二 定义数据转换规则 22-23
三 冲突解决 23-25
四 现有的工具 25-26
第三章 人工智能方法的应用 26-31
一 机器学习 26-27
二 贝叶斯学习 27-29
三 学习分类文本 29-30
四 在数据清洗中应用文本分类 30-31
第四章 CATT 主题及其数据质量问题 31-36
一 CATT 主题背景 31-32
二 CATT 主题的数据源和数据质量问题 32-33
三 CATT 数据清洗方案目标 33-36
第五章 CATT 中清洗架构和人工智能方法的应用 36-51
一 CATT 的数据特点及清洗的方法 36-41
二 针对desired_location 字段的人工智能清洗方法 41-44
三 CATT 主题数据清洗方案元数据模型 44-48
四 CATT 数据清洗方案的整体实现 48-51
第六章 CATT 数据清洗方案的试验论证及结论 51-54
一 正确性评估 51-52
二 效率评估 52
三 主要结论 52-53
四 进一步研究方向 53-54
参考文献 54-55
致谢 55-56
攻读硕士学位期间发表的论文 56-57
上海交通大学学位论文原创性声明 57-58
上海交通大学学位论文版权使用授权书 58
【DOI】 LunWen.ID:2.2008.388310
付费论文:有参考文献 300元
1、注册会员             2、购买本文            3、下载文章 
注:此文为收费论文,需付费购买。每页大约1000字。
代写论文流程
载入中…
Web lunwenjia
热门搜索:数据清洗 论文 数据质量 机器学习 贝叶斯 元数据 ETL
自动化基础最新论文
自动化基础热门论文