免费论文
收费论文
发表论文
我要投稿
设为首页 招标网
联系我们
经济学|管理学|法学|计算机|医学|教育|文学|政治|艺术|哲学|更多 经济学|管理学|法律|计算机|医学|教育|文学|政治|艺术|哲学|更多
 论文搜索
  推荐服务: 论文发表 收费论文
期刊论文格式
毕业论文格式
期刊论文范文
毕业论文范文
论文致谢
毕业论文答辩
开题报告
论文选题
英文摘要书写
基于Web的信息抽取技术研究
中文名称: 基于Web的信息抽取技术研究
全文提供: 购买充值卡,就可下载本篇论文全文  
论文编号: 3806477收藏本论文】【我的收藏】【我要投稿
英文名称: Research on the Technology of Web Information Extraction
学位类型: 硕士毕业论文
作者: 涉及隐私,隐去***  作者本人请参看权力声明>>
导师: 涉及隐私,隐去***
毕业学校: 涉及隐私,隐去***
专业: 计算机应用技术
毕业年份: 涉及隐私,隐去***
关键字: Web信息抽取 DOM XML XPath 信息抽取 Web信息 数据库
简介目录: 点击此处 免费索取本论文简介和目录>>
全文提供: 购买充值卡,就可下载本篇论文全文  

       论文发表:快速、低价、包过!发表论文就找论文天下

论文简介:随着互联网的快速发展和普及,人们越来越依赖于网络获取信息。作为海量的信息来源,Web可以看成是一个巨大的数据库,包含着各种各样有价值的信息。基于Web的信息抽取技术就是研究如何从这些Web源中抽取出用户感兴趣的信息,并把这些抽取出的信息表示成更具有语义,更为结构化的形式,以便加以利用。该技术起源于信息抽取技术,但由于Web信息的自身特点,该技术已经和传统的基于纯文本的信息抽取技术有了很大的不同。 目前,大量Web信息被保存在网站的后台数据库中,这些信息在网页上的显示有一些共同的特征,即通常把数据库中的数据插入到网页的一个模板中,其表现形式就是网页的主体部分有多个局部信息块组成,局部信息块有多个数据项构成。这类网页被称为数据密集型(data-rich)网页,由于该类网页富含大量有价值的信息,因此,研究如何对这类网页进行Web信息抽取有重大的意义和实用价值。 对于上述数据密集型网页,本文采用基于XML的相关技术来解决Web信息的抽取问题。其解决方案是:首先获得目标网页,并将该HTML文档以文档对象模型DOM为中介,转换为形式上的XML文档,然后根据这类网页的特征,把该网页中信息的布局视为基于行和列的二维表形式,用户根据自身需求,通过与系统交互,系统半自动地生成基于行和相关列的XPath位置路径表达式作为抽取规则,根据抽取规则定位到待抽取的信息,从而实现信息的准确抽取,抽取的结果用XML来表示。 本文开发了一个原型系统,系统能够完成对数据密集型网页和新闻网页的信息抽取,实验表明本文的系统具有一定的实用价值。
本类相关论文:
·基于相似度的语义Web服务匹配技术的研究
·基于非单调能力扩展的本体推理与查询研究
·基于语义的本体映射策略及其结合方式
·基于语义距离的概念语义相似度研究
·增量学习朴素贝叶斯中文分类系统的研究
·基于领域本体的汉语共指消解及相关技术研究
·基于现代汉语动态流通语料库的通用词汇自动提取方
·中文短语相似度计算方法研究及应用
·基于OpenType技术的蒙古文编辑器的设计与
·基于历史信息的中文多层次句法分析研究
Web信息抽取论文 DOM论文
·垂直搜索引擎主要技术研究
·电子产品自动搜索比价系统设计与实现
·Web挖掘中信息采集技术研究与实现
·基于本体的旅游领域Web信息抽取
·面向Web的图书信息抽取方法与实现
·磁性树脂在制浆造纸废水深度处理中的应用研究
·冻融作用对重金属Pb和Cd在土壤中吸附/解吸作
·皂荚DOM对污染土壤中PAHs的去除及其影响因
·UAV城市高质量DOM制作方法研究
·基于XML的动画剧本描述及其应用研究
XML论文 XPath论文
·GML拓扑更新方法的研究
·GML时空序列模式挖掘研究
·基于XML的林权流转平台信息共享模型研究
·基于关系数据库的XML查询优化技术研究
·信息系统间数据同步的设计与实现
·基于XML面向Web的数据抽取技术研究
·XML数据流XPath查询模型研究
·基于Chord协议的XML文档查询机制研究与实
·ERP中XML压缩算法及安全技术的研究与实现
·网络环境下XPath查询集冗余去除的研究
信息抽取论文 Web信息论文
·基于信息抽取的社会网络构建技术的研究与应用
·个人数据空间管理系统中数据抽取及语义关联构建
·B2C在线评论中的客户知识管理研究
·个性化Web商务信息融合关键技术研究
·基于DOM的Web信息抽取系统设计与实现
·基于Web信息的内容及其特征提取方法的研究
·WEB信息抽取的研究
·个性化推荐系统应用及研究
·SNAX系统数据采集研究
·基于DOM的网页净化方法研究
  推荐期刊投稿
·湖南公安高等专科学校学报
·淮海医药
·齐鲁艺苑
·上海轻工业
·山西财经大学学报(高等教育版)
·工会博览(社会版)
·?步逃?/a>
·安全生产与监督
·中华建设
·小学生作文辅导(快乐语文版)
 
·湖南大众传媒职业技术学院学报
·中华物理医学与康复杂志
·市场周刊
·三江学院学报
·建材与装修情报
·内蒙古草业
·实用中西医结合临床
·上海人大月刊
·天津人大
·人生与伴侣(下半月版)
 
·改革先声
·江苏电机工程
·搏击
·当代生态农业
·四川粮油科技
·China Standardizatio
·江苏保险
·重庆科技学院学报(社会科学版)
·家用电器
·武警工程学院学报
   免费论文
公共管理 | 法学 | 理学 | 医药学
政治 | 社会学 | 文学 | 艺术 | 哲学
工学 | 计算机 | 文化 | 英语论文
经济学 | 财政 税收 | 证券金融
管理学 | 会计审计 | 工商管理 | 教育
财务管理 | 论文写作指导 | 应用文
   收费论文
马列毛邓 | 哲学宗教 | 社会科学
政治法律 | 军 事 | 经 济
文化科学教育体育 | 语言文字
文学 | 艺术 | 历史地理 | 自然科学
数理化 | 天文 | 生物科学 | 医药卫生
农业科学 | 工业技术 | 交通运输
航空航天 | 环境安全
   浏览历史

联系论文网 | 收费论文 | 发表论文 | 论文翻译 | 友情链接 | 全部分类 | 网站地图 | 期刊导航
版权所有 2008-2018 论文天下 www.lunwentianxia.com 京ICP备08104503号