首页

基于视觉信息与DOM树的Deep Web数据获取方法研究 06月30日

【摘要】近年来,随着互联网信息的迅速膨胀,数据的商业价值不断地被挖掘出来,以提供增值服务,例如评论分析、元搜索、比较购物、大数据应用等,这些都是建立在DeepWeb数据获取与数据集成基础之上。随着越来越多与领域相关且具有高质量信息的后台数据库的涌现,DeepWeb数据获取与集成依然是个比较热门的研究方向。为了有效地提取目标数据库中的数据元组,以及抽取动态页面中的结构化数据,本文将从以下几个方面进行 […]

【论文下载 - 中国知网/万方数据/维普/读秀/超星/国研/龙源/博看等资源库】

基于视觉信息和DOM树的Deep Web数据自动抽取 10月04日

【摘要】随着互联网的飞速发展,其中已蕴含了海量的信息资源,涵盖了现实世界的各个领域。相对于SurfaceWeb,DeepWeb蕴含着更丰富的数据、拥有更多的访问量和更快的增长速度。但是DeepWeb页面是动态生成的,难以被传统搜索引擎索引到。因此,如何有效地获取和利用DeepWeb页面的数据成为一个重要的研究方向。DeepWeb数据通过查询结果页面表现出来,但是网页中的数据形式各异、缺乏结构性,便 […]