您的位置:网站首页 > 《中文科技期刊数据库》 > 工程技术 > 自动化计算机 > 计算机应用 > 摘要

基于主题网络爬虫的信息数据采集方法的研究与应用

《电子技术与软件工程》2016年 第7期 | 盛亚如 魏振钢 刘蒙   中国海洋大学信息科学与工程学院 山东省青岛市266100
★ 收藏 | 分享
  • 第1页
  • 第2页
论文服务:
摘 要:互联网上的各种信息以数百万级的方式增长着,而这些信息又大多是散乱分布的,无法满足人们所要求的整合信息分析的需求,传统的采集和收集方法又很难满足要求。因此本文提出利用主题网络爬虫的概念和方法,运用正则表达式去匹配出网页中所需要的特定信息数据,有效的增强爬虫程序的适用性、缩短用户获取信息的时间。并将此方法应用于二手房信息数据采集中,包括价格、户型、楼层等基本数据,建立起了一个统一的二手房数据库。
【分 类】【工业技术】 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工)
【关键词】 主题网络爬虫 正则表达式 二手房
【出 处】 《电子技术与软件工程》2016年 第7期 168-169页 共2页
【收 录】 中文科技期刊数据库