移动平台上基于内容的图像检索系统的研究与实现
【摘要】随着互联网的快速发展,信息处于爆炸式的增长状态,如何组织如此庞大的信息,并使得人们能够轻易找寻到自己所需的信息日渐成为了热点课题之一。由此衍生出了现在广泛使用的各种搜索引擎,如百度、谷歌、必应等等。图像检索也是搜索引擎的一部分。早期大部分的图像是采用手工标注的方式来建立索引,存在着效率低,主观性等等缺陷。随着数据量的日益增长,这类方法显然已经不能满足需求。TBIR(基于文本的图像检索)要求图像上传者对图像进行给出必要的标注,系统按照标注对图像进行存储索引,然后搜索引擎通过检索技术查找出和用户提供的关键字相近的图像。目前大部分图像检索系统大多采用此种方法,如百度和谷歌,不同的是它们图像的来源是依靠爬虫系统的采集而非人工的标注,能自动完成图像及其标注的提取。但由于此种方法完全没有考虑图像内容的本身,过度依赖于用户提供或者采集来的关键词,所以图像检索结果的正确性无法保证。于是CBIR(基于内容的图像检索)被提出,并得到了广泛的关注。这种检索方式是通过提取图像的底层特征,并用图像特征间的相似性来得到最终结果。近年来智能终端日益成熟和移动网络的普及,由于其便携性和易于使用,使得人们更加容易获取到想要的信息。当前的图像检索大多数基于个人电脑平台,移动平台的图像检索由于满足人们的多样化搜索习惯也将会得到迅速的发展。本文力求构建一个小型的商品图像检索系统,并将其拓展到移动平台,通过移动平台拍摄或传输商品图片而获得相关信息。本文的工作和创新点如下:(1)构建了一个针对淘宝和天猫的网络爬虫系统,用于采集商品图片和相关的信息,并对采集性能上进行了一定程度的优化。将图像特征提取算法移植到安卓平台,使得其能在手机上直接进行特征提取,通过拍摄的商品图像,直接返回网店链接和相关的商品推荐。(2)对于120万左右的图片进行特征提取,采用了位置敏感哈希LocationSensitiveHash,LSH),并结合TF-IDF(Termfrequency-inversedocumentfrequency)的方法,与效果较优的线性搜索相比,既保证了结果在较小的误差范围内也极大的降低了时间复杂度。
【作者】余黎青;
【导师】赵鹏;
【作者基本信息】安徽大学,软件工程,2014,硕士
【关键词】图像搜索引擎;爬虫系统;全局特征;LSH;结果重排;移动平台;
【参考文献】
[1]曹江卫.矿用自卸车车厢的力学特征及优化设计研究[D].辽宁工程技术大学,车辆工程,2012,硕士.
[2]闫帅.井壁接茬钢板—膨胀混凝土粘结面的渗透机理与抗渗性能[D].中国矿业大学,岩土工程,2014,硕士.
[3]黄龙.成本领先战略在科龙集团的应用[D].西南财经大学,工商管理,2003,硕士.
[4]赵勇.解吸附电晕束质谱法中分子间离子化效率抑制研究[D].湖南师范大学,分析化学,2013,硕士.
[5]裴林娟.Nb_2O_5掺杂TiO_2纳米管/ZSM-5复合材料的制备及光电催化性质研究[D].哈尔滨工业大学,化学工程与技术,2014,硕士.
[6]许平平.胰十二指肠切除术后出血危险因素的meta分析[D].山东大学,外科学(专业学位),2013,硕士.
[7]范燕飞.特殊普通合伙制下的会计师事务所行为研究[D].浙江财经学院,会计学,2013,硕士.
[8]刘鸿雁,曹艳丽,田军,戴君虎,田育红,崔海亭.山西五台山高山林线的植被景观[J].植物生态学报,2003,02:263-269.
[9]张晗.分布式数据仓库查询模块的设计与实现[D].北京交通大学,软件工程技术(专业学位),2013,硕士.
[10]楼希澄.一种系统误差检测方法——误差投影法[J].自动化学报,1986,02:168-173.
[11]王德勇.P-Akt和P-mTOR在口腔鳞状细胞癌中的表达及临床意义[D].蚌埠医学院,肿瘤学,2013,硕士.
[12]谢颖霞.论我国民事诉讼专家辅助人制度[D].中国政法大学,诉讼法学,2014,硕士.
[13]朱迎春.基于有效教学的教师专业发展研究[D].西南大学,课程与教学论,2013,硕士.
[14]李晓东.单质铜催化下C-S偶联反应合成硫醚的反应研究[D].西北师范大学,有机化学,2013,硕士.
[15]赵现明.豆类胰蛋白酶抑制剂的提取分离及纯化[D].哈尔滨工业大学,食品科学与工程,2013,硕士.
[16]邹李航.上市公司资产减值信息传导效应研究[D].西南大学,会计学,2014,硕士.
[17]殷开成.服装疵点检测的数字化表征[D].东华大学,2014.
[18]诸婉婧.开放条件下中国金融发展与产业结构调整的关系研究[D].海南大学,世界经济,2014,硕士.
[19]曹刘.对外汉语中级口语教学设计[D].吉林大学,汉语国际教育(专业学位),2014,硕士.
[20]程王琨.猪嗜血支原体阻断ELISA抗体检测试剂盒组装及汉赛巴尔通体间接ELISA方法的建立[D].南京农业大学,预防兽医学,2013,硕士.
[21]孙洪涛.公路工程投标报价策略研究[D].天津大学,工业工程,2004,硕士.
[22]付波.基于GPU的SIFT和SURF算法的研究与实现[D].广东工业大学,计算机科学与技术,2014,硕士.
[23]苏国梁,张道明,潘一忠.数字化电气监控管理系统的探讨[J].内蒙古电力技术,2003,05:21-24.
[24]王志.基于需求调查的唐山市乡镇基层公务员激励机制研究[D].西南交通大学,公共管理(专业学位),2014,硕士.
[25]陈伟娜,卫潇洒,赵松涛.建筑工程绿色施工评价指标体系的构建[J].商,2014,12:21-22.
[26]杜运威.杨芳灿及其诗词研究[D].宁夏大学,中国古代文学,2014,硕士.
[27]康文杰.电气石负离子释放材料的制备及性能研究[D].陕西科技大学,材料科学与工程,2013,硕士.
[28]王越.北京永定河生态护岸综合评价研究[D].北京林业大学,水土保持与荒漠化防治,2013,硕士.
[29]贾红英.住院费用控制的理论与实证研究[D].山东大学,社会医学与卫生事业管理,2014,博士.
[30]江杰.兆瓦级碟式太阳能热发电机构可靠性仿真分析[D].湖南大学,动力工程及工程热物理,2014,硕士.
[31]张军,张涌新,郑成航,许昌日,邬成贤,高翔,骆仲泱.复合脱硫添加剂在湿法烟气脱硫系统中的工程应用[J].中国环境科学,2014,09:2186-2191.
[32]许敏武.高校青年教师岗前培训模式研究[D].华中师范大学,高等教育学,2013,硕士.
[33]朱沛.我国上市公司资产结构与企业绩效关系的实证研究[D].哈尔滨工业大学,会计学,2013,硕士.
[34]张龙强,田乃媛.基于炉机匹配的新一代大型钢厂配置研究[J].冶金自动化,2008,03:34-38.
[35]张杰伟.基于支撑向量回归的画像—照片幻象技术研究[D].西安电子科技大学,信号与信息处理,2012,硕士.
[36]应翔.基于Davinci处理器的H.264视频编码器软件设计和优化实现[D].浙江大学,2007.
[37]王征,谈大龙,王向东.网络控制系统稳定性研究[J].控制与决策,2002,S1:802-804+807.
[38]陈伟荣.精益六西格玛在N企业提升听筒一次通过率中的应用[D].西南交通大学,工商管理(专业学位),2013,硕士.
[39]甘盼盼.张觉人教授应用奇恒之府脑的理论治疗脑血管病所致精神障碍的经验探讨[D].湖北中医药大学,中医内科学(专业学位),2013,硕士.
[40]陈教料.温室小气候的建模及其智能控制研究[D].浙江工业大学,机械电子工程,2004,硕士.
[41]郑金荣.天津市医学重点学科信息保障系统[J].医学情报工作,2005,05:334-335.
[42]张晓凤.外来务工人员子女与本地初中生学习动机的比较研究[D].内蒙古师范大学,心理健康教育(专业学位),2013,硕士.
[43]邓海.匝道桥与主线桥连接处受力分析与配筋优化[D].武汉理工大学,结构工程,2013,硕士.
[44]赵晓玲.关注学生心理的高三数学教学初探[D].东北师范大学,教育,2003,硕士.
[45]方浩.数据融合系统中航迹关联与融合算法研究[D].沈阳工业大学,控制理论与控制工程,2013,硕士.
[46]胡姝.江苏滨海潮滩沉积物中还原无机硫和重金属的形态特征[D].复旦大学,环境科学,2012,硕士.
[47]梁田田.三乙醇胺硼酸酯合成及在水基拉延油中应用[D].长春工业大学,应用化学,2013,硕士.
[48]曾妍.时量补语及其对外汉语教学策略[D].吉林大学,汉语国际教育(专业学位),2014,硕士.
[49]王沂瑜.中国影像绘画创作方法研究[D].云南艺术学院,美术学,2013,硕士.
[50]王俊.松辽盆地二氧化碳气层录井识别方法探讨[D].吉林大学,地质工程,2012,硕士.