基于数据仓库的油气资源核心库研究 11月20日
【摘要】为了满足油气资源信息的进一步集成和综合应用,本研究旨在国家级油气资源数据库的基础上建立全国油气资源核心库,以便从各专题油气资源数据库中提取出有价值的数据,辅助进行油气资源的统计、分析和数据挖掘工作。根据以上需求,本研究提出基于数据仓库技术,设计建立油气资源核心库,并对数据仓库进行维度数据分析,从多个角度分析查询数据,提取出数据中隐含的信息。本研究的主要工作和成果如下:(1)研究了数据仓库的 […]
ETL数据处理测试框架的研究与设计 11月09日
【摘要】ETL(Extraction-Transformation-Loading)数据处理测试框架可以实现对ETL数据处理的模拟过程,通过框架测试结果数据与实际ETL处理结果数据进行对比分析,从单条数据的diff(different)到全部数据量的统计,从而达到全方位的对ETL数据处理过程进行测试的目的。ETL数据处理测试框架可以在不了解框架处理细节的前提下,完成对大数据的全面的、可靠的处理任务 […]
商业智能在企业信息管理系统中的设计与实现 10月12日
【摘要】企业级数据仓库的核心是数据,数据治理水平决定了基础数据平台的建设效果和对业务和应用的支持能力。本文通过数据治理满足企业内部对信息的需求,提升企业信息服务的水准,制定相关流程、政策、标准以及相关技术手段,用于保证信息的可用性、可获取性、高质量、一致性以及安全性。数据治理是一项跨系统、跨部门、长期的、渐进式的工作。本文将从企业级的角度,结合数据仓库和分析型应用建设的需要,重点工作放在数据质量检 […]
数据挖掘在证券业CRM系统客户细分模块的研究与分析 10月07日
【摘要】随着世界经济一体化进程的加深以及中国加入WTO,中国的证券业得到了飞速发展。随之带来的竞争也变得空前激烈,传统的“以产品为中心”的竞争模式逐渐变得不能满足客户的需求,“以客户为中心”的服务模式逐渐兴起。客户关系管理系统正是为了满足这种模式而量身定做的,它集成了先进的现代管理理念与数据挖掘等相关信息技术,分析现有客户和潜在客户的需求模式,为企业赢得最大收益。本文首先讨论了将CRM运用在证券业 […]
可视化代谢数据集成系统研究 10月04日
【摘要】本文总结了生物学数据集成研究的现状,对代谢通路数据集成和自动模式匹配的集成方法做了深入的研究和探讨,并结合两者提出了一种全新的基于相似性推导的代谢通路数据集成方法。在此基础上,采用了动态布局的可视化用户界面,建立起一个完整的代谢通路数据集成系统。(1)提出了一种基于相似性推导的代谢通路数据集成方法通过对代谢通路数据特点的分析,结合模式匹配研究中基于结构水平的匹配方法,将Similarity […]
基于MapReduce的海量点击流信息挖掘研究 05月08日
【摘要】随着互联网与电子商务的快速发展,网站产生的点击、商品、交易等数据呈现海量数据式增长。淘宝网(taobao.com)中的页面每天点击超过2亿次以上,商品成交超过5000万次/天。巨大的访问量带来了巨大的浏览记录与交易记录,挖掘这些记录中蕴含的用户信息成为时下网站建设者们最迫切的需求。点击流是用户在一个Session会话内点击URL链接而被记录的访问路径,挖掘点击流数据可以发现商品频繁点击序列 […]
支持快速联机分析处理的视图物化技术研究及应用 10月30日
【摘要】通过OLAP查询可以快速发现数据背后隐藏的信息用以决策分析,但是OLAP查询在执行过程中往往需要对大量的数据进行选择、连接及投影操作,这是一个非常消耗时间及计算资源的过程。为了实现快速联机分析处理操作,可以引入物化视图来解决这个问题。物化视图是保存了预先计算好的查询结果的数据表。有了物化视图的支持,OLAP的查询就不必在原始的数据表上进行复杂的选择、连接、投影等操作,代之以从物化视图中获取 […]
聚类分析算法在HMIS的应用 12月27日
【摘要】随着信息化程度的提升,很多国内医院都建立了自己的医院信息管理系统HIS。具体又可以划分为门诊系统、住院系统、电子病历系统、检查系统、药品管理系统、护理系统、财务管理系统、设备管理系统、查询系统和支持维护系统等。系统当中存储了海量关于医院运营所需的数据,如何能够从这些系统数据中得出管理人员所需要的信息,并不是一件轻易能够达成的事情。医院的管理系统多在查询、财务、药品管理、住院管理方面使用较多 […]
基于ASP.NET技术的银行客户关系分析系统设计与实现 10月31日
【摘要】随着人类社会信息化高速发展,传统银行储户客户关系分析管理方式已经不能满足处理纷繁信息的要求,传统信息管理主要集中于纸面处理阶段,人工手写大量记录、报表和各种信息文件,使得工作变得繁琐与复杂,并且消耗更多时间,最后处理结果并不能正确反映出客观事实。因此,客户关系分析系统的概念酝酿而出。客户关系分析管理(CustomerRelationshipManagement,CRM)是一个不断加强与顾客 […]
基于数据仓库的银行DSB系统设计与实现 06月25日
【摘要】目前商业银行面对互联网金融潮汐一般的冲击,愈发需要提高自身信息技术水平,通过了解掌握每日银行自身最新经营状况数据,以适应先进的管理水平和风险承受能力,快速准确地做出相应决策,应对新时期市场的不断变化。由于银行系统分支复杂,各类数据分布在银行不同的业务系统中,各条线之间数据相互关联而又不统一,为了提高数据分析工作的效率和质量,有效利用数据,挖掘其中有价值的信息。如何解决有效管理和统一各个业务 […]