摘 要:面对大数据信息,现代企业经营管理如何快速精准地获取一条有重要参考价值的信息,提高企业有效决策的准确性,提升企业的市场竞争力。本文主要从业务功能角度,通过一个医药零售行业的案例,展示了从需求分析、系统设计、系统实现等作业流程,特别是详细描述了ETL工具的设计与开发。
关键词:BI系统;数据挖掘技术;企业信息化经营
中***分类号:TP311.13
随着大数据时代的来临,通过信息化手段对企业实现精细化的管理,是提高企业核心竞争力的重要手段。在企业飞速发展的同时,会产生大量的数据信息,而这些重要的信息一般都分布在ERP(企业资源计划系统)、MIS(基本业务系统)、CRM(客户关系管理系统)、SCM(供应商管理系统)、WMS(仓储自动化系统)、HRS(人力资源管理系统)等各自相对***的业务系统中,当企业想要获取一条参考信息时往往需要在多个系统中来回查询,导致企业为得到一条有用信息的会浪费大量的人员和时间。因此是否拥有一套精准的数据分析、快速的数据挖掘系统已成为衡量传统企业与现代企业的重要标准。
统计表明,目前大多数企业对数据进一步的整合利用率及效果都很低,国内企业数据有效利用率不足7%,因此充分挖掘隐藏在企业数据资产中的信息和知识,有效提高企业决策准确性也是BI系统产生的重要原因。
1 国内外现状
商业智能概念最早是由IBM公司在1998年提出的,在2000年2月,IBM围绕商业智能正式推出了企业级的启动计划,目前已形成自己的BI系统。商业智能(Business Intelligence,简称BI)是能够帮助用户对经营数据做出科学决策的工具,它充分利用现有的业务信息,借助现代信息技术,提取和组织有用的信息,帮助用户在加强管理和业务发展方面做出及时、正确的决策。
2 关于BI系统在零售行业中的应用
对于BI系统的使用,几乎每个企业都非常需要,但在竞争激烈的零售行业表现尤为明显,比如零售行业的商品部门针对商品的决策、销售的决策,人事部门针对人员绩效的决策,财务部门针对财务预算的决策,促销部门针对会员的决策、促销方法的决策,以及公司对于销售情况的总结和分析都有着至关重要的作用。下面我们来详细描述一下如何设计一套BI系统解决零售业态中的大数据分析问题:
2.1 项目实现背景
某大型医药连锁企业,现有门店近百家,员工1000多人,公司要求总部每天通过各门店的销售数据、库存数据等信息,对下面的15项参考指标进行综合分析,并提供环比和同比的趋势***,保证公司营销决策的正确制定。
2.2 项目实现指标
2.3 项目实现难点
(1)跨系统、跨平台提取数据。
(2)基础数据量巨大,无法直接使用。
(3)数据挖掘占用硬件资源大,无法再工作时间内进行。
2.4 项目解决方案
2.4.1 建立BI系统的数据仓库
数据仓库之父W.H.Inmon对数据仓库的定义:数据仓库是支持管理决策过程的、面向主题的、集成的、稳定的、不同时间的数据集合;
(1)通过和项目客户沟通,考虑到BI服务器系统为windows平台,以及后期维护的便利性,选定后台数据库环境为SQLSERVER 2005。
(2)确定数据结构。主要参考因素:1)操作出现的频率;2)在系统中需要保存多久的数据;3)用户查询数据的主要方式;4)用户所能接受的响应时间是多长、是几秒钟,还是几小时。
客户具体需求:
2.4.2 完善BI系统的ETL(数据挖掘)解决方案
数据预处理是整合企业原始数据的第一步,它包括数据的抽取(Extraction)、转换(Transformation)和装载(Load)三个过程(即ETL过程);建立数据仓库则是处理海量数据的基础;数据分析是体现系统智能的关键。数据挖掘的目标则是挖掘数据背后隐藏的知识,通过关联分析、聚类和分类等方法建立分析模型,预测企业未来发展趋势和将要面临的问题。
ETL过程如***所示:
***1
2.4.2.1 数据抽取
经过调查,目前客户原有业务系统中使用了SQL SERVER2000和SYBASE两种后台数据库,考虑到用户今后接口的便利性,数据的抽取方式采用:前端通过SQL2005中视***调用ODBC数据源读取SQLSERVER2000中的数据,通过视***调用OLE DB数据源读取SYBASE中的数据,后端通过SQL2005定时作业机制每天定时从两种数据库环境中挖掘数据,具体方式如下:
(1)配置OLEDB数据连接源。
(2)配置ODBC数据连接源。
(3)在SQL2005数据库中建立数据查询视***。
提取客户资料
CREATE VIEW [dbo].[sybase_cus_xs_v]
AS
select
space(11) as wldwid,
cusid as wldwbh,
cusdes as wldwname,
'是' as beactive,
'否' as isjh,
'是' as isxs,
srtcde as pym,
isnull(bnk,'') as kaihyh,
taxno as shh,
isnull(idno,'') as idcard,
isnull(ldr,'') as frdb,
isnull(adr,'') as dzhdh,
isnull(lnkpsn,'') as lxr,
isnull(mobtel,'') as lxshj,
isnull(tel,'') as lxdh
--into sybase_pf_wldwzl_xs
From SYBASE02.test.dbo.cus where isstp='n' and cusclsid'00'
提取商品资料
提取销售数据
2.4.2.2 数据转换
转换销售数据
drop table #gxywkphz
select d***h,rq,ontime,wldwbh,hsje,je,she,shouhr,lxshj into #gxywkphz
From [IP].sybase.dbo.gxywkphz_v a
转换商品资料
转换客户资料
2.4.2.3 数据装载
装载客户资料
Insert into ERP_YPPF.dbo.wldwzl(jigid,wldwid,wldwbh,wldwname,beactive,isjh,isxs,pym,kaihyh,shh,idcard,frdb,dzhdh,lxr,lxshj,lxdh) values
select '000' as jigid,wldwid,'X'+rtrim(wldwbh),'(X)'+rtrim(wldwname),beactive,isjh,isxs,pym,convert(varchar(40),kaihyh)as kaihyh,shh,idcard,frdb,dzhdh,lxr,lxshj,lxdh
from #wldwzl
装载商品资料
装载销售数据
2.4.2.4 ETL自动执行方案设置
(1)建立自动执行的存储过程--统计门店商品销售信息(按日期)。
CREATE PROCEDURE [dbo].[JCR_XXB_MD_SPXSHZ_RQ]
AS
declare @day int,@s_rq char(10),@e_rq char(10)
set @day=60
set @s_rq=convert(char(10),getdate()-@day,21)
set @e_rq=convert(char(10),getdate()-1,21)
insert into XXB_MD_SPXSHZ_RQ(rq,spid,shl,hsje)
select a.rq,b.spid,sum(b.shl) as shl,sum(b.hsje) as hsje
from gxywhz a(nolock) inner join gxywmx b(nolock) on a.d***h=b.d***h
where a.d***h like 'XHC%' and a.djlx in ('X49','X62')
and a.rq between @s_rq and @e_rq
and not exists (select 1 from XXB_MD_SPXSHZ_RQ c(nolock) where c.rq=a.rq and c.spid=b.spid)
group by a.rq,b.spid
(2)建立SQL自动作业计划。
2.4.3 OLAP服务器(联机分析处理)
OLAP系统,主要由OLAP引擎、方案定制模块和结果查询模块三大部分组成。OLAP引擎用来生成立方体,并对立方体进行钻取、切片、切块和旋转等操作;方案定制模块主要用来生成用户自定义的方案元数据并调用OLAP引擎的立方体生成功能;结果查询模块主要用来对已定制的立方体进行各种操作以及调用OLAP引擎功能来实现数据挖掘。具体操作步骤如下:
(1)数据准备。通过数据“过滤”对数据进行优化选择,使得抽取出来的数据可以方便地用于建立数据立方体。
(2)数据立方体建立。采用CUBE运算进行数据立方体的构建。数据仓库的核心是数据立方体,数据仓库中所有的决策分析都需要在数据立方体上运行。
(3)构建分析模型。采用Mondrian引擎构建分析模型、设置指标、设计维度、定义计算指标、模型分区设计、并实现模型操作应用设计,定义多维数据集存储模式、多维数据集的聚合策略以及多维数据集的处理操作等。
(4)保存及调用查询结果。将Mondrian引擎建立的立方体数据查询结果保存在XML文件中,下次查询时直接调用即可。
2.4.4 前端UI展现
系统采用B/S架构和C/S架构相结合的模式,数据库设计采用可视化数据库集成开发工具Powerdesigner,利用XML语言实现维度的分层定义,使用MDX语言通过编码实现多维查询,并返回查询结果;通过WEB服务器、OLAP服务器使得客户能够方便的通过浏览器看到BI系统多角度的展示结果。
本文主要从业务功能角度,论述了BI系统的运营分析和系统搭建的理论。并通过一个医药零售行业的主题案例,展示了从需求分析、系统设计、系统实现等整个作业流程,特别是详细描述了ETL工具的设计与开发,为保证客户后期系统的运行效率打下了良好的基础。
参考文献:
[1]周瑾.我国商务智能研究[J].现代管理科学,2007:44-45.
[2]熊忠阳.面向商业智能的并行数据挖掘技术研究[D].重庆大学,2004.
[3]刘同明.数据挖掘技术及应用[M].北京:国防工业出版社,2001.
[4]顾永才.企业信息化运营[M].北京:同心出版社,2000.
作者简介:陆朝珍(1981.01-),女,四川成都人,讲师,学士学位,研究方向:数据库、数据挖掘技术。
作者单位:成都市技师学院,成都 611731
转载请注明出处学文网 » BI系统在企业管理中的应用