
数字热本与变用
电信行业数据仓库逻辑模型构建研究
陈立勇于来行
(河南省周口师范学院计算机科学与技术学院河南周口466000)
应用研究
摘要:近要年,我国电信行业数据仓库的发展迅速,作为数据仓库中的一个关键的环节,数据仓库逻辑建模就显得越来越重要。文章以我四电信行业数据仓库发展的背景为基础,依据数据仓库逻辑建模的原则,深讨了我四电信行业企业级数据仓库模型构建中的几个关键的部分,并结合事例对各部分进行了描速,为数据仓序工作者重构了一个数据仓库逻辑建模的过程。
关键调:数据仓库逻辑模型维度建模
文献标识码:A
中图分类号:TP311.13
文章编号:1007-9416(2012)07-0099-02
随着信息技术的飞遵发展,电信行业经营分析数据越来越庞大,伴随着数据的急剧增加,人们对数据处理的要求也在不断的提高,数据仓库的构建在企业运营的过程中正越来越受到重视。由于电信行业中各企业的非常业务复杂,数据也非常庞大,所以在构建电信行业企业级数据仓库的过程中就必须要注意在满足不同用户需求的同时也定要兼顾系统运行的效率以及后期的可扩展性。这样构建的数据仓库才能更加适应企业的需要以及时代的发展,而要想构建一个令人满意的数据仓库,数据仓库逻辑建模就起到了非常重要的作用。
1、数据仓库逻辑建模的原则
模型可以帮助我们更加明白的了解业务需求,是在企业分析完业务需求之后所做的第一步工作,也是数据仓库中非常重要的一个环节。由于电信行业业务复杂,数据庞大,所以数据仓库的逻辑建模显得尤为重要,在进行数据仓库逻辑建模的过程中,必须要以以下儿点为原则:
1.1操作的简单性
由于数据仓库最终的用户不一定具有较高的计算机操作能力,因此数据仓库创建后对于使用过程应该具有直观,简单的特点,使得非计算机专业的人员也应该很容易的来获取自已想要的数据。
1.2业务的全面性
业务应该能够满足不同用户的不同需求,对于同一类用户,应该能够提供全面的业务分析展现,使用户能够自由的访问自已需要的数据。
1.3高效率原则
对于数据获取的过程,应该尽可能的缩短访间的时间,在短时间内将用户需要的数据展现给用户,提高用户的感受度。所以在逻辑建模的过程中应该注意以下几点:
(1)增加适当的允余来提高系统的响应速度。(2)尽量避免多个大数据量的表间连接。
(3)尽量避免大范围的数据扫描。(4)充分考虑可扩展性。
由于电信行业业务的复杂多变,在数据仓库逻辑建模的过程中要充分的考虑电信业务后期的变化,即逻辑建模时要充分考虑系统的可扩展性。
2、电信行业企业级数据仓库模型的构建
常用的数据仓库逻辑建模主要包括三范式建模和维度建模,三范式建模偏向于数据的存储,是围绕主键与于其它属性之间的关系面作出的建模,维度建模偏向于数据的分析,如常见的星型模型建模,它是以事实表为中心,周围关联很多维表。三范式建模和维度建模各有优缺点,根据电信行业业务的复杂性和庞大性,为提高企业数据的处理效率和数据分析的灵活性,以及后期数据仓库的可扩展性,本文采用维度建模的方式进行分析,系统部分模块的模型如围
1所示。
随素日份电路速率维表电路速军编号电路速率产品城光产品编号产品名称
电器开通事实素 FLOW_ID 电路开通A间中器冻率 A编鲨 A漏城市 A编区城电器炎型产品典型客户名称
南北区城维表南北区城编号南北区城名称
临维来省编号省名称
南北区城编号魏市缝票地市端编号地市名称备编号
图1电路开通模块星星模型结构图
系统数据仓库的逻辑建模可分为以下几个步骤来执行。 2.1确定主题
从大的模块上来说,系统分析的主题包括业务主题,客户主题,其中业务主题包括企业提供的各种复杂的业务,业务的开通取消情况,业务的生效情况,业务的收费情况等,客户主题主要包括客户的基本情况,客户订购的业务信息,客户订购业务产生的费用信息,以及企业为客户提供的服务信息等,图2列出了系统主题间的关系
富产基本他息惠产业各营息
客产主题
高产费用信息
使用供应
业中服
图2系统主题划分关系图
2.2确定度量
业务费量息监务生款值息业各心费息
度量即分析的指标,是数据仓库中数据分析结果的直接体现,它决定着数据分析的结果是否符合业务需要,对企业的决策支持起着非常重要的作用,因此度量的确定也是非常重要的。
以客户基本信息为例,包含的度量值主要为客户过,客户姓名,客户年龄,客户电话,所在区域,所在行业,客户类别等信息。通过这些信息能够为客户的流失分析及客户营销分析提供基本的资料,当然还有一些度量是需要通过计算得到的,如客户的平均收人,客户的平均消费等,这些需要计算的度量在数据仓库的分析中也是非常常用的。
2.3确定短度
粒度是数据仓库中保存数据的细化程度,并与细化程度成反比,细化程度越高,粒度级别就越低反之越高。粒度的划分将影响数据仓库中的数据分析操作,例如以区域为例,如果区域的划分只
.··下转第102页
99