| OLAP是“最终使用者对大规模企业数据直接获取,能动性进行信息分析的过程”。OLAP相关定义中FASMI(Fast Analysis of Shared Multidimensional Information)最为人们熟知,文字的意思就是“共享多维信息的快速分析环境”。OLAP系统的目的是使使用者对企业全方位状况理解和支持企业的决策。
1:OLAP 概要 OLAP是“最终使用者对大规模企业数据直接获取,能动性进行信息分析的过程”。OLAP相关定义中FASMI(Fast Analysis of Shared Multidimensional Information)最为人们熟知,文字的意思就是“共享多维信息的快速分析环境”。OLAP系统的目的是使使用者对企业全方位状况理解和支持企业的决策。 OLAP这个单词是被称作关系型数据库之父的E.F.Codd于1993年提出的。他于70年代末期提出的关系型数据库适合于OLTP系统,但不适合OLAP系统,所以他主张提出新的模型。在这个新的主张中,他这样提出:在长时间中,企业已经储存了大量的数据,但这些数据怎样有效的使用?在激烈的竞争中,企业的数据是非常重要的战略,这种数据有效的应用成了企业竞争优势,这种认识越来越强烈。 • OLTP OLAP • 原始数据 导出数据 • 细节性数据 综合性和提炼性数据 • 当前值数据 历史数据 • 可更新 不可更新,但周期性刷新 • 一次处理的数据量小 一次处理的数据量大 • 面向应用,事务驱动 面向分析,分析驱动 • 面向操作人员,支持日常操作 面向决策人员,支持管理需要
OLAP是90年代中期和数据仓库概念一起在企业的全体构造中提出的。OLAP的核心是多维分析,是数据仓库分析的根本。最近,CRM和SCM等热烈的进行中,对OLAP和BI关心的企业越来越多。可以这样认为:OLAP和BSC(Balance Scorecard),BPM(Business Performance Management),RA(Risk Assessment),EWS(Early Warning System)等一定要一起存在。 2:OLAP研究 MIS领域中OLAP不是理论性的研究,而是实用性的研究。这种研究和80年代初提出的决策支持系统(DSS)的失败不同,可以这样解释:用新的技术对信息进行分析,对企业内分配的电算化努力。或者:组织内的分析过程的活性化努力。 2.1 多维模型和多维数据库 我们从OLAP相关的研究中最核心的机能--多维模型的研究开始。多维模型1983年由美国Crandall博士最早提出,他把数据业务结构,业务规则一起储存的系统叫做--W系统。 还有这领域中留下很重一笔的研究的是阿伯软件公司在1994年研究开发的叫S-BASE的多维数据库,这家公司虽然现在被海波龙公司合并,但当时推出了唯一的服务器用多维数据库。 多维数据库是:DSS机能内藏的数据库。或者:为分析过程而设立的数据库。这种数据库可以多角度多侧面的反应企业的经营环境,提供业务结构化的框架。 多维数据库虽然是一个生疏的用语,但它是维数(Viewpoint)维数中的项目(Viewpoint Member)变数(Variables)和时间(Periods)。企业事务的多维模型分析的时候,大体上事业部,生产地区,产品,市场区分,销售渠道等作为维数设置,主要变数是实际和计划的销售额,费用,利润等差不多的账目科目,运输量,库存,人数等等。 多维数据库作为数据间的关系的一体化和时间化的工具,对数据间的模式的理解有很大帮助。或者提供为了调查问题的来源而对数据进行深层的分析,钻取(Drill-down) 和What if ,Goal seeking等技能,这样,使用者可以从各个角度对问题进行分析。 2.2 Codd 和OLAP功能的研究 70年代末发表了12个关系型数据库的原则的Codd博士,1993年又发表了OLAP的12的法则。他不是把它作为关系型数据库的一个分支,而是把它选定为最终使用者主业务信息的必要的过程。它的核心在于多维立方体,C/S环境的支持,直观的数据块和多个使用者。 Codd博士的研究是接受了一个软件公司的经费后进行的,所以在发表的论文中有很多与之相关的论谈。但是,对OLAP关心的企业在OLAP服务器开发中,所使用的评价就是这12法则。 以下是OLAP必要的项目及区分: 表2 基本要素 | 多维概念 提供直观的数据处理 存储能力 提供事前的计算 多样水准的OLAP分析模型 C/S 构造 透明性 多用户 | 特殊要素 | 不规则的数据处理 OLAP 的结果可以存贮 提取大范围的价 处理大范围的价 | 提问要素 | 问题的相关性 回答提问的一贯性 物理的水平自动修正 | 维 | 维的同等性 没有限制的维和水平 没有限制的维的处理 |
准则1 OLAP模型必须提供多维概念模型 准则2 透明性准则 准则3 存取能力准则 准则4 稳定的报表性能 准则5 客户/服务器体系结构 准则6 维的等同性准则 准则7 动态稀疏矩阵处理准则 准则8 多用户支持能力准则 准则9 非受限的跨维操作 准则10 直观的数据处理 准则11 灵活的报表生成 准则12 非受限的维与维的层次 3:OLAP和多维模型 3.1多维模型 企业的信息系统中数据库的第一个作用是各种业务发生的数据的存储器的作用。企业业务人购买,生产,流通和销售中发生的数据,服务业务中的市场,计划,会计发生的数据,现在在网络销售中销售和市场渠道中新的形态的数据的产生,新的数据库也出现了。 现在数据库不仅是数据的收集,而且有了新的作用,数据仓库是这种作用的代表。数据仓库可以说是现在经营战略和市场战略必须的一部分,数据库中内包的多维性就是可以多维分析的一种变化,即多维模型。 为了数据分析业务的全体结构化,存在两种模型的方法。一种是维模型(Dimensional modeling),一种是多维模型(Multi-dimensional modeling),全体多维数据的构造,都是用立方体(超立方体和多维立方体)方式表现。立方体由轴和坐标组成,我们可以这样理解:轴为维,坐标作为维的项目。维是使用者信息分析时,与一个使用者认为分析观点相类似的项目的集合。后者是关系型数据库中一般的模型方式,事实表和维表构成的星型模式和雪花模式。 3.2 多维模型的构成要素 OLAP的核心是多维信息分析,为了支持多维分析我们来建造多维模型。多维模型根据不同的OLAP工具,他的用语也不同,商务地区,商务概论,决策支持系统等,由于没有标准,我们在这里只是用OLAP技术的概念。 多维模型最基本的构成要素是维,维又分层构造和项目。维的项目中存有多种商业的关系。图1
|