设计
根据每个业务部门的特定报告和分析要求定制数据仓库概念设计主题领域。
在尝试构建数据仓库以获得最佳性能时,需要考虑几个关键领域:硬件配置、逻辑和物理数据模型以及工作负载管理。商业智能环境将包括分析、报告和 ETL(提取、转换和加载)工具以及带有一个或多个数据集市的数据仓库,以创建一个有效的商业智能系统。
概念设计是让每个业务部门都有自己的主题领域,以满足他们的报告和分析要求。下面的简单图表显示了如何通过 ETL 流程每天提取、转换和加载源数据到数据仓库的基本设计。
每个主题区域都使用最近加载的数据进行更新,并可供用户使用。已按预定时间表分发和交付的报告被发布,最后,用户可以使用前端工具执行临时报告和自定义分析。
数据仓库提供的一项重要功能是开发每月、每周、每季度和每年使用的报告,并在预定时间将它们自动推送到您的电子邮件收件箱。不再需要不断地重新创建或重新运行这些类型的标准报告。
下图还提供了如何构建概念架构的示例。
数据仓库建立在三层架构之上。每一层都可以独立管理和扩展,增加了灵活性。因此,单个组件可以轻松扩展并高度可用。
三层架构由以下几层组成:
数据层
o 存储数据仓库数据
o 处理数据仓库 ETL 流程,在该流程中,所有源数据都被提取、清理、转换和加载到数据仓库中。
应用层
o 这是构建所有商业智能的地方。
o 处理所有用户请求。
表示层
o 图形用户界面允许:
– 报告
– 分析
– 询问
– 记分卡
– 短跑登机
– 事件管理
– 用户管理
下图描述了应用层、表示层和数据层的设计。构建数据仓库所需的三层不仅旨在展示如何构建基础架构,还展示了流程。业务用户或“分析师”是需要执行查询、运行报告和查看仪表板的人,这些仪表板将显示做出业务决策所需的统计数据。所有这些都显示在“演示层”中。
“应用层”旨在显示商业智能工具和硬件所在的位置。商业智能工具包括前端报告工具,例如 Cognos、Microsoft 数据仓库工具、Microstrategy 或其他工具。
“数据层”旨在显示数据源所在的位置。这可以是输入数据仓库的内部或外部源。数据库服务器和 ETL 服务器也位于这一层。ETL 工具用于获取输入系统的数据并将数据转换为有意义的信息。了解将要处理的数据量以及每年数据增长的百分比非常重要,因为所有这些都会影响系统性能。
Laura Paoletti 拥有计算机信息系统理学学士学位,并曾担任 NBC-Universal 和 Disney ABC 电视台的信息技术副总裁。她还曾在 Ernst & Young LLP 的技术实践部门任职。在她的职位上,她一直负责应用程序、基础设施和数字媒体。她的一些显着成就包括数字媒体、营销、金融、制造(供应链)、销售和消费品应用程序的实施;企业数据仓库/商业智能系统的实施;数据中心管理,包括硬件、存储策略、数字图书馆和数据中心扩展;设立项目管理办公室;从磁带到无磁带环境(数字媒体)的业务转型。