在公司和企业里一般会有很多的业务系统,比如像销售、财务的、人资等各个部门都有自己为了开展工作或业务需要的系统,正常每个部门的系统都是独立的,如果确实需要别人系统里的数据也是做一个接口来访问,互相之间的数据交互很少,无法从公司整体情况拉通来看数据的价值,所以数据仓库就是为了解决这个问题,把企业所有源系统的数据经过统一的规范同步到一个数据仓库系统里,统一管理和定义企业的数据口径,提供全面的数据供分析人员分析,解决各业务系统数据孤岛问题。如下图所示:
在上面的图中,我们需要了解几个主要的概念
ETL
:
Extract-Transform-Load
,即从数据的源端经过抽取
-
转换
-
加载到目标端,这是数据仓库建设最重要的工具,需要他把公司的所有源头数据
ETL
到数据仓库中。如下图的
3
个系统对性别的定义不一样,
A
系统:男或女;
B
系统:
1
或
;
C
系统:
M
或
F
,哪么需要
ETL
工具转换统一的规则到数据仓库里(
1
或
)。
元数据:在数据仓库里,为了区分各个来源系统的数据定义,所以需要元数据来定义各个来源的数据,比如
A,B
系统里都有一个叫销售金额的数据(一个是国内市场,一个是海外市场),哪么在数据仓库里要能区分这个销售金额,以及他们的来源。他们的单位,加载时间等等。
事实表:表示企业发生的一个真实的业务数据,比如销售一个产品就要记录一条数据到事实表里,事实表里有
2
个组成部份,维度和度量,哪么在销售一个产品事实表里维度信息会有:销售员、部门、日期、客户名、产品等,度量信息有:金额、数量等。
维度表:对事实表里的某一个维度的扩展定义,比如上图的日期维度,哪么我们在此基础上需要做一些扩展方便以后做数据分析使用,目前还只是到了日期天,哪么我们可以扩展到周、月、季、年、上半年、下半年等。
1-dw_数据仓库
来源:这里教程网
时间:2026-03-03 13:36:26
作者:
编辑推荐:
- 1-dw_数据仓库03-03
- 2011-10-14 对变量的引用03-03
- 2-dw_事实表、维度表03-03
- [20190506]视图嵌套与绑定变量.txt03-03
- EBS输出报表文件名/内容乱码设置03-03
- ORA-27492 无法运行作业,调度程序不可用03-03
- ORACLE下如何获得全部的索引创建语句03-03
- [20190507]sga_target=0注意修改_kghdsidx_count设置.txt03-03
下一篇:
相关推荐
-
雷神推出 MIX PRO II 迷你主机:基于 Ultra 200H,玻璃上盖 + ARGB 灯效
2 月 9 日消息,雷神 (THUNDEROBOT) 现已宣布推出基于英
-
制造商 Musnap 推出彩色墨水屏电纸书 Ocean C:支持手写笔、第三方安卓应用
2 月 10 日消息,制造商 Musnap 现已在海外推出一款 Oce
热文推荐
- 1-dw_数据仓库
1-dw_数据仓库
26-03-03 - 2-dw_事实表、维度表
2-dw_事实表、维度表
26-03-03 - [20190506]视图嵌套与绑定变量.txt
[20190506]视图嵌套与绑定变量.txt
26-03-03 - Oracle 18c
Oracle 18c
26-03-03 - ipad协议源码安卓协议源码
ipad协议源码安卓协议源码
26-03-03 - Debian服务状态监控(新手入门指南:轻松掌握Linux系统服务运行状况)
- 转自数据云-----架构师眼中的高并发架构
转自数据云-----架构师眼中的高并发架构
26-03-03 - 掌握Debian系统运行状态(详解uptime命令查看系统运行时间)
掌握Debian系统运行状态(详解uptime命令查看系统运行时间)
26-03-03 - Oracle里面的外连中where和on之后and有啥区别
Oracle里面的外连中where和on之后and有啥区别
26-03-03 - oracle-rac出问题需要重装,自动清理安装痕迹脚本
oracle-rac出问题需要重装,自动清理安装痕迹脚本
26-03-03
