本书主要介绍正常运作的数据仓库对组织的成功是至关重要的,但建设和维护任一数据仓库都会充满难以预料的危险或困难。本书介绍了各种类型、规模和结构的公司都会面临的91种常见疑难及其解决方案。9位数据仓库建设方面的权威专家对这些看似难以应付的危机各抒己见,并给企业管理人员、IT经理与职员以及终端用户提供了防止和拯救这些危机的具体措施。本书的第一篇解决难以应付的各种管理问题,其中包括薄弱的组织支持、不切实际的进度安排和职员配备问题。第二篇重点关注各种技术挑战,比如安全、集成和性能。本书通过实际的示例,从多种角度提供了实用的解决方案。另外,还为希望进一步阅读的读者推荐了大量资源,并在书后提供了覆盖专业词汇与同义词的词汇表及口语词汇表。
第1篇 难以应付的管理情况
第1章 管理问题 (3)
1.1 概述 (3)
1.1.1 数据共享 (3)
1.1.2 成功的评价标准 (4)
1.2 数据仓库的失败历史 (5)
1.2.1 Sid Adelman的观点 (5)
1.2.2 Joyce Bischoff的观点 (5)
1.2.3 Douglas Hackney的观点 (6)
1.2.4 Chuck Kelley的观点 (6)
1.2.5 David Marco的观点 (6)
1.2.6 Larissa Moss的观点 (7)
1.2.7 Clay Rehm的观点 (7)
1.3 IT的消极反应 (8)
1.3.1 Joyce Bischoff的观点 (8)
1.3.2 Douglas Hackney的观点 (8)
1.3.3 Chuck Kelley的观点 (9)
1.3.4 Larissa Moss的观点 (9)
1.3.5 Clay Rehm的观点 (9)
1.4 管理层的频繁变动 (10)
1.4.1 Sid Adelman的观点 (11)
1.4.2 Joyce Bischoff的观点 (11)
1.4.3 Douglas Hackney的观点 (11)
1.4.4 Chuck Kelley的观点 (11)
1.4.5 David Marco的观点 (11)
1.4.6 Larissa Moss的观点 (12)
1.4.7 Clay Rehm的观点 (12)
1.5 来自IT部门的破坏 (13)
1.5.1 Sid Adelman的观点 (13)
1.5.2 Joyce Bischoff的观点 (13)
1.5.3 Douglas Hackney的观点 (13)
1.5.4 Sean lvoghli观点 (13)
1.5.5 Chuck Kelley的观点 (14)
1.5.6 David Marco的观点 (14)
1.5.7 Clay Rehm的观点 (14)
1.6 试制系统必须完美 (15)
1.6.1 Sid Adelman的观点 (15)
1.6.2 Joyce Bischoff的观点 (16)
1.6.3 Douglas Hackney的观点 (16)
1.6.4 Chuck Kelley的观点 (16)
1.6.5 Larissa Moss的观点 (17)
1.6.6 Clay Rehm的观点 (17)
1.7 用户部门不希望共享数据 (18)
1.7.1 Sid Adelman的观点 (18)
1.7.2 Joyce Bischoff的观点 (19)
1.7.3 Jill Dyché的观点 (19)
1.7.4 Douglas Hackney的观点 (20)
1.7.5 Chuck Kelley的观点 (20)
1.7.6 Larissa Moss的观点 (20)
1.7.7 Clay Rehm的观点 (21)
1.8 高级管理层不知道数据仓库团队做什么 (21)
1.8.1 Joyce Bischoff的观点 (21)
1.8.2 Jill Dyché的观点 (23)
1.8.3 Douglas Hackney的观点 (23)
1.8.4 Chuck Kelley的观点 (24)
1.8.5 David Marco的观点 (24)
1.8.6 Larissa Moss的观点 (24)
1.8.7 Clay Rehm的观点 (25)
第2章 改变需求与目标 (26)
2.1 概述 (26)
2.1.1 变动控制 (26)
2.1.2 目标与目的 (27)
2.2 业务系统不断变化 (27)
2.2.1 Sid Adelman的观点 (28)
2.2.2 Joyce Bischoff的观点 (28)
2.2.3 Douglas Hackney的观点 (28)
2.2.4 Sean Ivoghli的观点 (29)
2.2.5 Chuck Kelley的观点 (29)
2.2.6 David Marco的观点 (29)
2.2.7 Larissa Moss的观点 (30)
2.2.8 Clay Rehm的观点 (30)
2.3 源系统经常变化 (31)
2.3.1 Sid Adelman的观点 (31)
2.3.2 Douglas Hackney的观点 (31)
2.3.3 Sean Ivoghli的观点 (32)
2.3.4 Chuck Kelley的观点 (32)
2.3.5 David Marco的观点 (33)
2.3.6 Larissa Moss的观点 (33)
2.3.7 Clay Rehm的观点 (34)
2.4 数据仓库幻想已逐渐破灭 (35)
2.4.1 Sid Adelman的观点 (35)
2.4.2 Joyce Bischoff的观点 (35)
2.4.3 Douglas Hackney的观点 (35)
2.4.4 Chuck Kelley的观点 (36)
2.4.5 David Marco的观点 (36)
2.4.6 Larissa Moss的观点 (36)
2.4.7 Clay Rehm的观点 (37)
2.5 目标遭到曲解 (37)
2.5.1 Sid Adelman的观点 (37)
2.5.2 Joyce Bischoff的观点 (38)
2.5.3 Jill Dyché的观点 (38)
2.5.4 Douglas Hackney的观点 (39)
2.5.5 Chuck Kelley的观点 (39)
2.5.6 David Marco的观点 (39)
2.5.7 Larissa Moss的观点 (40)
2.5.8 Clay Rehm的观点 (40)
2.6 原型变成产品 (41)
2.6.1 Sid Adelman的观点 (41)
2.6.2 Joyce Bischoff的观点 (42)
2.6.3 Douglas Hackney的观点 (42)
2.6.4 Chuck Kelley的观点 (43)
2.6.5 David Marco的观点 (43)
2.6.6 Larissa Moss的观点 (43)
2.6.7 Clay Rehm的观点 (45)
2.7 管理层未认可数据仓库项目的成功 (45)
2.7.1 Sid Adelman的观点 (45)
2.7.2 Jill Dyché的观点 (46)
2.7.3 Douglas Hackney的观点 (46)
2.7.4 Sean Ivoghli的观点 (47)
2.7.5 Chuck Kelley的观点 (47)
2.7.6 Clay Rehm的观点 (47)
第3章 论证与预算 (48)
3.1 概述 (48)
3.2 用户工作效率不能作为理由 (49)
3.2.1 Sid Adelman的观点 (50)
3.2.2 Joyce Bischoff的观点 (50)
3.2.3 Douglas Hackney的观点 (50)
3.2.4 Sean Ivoghli的观点 (51)
3.2.5 Chuck Kelley的观点 (51)
3.2.6 David Marco的观点 (51)
3.2.7 Larissa Moss的观点 (52)
3.2.8 Clay Rehm的观点 (53)
3.3 公司怎么才能鉴别出基础设施的价值 (53)
3.3.1 Sid Adelman的观点 (54)
3.3.2 Joyce Bischoff的观点 (54)
3.3.3 Jill Dyché的观点 (54)
3.3.4 Douglas Hackney的观点 (55)
3.3.5 Sean Ivoghli的观点 (55)
3.3.6 Chuck Kelley的观点 (55)
3.3.7 David Marco的观点 (55)
3.4 零售商需要数据仓库吗 (56)
3.4.1 Sid Adelman的观点 (56)
3.4.2 Joyce Bischoff的观点 (56)
3.4.3 Douglas Hackney的观点 (56)
3.4.4 Chuck Kelley的观点 (56)
3.4.5 David Marco的观点 (57)
3.4.6 Larissa Moss的观点 (57)
3.4.7 Clay Rehm的观点 (58)
3.5 成本怎么才能得到合理分配 (59)
3.5.1 Sid Adelman的观点 (59)
3.5.2 Joyce Bischoff的观点 (59)
3.5.3 Douglas Hackney的观点 (59)
3.5.4 Sean Ivoghli的观点 (59)
3.5.5 Chuck Kelley的观点 (60)
3.5.6 David Marco的观点 (60)
3.5.7 Larissa Moss的观点 (61)
3.5.8 Clay Rehm的观点 (61)
3.6 必须论证历史数据 (62)
3.6.1 Sid Adelman的观点 (62)
3.6.2 Joyce Bischoff的观点 (62)
3.6.3 Douglas Hackney的观点 (63)
3.6.4 Sean Ivoghli的观点 (63)
3.6.5 Chuck Kelley的观点 (63)
3.6.6 David Marco的观点 (64)
3.6.7 Larissa Moss的观点 (64)
3.6.8 Clay Rehm的观点 (65)
3.7 原型没有经济价值 (65)
3.7.1 Sid Adelman的观点 (66)
3.7.2 Joyce Bischoff的观点 (66)
3.7.3 Jill Dyché的观点 (66)
3.7.4 Douglas Hackney的观点 (67)
3.7.5 Sean Ivoghli的观点 (67)
3.7.6 Chuck Kelley的观点 (67)
3.7.7 David Marco的观点 (68)
3.7.8 Larissa Moss的观点 (68)
3.7.9 Clay Rehm的观点 (69)
第4章 组织与职员配备 (70)
4.1 概述 (70)
4.1.1 执行主管 (70)
4.1.2 服务台职员 (70)
4.1.3 实现团队的成员 (71)
4.2 数据仓库团队应该向谁负责 (72)
4.2.1 Sid Adelman的观点 (72)
4.2.2 Joyce Bischoff的观点 (73)
4.2.3 Jill Dyché的观点 (73)
4.2.4 Douglas Hackney的观点 (73)
4.2.5 Chuck Kelley的观点 (74)
4.2.6 David Marco的观点 (74)
4.2.7 Larissa Moss的观点 (74)
4.2.8 Clay Rehm的观点 (75)
4.3 组织机构使用矩阵管理方式 (75)
4.3.1 Sid Adelman的观点 (76)
4.3.2 Joyce Bischoff的观点 (76)
4.3.3 Douglas Hackney的观点 (76)
4.3.4 Sean Ivoghli的观点 (76)
4.3.5 Chuck Kelley的观点 (77)
4.3.6 Larissa Moss的观点 (77)
4.3.7 Clay Rehm的观点 (78)
4.4 项目没有固定不变的业务主管 (79)
4.4.1 Sid Adelman的观点 (79)
4.4.2 Joyce Bischoff的观点 (79)
4.4.3 Douglas Hackney的观点 (79)
4.4.4 Chuck Kelley的观点 (80)
4.4.5 David Marco的观点 (80)
4.4.6 Larissa Moss的观点 (80)
4.4.7 Clay Rehm的观点 (81)
4.5 企业的部门应该建设它自己的数据集市吗 (82)
4.5.1 Sid Adelman的观点 (82)
4.5.2 Joyce Bischoff的观点 (82)
4.5.3 Jill Dyché的观点 (83)
4.5.4 Douglas Hackney的观点 (83)
4.5.5 Sean Ivoghli的观点 (83)
4.5.6 Chuck Kelley的观点 (84)
4.5.7 David Marco的观点 (84)
4.5.8 Larissa Moss的观点 (84)
4.5.9 Clay Rehm的观点 (86)
4.6 项目没有专职职员 (86)
4.6.1 Sid Adelman的观点 (87)
4.6.2 Joyce Bischoff的观点 (87)
4.6.3 Douglas Hackney的观点 (87)
4.6.4 Sean Ivoghli的观点 (88)
4.6.5 Chuck Kelley的观点 (88)
4.6.6 David Marco的观点 (89)
4.6.7 Larissa Moss的观点 (89)
4.6.8 Clay Rehm的观点 (90)
4.7 项目经理随时打点行装 (91)
4.7.1 Sid Adelman的观点 (91)
4.7.2 Joyce Bischoff的观点 (91)
4.7.3 Douglas Hackney的观点 (92)
4.7.4 Sean Ivoghli的观点 (92)
4.7.5 Chuck Kelley的观点 (92)
4.7.6 David Marco的观点 (92)
4.7.7 Larissa Moss的观点 (93)
4.7.8 Clay Rehm的观点 (93)
4.8 无人希望为公司工作 (94)
4.8.1 Sid Adelman的观点 (94)
4.8.2 Joyce Bischoff的观点 (95)
4.8.3 Douglas Hackney的观点 (95)
4.8.4 Chuck Kelley的观点 (95)
4.8.5 David Marco的观点 (95)
4.8.6 Clay Rehm的观点 (96)
4.9 组织机构没有准备好建设数据仓库 (96)
4.9.1 Sid Adelman的观点 (96)
4.9.2 Joyce Bischoff的观点 (96)
4.9.3 Jill Dyché的观点 (97)
4.9.4 Douglas Hackney的观点 (97)
4.9.5 Sean Ivoghli的观点 (97)
4.9.6 Chuck Kelley的观点 (98)
4.9.7 David Marco的观点 (98)
4.9.8 Larissa Moss的观点 (98)
4.9.9 Clay Rehm的观点 (99)
第5章 用户问题 (100)
5.1 概述 (100)
5.2 用户想立刻就实现 (102)
5.2.1 Sid Adelman的观点 (102)
5.2.2 Joyce Bischoff的观点 (102)
5.2.3 Douglas Hackney的观点 (103)
5.2.4 Sean Ivoghli的观点 (103)
5.2.5 Chuck Kelley的观点 (103)
5.2.6 David Marco的观点 (104)
5.2.7 Larissa Moss的观点 (104)
5.2.8 Clay Rehm的观点 (105)
5.3 企业不支持该项目 (106)
5.3.1 Sid Adelman的观点 (106)
5.3.2 Joyce Bischoff的观点 (106)
5.3.3 Douglas Hackney的观点 (106)
5.3.4 Sean Ivoghli的观点 (107)
5.3.5 Chuck Kelley的观点 (107)
5.3.6 David Marco的观点 (107)
5.3.7 Larissa Moss的观点 (108)
5.3.8 Clay Rehm的观点 (108)
5.4 WEB应用程序没有给用户留下深刻印象 (109)
5.4.1 Sid Adelman的观点 (109)
5.4.2 Joyce Bischoff的观点 (109)
5.4.3 Jill Dyché的观点 (110)
5.4.4 Chuck Kelley的观点 (110)
5.4.5 David Marco的观点 (110)
5.5 管理层由于多维工具太复杂而拒绝它们 (111)
5.5.1 Sid Adelman的观点 (111)
5.5.2 Joyce Bischoff的观点 (111)
5.5.3 Douglas Hackney的观点 (111)
5.5.4 Sean Ivoghli的观点 (112)
5.5.5 Chuck Kelley的观点 (112)
5.5.6 David Marco的观点 (112)
5.5.7 Clay Rehm的观点 (113)
5.6 用户拥有很高的数据质量期望值 (113)
5.6.1 Sid Adelman的观点 (113)
5.6.2 Joyce Bischoff的观点 (114)
5.6.3 Douglas Hackney的观点 (114)
5.6.4 Chuck Kelley的观点 (114)
5.6.5 David Marco的观点 (115)
5.6.6 Larissa Moss的观点 (116)
5.6.7 Clay Rehm的观点 (117)
5.7 用户不知道自己需要什么 (117)
5.7.1 Sid Adelman的观点 (117)
5.7.2 Joyce Bischoff的观点 (117)
5.7.3 Douglas Hackney的观点 (118)
5.7.4 Chuck Kelley的观点 (118)
5.7.5 David Marco的观点 (118)
5.7.6 Larissa Moss的观点 (118)
5.7.7 Clay Rehm的观点 (119)
第6章 团队问题 (121)
6.1 概述 (121)
6.1.1 团队目标 (121)
6.1.2 激励机制 (123)
6.1.3 咨询人员与承包商 (123)
6.2 太热心的雇员对项目有威胁 (124)
6.2.1 Sid Adelman的观点 (124)
6.2.2 Joyce Bischoff的观点 (124)
6.2.3 Douglas Hackney的观点 (124)
6.2.4 Sean Ivoghli的观点 (125)
6.2.5 Chuck Kelley的观点 (125)
6.2.6 David Marco的观点 (126)
6.2.7 Clay Rehm的观点 (126)
6.3 管理层给数据仓库项目指派能力差的团队成员 (127)
6.3.1 Sid Adelman的观点 (127)
6.3.2 Joyce Bischoff的观点 (127)
6.3.3 Douglas Hackney的观点 (127)
6.3.4 Chuck Kelley的观点 (128)
6.3.5 David Marco的观点 (128)
6.3.6 Larissa Moss的观点 (128)
6.3.7 Clay Rehm的观点 (129)
6.4 管理层需要团队意见一致 (130)
6.4.1 Sid Adelman的观点 (130)
6.4.2 Joyce Bischoff的观点 (131)
6.4.3 Sean Ivoghli的观点 (131)
6.4.4 Chuck Kelley的观点 (131)
6.4.5 David Marco的观点 (132)
6.4.6 Larissa Moss的观点 (132)
6.4.7 Clay Rehm的观点 (132)
6.5 团队建设发生纠纷时的首席决策人 (133)
6.5.1 Sid Adelman的观点 (133)
6.5.2 Joyce Bischoff的观点 (134)
6.5.3 Douglas Hackney的观点 (134)
6.5.4 Sean Ivoghli的观点 (134)
6.5.5 Chuck Kelley的观点 (135)
6.5.6 David Marco的观点 (135)
6.5.7 Clay Rehm的观点 (135)
6.6 团队成员对指定的进度漠不关心 (136)
6.6.1 Sid Adelman的观点 (136)
6.6.2 Joyce Bischoff的观点 (136)
6.6.3 Douglas Hackney的观点 (136)
6.6.4 Chuck Kelley的观点 (137)
6.6.5 David Marco的观点 (137)
6.6.6 Larissa Moss的观点 (137)
6.6.7 Clay Rehm的观点 (138)
6.7 咨询人员自愿进行援救 (139)
6.7.1 Sid Adelman的观点 (139)
6.7.2 Joyce Bischoff的观点 (139)
6.7.3 Douglas Hackney的观点 (140)
6.7.4 Sean Ivoghli的观点 (140)
6.7.5 Chuck Kelley的观点 (140)
6.7.6 David Marco的观点 (141)
6.7.7 Larissa Moss的观点 (141)
6.7.8 Clay Rehm的观点 (142)
6.8 咨询人员正在运行演示 (142)
6.8.1 Sid Adelman的观点 (143)
6.8.2 Joyce Bischoff的观点 (143)
6.8.3 Douglas Hackney的观点 (143)
6.8.4 Sean Ivoghli的观点 (143)
6.8.5 Chuck Kelley的观点 (144)
6.8.6 David Marco的观点 (144)
6.8.7 Larissa Moss的观点 (145)
6.8.8 Clay Rehm的观点 (145)
6.9 承包商已经逃走 (146)
6.9.1 Sid Adelman的观点 (146)
6.9.2 Joyce Bischoff的观点 (147)
6.9.3 Douglas Hackney的观点 (147)
6.9.4 Chuck Kelley的观点 (147)
6.9.5 David Marco的观点 (147)
6.9.6 Larissa Moss的观点 (148)
6.9.7 Clay Rehm的观点 (149)
6.10 知识传授没有进行 (149)
6.10.1 Sid Adelman的观点 (150)
6.10.2 Joyce Bischoff的观点 (150)
6.10.3 Jill Dyché的观点 (150)
6.10.4 Douglas Hackney的观点 (151)
6.10.5 Sean Ivoghli的观点 (151)
6.10.6 Chuck Kelley的观点 (151)
6.10.7 David Marco的观点 (152)
6.10.8 Larissa Moss的观点 (152)
6.10.9 Clay Rehm的观点 (153)
6.11 数据仓库经理怎么才能最充分地使用咨询人员 (153)
6.11.1 Sid Adelman的观点 (154)
6.11.2 Joyce Bischoff的观点 (154)
6.11.3 Jill Dyché的观点 (154)
6.11.4 Douglas Hackney的观点 (156)
6.11.5 Chuck Kelley的观点 (156)
6.11.6 David Marco的观点 (156)
6.11.7 Larissa Moss的观点 (157)
6.11.8 Clay Rehm的观点 (157)
6.12 管理层希望外包数据仓库活动 (158)
6.12.1 Sid Adelman的观点 (159)
6.12.2 Joyce Bischoff的观点 (159)
6.12.3 Chuck Kelley的观点 (159)
6.12.4 Larissa Moss的观点 (160)
6.12.5 Clay Rehm的观点 (160)
第7章 项目规划与进度安排 (162)
7.1 概述 (162)
7.1.1 项目管理 (162)
7.1.2 项目计划 (163)
7.1.3 范围协议 (163)
7.1.4 时间安排 (163)
7.2 管理层需要具体的评估证据 (164)
7.2.1 Sid Adelman的观点 (164)
7.2.2 Joyce Bischoff的观点 (165)
7.2.3 Douglas Hackney的观点 (165)
7.2.4 Sean Ivoghli的观点 (165)
7.2.5 Larissa Moss的观点 (165)
7.2.6 Clay Rehm的观点 (166)
7.3 IT管理人员设立不切实际的最终期限 (167)
7.3.1 Sid Adelman的观点 (167)
7.3.2 Douglas Hackney的观点 (167)
7.3.3 Sean Ivoghli的观点 (168)
7.3.4 Chuck Kelley的观点 (168)
7.3.5 David Marco的观点 (169)
7.3.6 Larissa Moss的观点 (169)
7.3.7 Clay Rehm的观点 (170)
7.4 业务主管修改了范围,但不愿意修改时间表 (171)
7.4.1 Sid Adelman的观点 (171)
7.4.2 Joyce Bischoff的观点 (172)
7.4.3 Douglas Hackney的观点 (172)
7.4.4 Chuck Kelley的观点 (172)
7.4.5 David Marco的观点 (173)
7.4.6 Larissa Moss的观点 (173)
7.4.7 Clay Rehm的观点 (174)
7.5 用户希望第一个数据仓库交付品中包括一切 (175)
7.5.1 Sid Adelman的观点 (175)
7.5.2 Joyce Bischoff的观点 (175)
7.5.3 Chuck Kelley的观点 (177)
7.5.4 David Marco的观点 (177)
7.5.5 Larissa Moss的观点 (177)
7.5.6 Clay Rehm的观点 (178)
7.6 项目经理严重低估了时间表 (178)
7.6.1 Sid Adelman的观点 (179)
7.6.2 Joyce Bischoff的观点 (179)
7.6.3 Chuck Kelley的观点 (179)
7.6.4 Larissa Moss的观点 (180)
7.6.5 Clay Rehm的观点 (181)
第2篇 难以应付的技术情况
第8章 数据仓库标准 (185)
8.1 概述 (185)
8.2 组织机构没有方法学方面的经验 (186)
8.2.1 Sid Adelman的观点 (186)
8.2.2 Joyce Bischoff的观点 (187)
8.2.3 Chuck Kelley的观点 (187)
8.2.4 Larissa Moss的观点 (187)
8.2.5 Clay Rehm的观点 (187)
8.3 数据库管理标准不适用于数据仓库 (188)
8.3.1 Sid Adelman的观点 (188)
8.3.2 Joyce Bischoff的观点 (189)
8.3.3 Douglas Hackney的观点 (189)
8.3.4 Chuck Kelley的观点 (189)
8.3.5 Clay Rehm的观点 (190)
8.4 雇员误用数据仓库专业名词 (191)
8.4.1 Sid Adelman的观点 (191)
8.4.2 Joyce Bischoff的观点 (192)
8.4.3 Douglas Hackney的观点 (192)
8.4.4 Chuck Kelley的观点 (193)
8.4.5 Larissa Moss的观点 (194)
8.4.6 Clay Rehm的观点 (194)
8.5 它就是数据挖掘 (195)
8.5.1 Sid Adelman的观点 (195)
8.5.2 Joyce Bischoff的观点 (195)
8.5.3 Jill Dyché的观点 (195)
8.5.4 Chuck Kelley的观点 (196)
8.5.5 Larissa Moss的观点 (197)
8.5.6 Clay Rehm的观点 (197)
8.6 跨国公司需要建设一个商业情报环境 (197)
8.6.1 Sid Adelman的观点 (197)
8.6.2 Joyce Bischoff的观点 (198)
8.6.3 Douglas Hackney的观点 (199)
8.6.4 Chuck Kelley的观点 (199)
8.6.5 Clay Rehm的观点 (199)
第9章 工具与供应商 (201)
9.1 概述 (201)
9.2 书写建议要求的最佳做法是什么 (202)
9.2.1 Sid Adelman的观点 (202)
9.2.2 Chuck Kelley的观点 (202)
9.2.3 David Marco的观点 (203)
9.2.4 Clay Rehm的观点 (203)
9.3 用户不喜欢查询与报表制作工具 (203)
9.3.1 Sid Adelman的观点 (204)
9.3.2 Joyce Bischoff的观点 (204)
9.3.3 Douglas Hackney的观点 (204)
9.3.4 Sean Ivoghli的观点 (204)
9.3.5 Chuck Kelley的观点 (205)
9.3.6 David Marco的观点 (205)
9.3.7 Clay Rehm的观点 (206)
9.4 面向对象就是答案吗(而问题是什么) (206)
9.4.1 Sid Adelman的观点 (207)
9.4.2 Sean Ivoghli的观点 (207)
9.4.3 Chuck Kelley的观点 (208)
9.4.4 David Marco的观点 (208)
9.5 它已经选择了这个工具 (208)
9.5.1 Sid Adelman的观点 (208)
9.5.2 Joyce Bischoff的观点 (209)
9.5.3 Jill Dyché的观点 (209)
9.5.4 Douglas Hackney的观点 (210)
9.5.5 Chuck Kelley的观点 (210)
9.5.6 David Marco的观点 (210)
9.5.7 Clay Rehm的观点 (210)
9.6 那些工具非常管用吗 (211)
9.6.1 Sid Adelman的观点 (211)
9.6.2 Joyce Bischoff的观点 (212)
9.6.3 Douglas Hackney的观点 (212)
9.6.4 Sean Ivoghli的观点 (212)
9.6.5 Chuck Kelley的观点 (213)
9.6.6 David Marco的观点 (213)
9.6.7 Clay Rehm的观点 (213)
9.7 供应商有不正当影响吗 (214)
9.7.1 Sid Adelman的观点 (214)
9.7.2 Joyce Bischoff的观点 (215)
9.7.3 Douglas Hackney的观点 (215)
9.7.4 Sean Ivoghli的观点 (215)
9.7.5 Chuck Kelley的观点 (215)
9.7.6 David Marco的观点 (216)
9.7.7 Clay Rehm的观点 (216)
9.8 遭拒绝的供应商不明白“不” (216)
9.8.1 Sid Adelman的观点 (217)
9.8.2 Joyce Bischoff的观点 (217)
9.8.3 Douglas Hackney的观点 (217)
9.8.4 Sean Ivoghli的观点 (217)
9.8.5 Chuck Kelley的观点 (218)
9.8.6 David Marco的观点 (218)
9.8.7 Clay Rehm的观点 (218)
9.9 供应商的收购公司提供极差的支持 (218)
9.9.1 Sid Adelman的观点 (219)
9.9.2 Joyce Bischoff的观点 (219)
9.9.3 Jill Dyché的观点 (219)
9.9.4 Douglas Hackney的观点 (220)
9.9.5 Chuck Kelley的观点 (220)
9.9.6 David Marco的观点 (220)
9.9.7 Clay Rehm的观点 (221)
第10章 安全 (222)
10.1 概述 (222)
10.2 数据仓库没有安全计划 (223)
10.2.1 Sid Adelman的观点 (223)
10.2.2 Joyce Bischoff的观点 (224)
10.2.3 Chuck Kelley的观点 (224)
10.2.4 David Marco的观点 (225)
10.2.5 Clay Rehm的观点 (225)
10.3 安全责任必须明确 (225)
10.3.1 Sid Adelman的观点 (226)
10.3.2 David Marco的观点 (226)
10.3.3 Clay Rehm的观点 (226)
10.4 一名新任安全管理员应该从何处着手 (227)
10.4.1 Sid Adelman的观点 (227)
10.4.2 Joyce Bischoff的观点 (227)
10.4.3 Chuck Kelley的观点 (228)
10.4.4 Larissa Moss的观点 (228)
10.4.5 Clay Rehm的观点 (228)
第11章 数据质量 (230)
11.1 概述 (230)
11.2 应该怎样给数据质量应用抽样方法 (232)
11.2.1 Sid Adelman的观点 (232)
11.2.2 Joyce Bischoff的观点 (232)
11.2.3 Chuck Kelley的观点 (233)
11.2.4 David Marco的观点 (233)
11.2.5 Larissa Moss的观点 (234)
11.2.6 Clay Rehm的观点 (235)
11.3 冗余数据需要消除 (236)
11.3.1 Sid Adelman的观点 (236)
11.3.2 Joyce Bischoff的观点 (236)
11.3.3 Douglas Hackney的观点 (237)
11.3.4 Chuck Kelley的观点 (237)
11.3.5 David Marco的观点 (237)
11.3.6 Clay Rehm的观点 (238)
11.4 管理层低估了脏乱数据的量 (238)
11.4.1 Sid Adelman的观点 (239)
11.4.2 Joyce Bischoff的观点 (239)
11.4.3 Douglas Hackney的观点 (240)
11.4.4 Chuck Kelley的观点 (240)
11.4.5 David Marco的观点 (240)
11.4.6 Larissa Moss的观点 (241)
11.4.7 Clay Rehm的观点 (242)
11.5 管理层没有意识到数据质量的价值 (242)
11.5.1 Sid Adelman的观点 (242)
11.5.2 Joyce Bischoff的观点 (243)
11.5.3 Douglas Hackney的观点 (243)
11.5.4 Chuck Kelley的观点 (243)
11.5.5 Larissa Moss的观点 (244)
11.5.6 Clay Rehm的观点 (244)
11.6 数据仓库设计师受困于数据质量 (245)
11.6.1 Sid Adelman的观点 (245)
11.6.2 Joyce Bischoff的观点 (246)
11.6.3 Sean Ivoghli的观点 (246)
11.6.4 Chuck Kelley的观点 (246)
11.6.5 David Marco的观点 (246)
11.6.6 Larissa Moss的观点 (247)
11.6.7 Clay Rehm的观点 (247)
11.7 ETL过程部分地失败 (248)
11.7.1 Sid Adelman的观点 (248)
11.7.2 Joyce Bischoff的观点 (248)
11.7.3 Sean Ivoghli的观点 (249)
11.7.4 Chuck Kelley的观点 (249)
11.7.5 David Marco的观点 (250)
11.7.6 Larissa Moss的观点 (250)
11.8 源数据错误引起大范围更新 (251)
11.8.1 Joyce Bischoff的观点 (251)
11.8.2 Sean Ivoghli的观点 (251)
11.8.3 Chuck Kelley的观点 (252)
第12章 集成 (253)
12.1 概述 (253)
12.2 多个数据源系统需要较大的数据集成 (254)
12.2.1 Joyce Bischoff的观点 (254)
12.2.2 Chuck Kelley的观点 (254)
12.2.3 David Marco的观点 (256)
12.2.4 Larissa Moss的观点 (256)
12.2.5 Clay Rehm的观点 (257)
12.3 企业模型正耽搁进度 (258)
12.3.1 Joyce Bischoff的观点 (258)
12.3.2 Jill Dyché的观点 (259)
12.3.3 Douglas Hackney的观点 (259)
12.3.4 Sean Ivoghli的观点 (260)
12.3.5 Chuck Kelley的观点 (260)
12.3.6 Larissa Moss的观点 (261)
12.3.7 Clay Rehm的观点 (262)
12.4 公司应该分散数据库吗 (263)
12.4.1 Sid Adelman的观点 (263)
12.4.2 Joyce Bischoff的观点 (264)
12.4.3 Chuck Kelley的观点 (264)
12.4.4 David Marco的观点 (264)
12.4.5 Clay Rehm的观点 (265)
12.5 业务主管想要实时的客户更新 (265)
12.5.1 Sid Adelman的观点 (265)
12.5.2 Joyce Bischoff的观点 (266)
12.5.3 Jill Dyché的观点 (266)
12.5.4 Chuck Kelley的观点 (267)
12.5.5 David Marco的观点 (267)
12.5.6 Larissa Moss的观点 (267)
12.5.7 Clay Rehm的观点 (268)
12.6 公司不想要筒仓系统 (268)
12.6.1 Sid Adelman的观点 (268)
12.6.2 Joyce Bischoff的观点 (269)
12.6.3 Douglas Hackney的观点 (270)
12.6.4 Chuck Kelley的观点 (271)
12.6.5 David Marco的观点 (271)
12.6.6 Larissa Moss的观点 (271)
12.6.7 Clay Rehm的观点 (272)
12.7 出自数据仓库与业务系统的报表不匹配 (272)
12.7.1 Sid Adelman的观点 (273)
12.7.2 Joyce Bischoff的观点 (273)
12.7.3 Douglas Hackney的观点 (273)
12.7.4 Sean Ivoghli的观点 (273)
12.7.5 Chuck Kelley的观点 (274)
12.7.6 Larissa Moss的观点 (274)
12.7.7 Clay Rehm的观点 (274)
12.8 数据仓库团队应该纠正不充分的业务系统吗 (275)
12.8.1 Sid Adelman的观点 (275)
12.8.2 Joyce Bischoff的观点 (275)
12.8.3 Sean Ivoghli的观点 (275)
12.8.4 Chuck Kelley的观点 (276)
12.8.5 David Marco的观点 (276)
12.8.6 Larissa Moss的观点 (276)
12.8.7 Clay Rehm的观点 (276)
第13章 数据仓库体系结构 (278)
13.1 概述 (278)
13.2 数据仓库体系结构不够用 (279)
13.2.1 Sid Adelman的观点 (280)
13.2.2 Joyce Bischoff的观点 (280)
13.2.3 Douglas Hackney的观点 (280)
13.2.4 Sean Ivoghli的观点 (280)
13.2.5 Chuck Kelley的观点 (281)
13.2.6 David Marco的观点 (282)
13.2.7 Clay Rehm的观点 (282)
13.3 封闭式系统正妨碍集成 (283)
13.3.1 Sid Adelman的观点 (283)
13.3.2 Joyce Bischoff的观点 (284)
13.3.3 Douglas Hackney的观点 (285)
13.3.4 Chuck Kelley的观点 (285)
13.3.5 David Marco的观点 (286)
13.3.6 Larissa Moss的观点 (289)
13.3.7 Clay Rehm的观点 (290)
13.4 回退的事务应该改变数据仓库中的值吗 (291)
13.4.1 Chuck Kelley的观点 (291)
13.4.2 Larissa Moss的观点 (292)
13.4.3 Clay Rehm的观点 (292)
13.5 点击流数据仓库将是巨大的 (292)
13.5.1 Chuck Kelley的观点 (293)
13.6 时变分析需要特殊设计 (293)
13.6.1 Joyce Bischoff的观点 (293)
13.6.2 Chuck Kelley的观点 (294)
13.7 管理层想同时开发一个数据仓库和一个新业务系统 (294)
13.7.1 Sid Adelman的观点 (294)
13.7.2 Joyce Bischoff的观点 (295)
13.7.3 Douglas Hackney的观点 (295)
13.7.4 Sean Ivoghli的观点 (295)
13.7.5 Chuck Kelley的观点 (295)
13.7.6 Larissa Moss的观点 (296)
13.7.7 Clay Rehm的观点 (297)
13.8 数据仓库被分配了报表制作系统的角色 (297)
13.8.1 Sid Adelman的观点 (298)
13.8.2 Joyce Bischoff的观点 (298)
13.8.3 Chuck Kelley的观点 (298)
13.8.4 Sean Ivoghli的观点 (299)
13.8.5 Clay Rehm的观点 (299)
13.9 需要在多个产品之间集成元数据 (299)
13.9.1 Joyce Bischoff的观点 (299)
13.9.2 Douglas Hackney的观点 (300)
13.9.3 Sean Ivoghli的观点 (300)
13.9.4 Chuck Kelley的观点 (300)
13.9.5 David Marco的观点 (300)
13.9.6 Clay Rehm的观点 (302)
13.10 怎么才能理顺UPC码变化 (303)
13.10.1 Joyce Bischoff的观点 (303)
13.10.2 Chuck Kelley的观点 (303)
13.10.3 Clay Rehm的观点 (304)
第14章 性能 (305)
14.1 概述 (305)
14.2 软件运转不正常 (306)
14.2.1 Sid Adelman的观点 (306)
14.2.2 Joyce Bischoff的观点 (306)
14.2.3 Sean Ivoghli的观点 (306)
14.2.4 Chuck Kelley的观点 (306)
14.2.5 David Marco的观点 (307)
14.2.6 Clay Rehm的观点 (307)
14.3 数据仓库增长得比源数据快 (307)
14.3.1 Sid Adelman的观点 (307)
14.3.2 Joyce Bischoff的观点 (309)
14.3.3 Douglas Hackney的观点 (309)
14.3.4 Sean Ivoghli的观点 (310)
14.3.5 Chuck Kelley的观点 (310)
14.3.6 Clay Rehm的观点 (310)
14.4 装入证据表花费太长时间 (311)
14.4.1 Joyce Bischoff的观点 (311)
14.4.2 Sean Ivoghli的观点 (311)
14.4.3 Chuck Kelley的观点 (312)
14.4.4 David Marco的观点 (313)
14.4.5 Clay Rehm的观点 (313)
附录A 数据仓库词汇表 (315)
附录B 口语词汇表 (337)
资源 (350)
专家自传 (358)
在我们讲授的数据仓库技术的各种研究班、演示文稿和课程中,我们常常会遇到这样的问题:它们看起来像是“难以应付的情况”。同样,在DM Review “Ask the Experts”论坛上(http://www.dmreview.com),我们也遇到过乍看起来像是没有答案或解决方案的问题。可是,它们确实有解决方案,而这就是本书的目的之所在。
我们从我们的课堂、DM Review“Ask the Experts”论坛、数据仓库咨询人员以及本领域中经历此类情况的同事那里收集了很难应付的91种情况,并在本书中加以讨论。这些都是真实的情况,但我们已经对它们进行了修饰,目的是为了保护本书的作者,以及经历过这些情况的组织机构,使之免于伴随而来的羞愧与耻辱。顺便提一句,审阅本书原稿中各种具体情况的审稿人员看后都说,“我知道这描述的是哪家公司”,而他们几乎总是错的。
◣ 写作意图
每个组织在它开始和继续数据仓库开发项目的过程中,都必须处理其他组织已经遇到过的许许多多非常不同的困难情况是毫无必要的。这些相同的困难局面不断出现,其原因常常与行业、组织规模或组织结构没有太大关系。通过阅读本书,读者将会了解到不只是你一个人遇到过类似的情况,你的问题也不是独一无二的。本书还给那些看不出明显解决方案又不知从何处下手的读者提供希望。
在这些难以应付的情况中,有些应该与读者计划通过增加新数据、额外用户或新应用程序来增强自己的数据仓库所碰到的情况有相似之处。这种难以应付的情况也许还未露出头来,但读者明确看出它就隐藏在某个角落里。在读完本书之后,读者就应该能够避免这种还未露面的情况,进而无需在它露出真面目之后再解决它。
◣ 读者对象
对当前数据仓库的某一部分担有责任的每一名风险承担者、数据仓库设计师、数据仓库项目经理以及用户联络员,都会面临本书中所提出的各种挑战。这些人员正在给乍看起来似乎根本就没有合适答案的情况寻找解决方案。
本书没有提供数据仓库技术的一般性介绍。要想从本书中得到最大的收获,读者应该对数据仓库技术已有一定程度的熟悉,无论是通过实际体验、学术会议,还是以前阅读过数据仓库方面的文章。本书也没有提供诸如元数据或数据质量之类的任何专题讨论,而是涵盖了许多领域。本书后面的“资源”部分既列举了介绍性的读物,又给出了比较高级的推荐材料。
用户联络员和经理可能希望只阅读第1篇(“难以应付的管理情况”)。其他所有读者可能希望阅读第1篇和第2篇(“难以应付的技术情况”)。
◣ 本书内容
正如前面提过的,本书的第1篇讨论管理方面的难以应付的情况,第2篇研究技术方面的难以应付的情况。这两篇中的讨论顺序大体上就是开发一个项目遇到这些情况的顺序,但是每一章都独立于它前面的各章节。读者可以从头至尾地阅读本书,但不必拘泥于这种阅读方式;读者也可以直接跳到讨论了给你造成最大麻烦的那些问题的章节。例如,如果读者目前正受困于数据质量问题,那么讨论数据质量的第11章可能就是你开始阅读的好地方。各章的每一节都介绍一个与本章主题相关的难以应付的情况,接着给出每位专家所建议的解决方案(按专家姓氏的字母顺序介绍)。
本书后面的“数据仓库词汇表”部分将解释一些术语,以帮助读者避免误入歧途。曲解这个迅速变化的领域中所使用的术语,已经造成了导致时间与金钱浪费、意见纷争以及伤害感情的严重误会。“数据仓库词汇表”除了含有首字母缩写词之外,还含有数据仓库与信息技术词汇。这些词汇中只有少数有一个以上的定义。在阅读那些情况与解决方案的过程中,请参考那些定义以避免任何误解。如果读者的母语不是英语,你将会发现“口语词汇表”非常有用,因为那些专家在他们给本书的投稿中使用了许多口语表达。
读者将会注意到那些专家的答复中有强烈的偏好。那些专家通过他们在现实生活中的大量经历形成了这些根深蒂固的看法。那些答案中只有少数是相似的,而有些则存在明显的不一致,进而显得彼此矛盾。由于认识到每个问题通常都有一个以上的解决方案,每个解决方案又更多地取决于具体的组织机构和该机构所面临的处境,所以,我们才没有打算调解那些差别。我们相信读者将会聪明地选择最适合自己组织的解决方案。
◣ 撰写本书的专家
下面是提供了解决本书中所介绍的各种情况的专家知识几位专家的姓名。
• Sid Adelman
• Joyce Bischoff
• Jill Dyché
• Douglas Hackney
• Sean Ivoghli
• Chuck Kelley
• David Marco
• Larissa Moss
• Clay Rehm
这些名副其实的专家,无论是男性还是女性,在数据仓库领域内工作的时间加起来已有142年。凡是其他人能够解决的困难情况,这些专家同样也能解决。
这些专家根据他们在成功和不成功实现方面的亲身经历建议了最佳做法。他们都一致认为本书中所介绍的许多情况反映了一个机能失常的组织所具有的症状,进而知道如果不了解真正的起因,根本就无法实在地推荐有效的解决方案。当给他们提供的信息不够充分时,这些专家就不得不对书中所介绍的种种难以应付的情况做出假设。
这些专家的自传安排在本书的最后。
许多难对付的情况是在这些专家收到最初的91种情况之后才引起我们注意的,而且我们大家都觉得它们出现的可能性将会更大。如果读者想贡献一个新的情况供我们考虑,请把它发送到impossibles@sidadelman.com。我们可能会把你的情况包含在本书的第二版中。
◣ 致谢
本书中所介绍的各种难以应付的情况来源于多种渠道。一个主要的来源是我的Data Warehouse Project Management Seminar(即数据仓库项目管理研究班),在该研究班中,学员们会提出看似不可能解决的情况。我想感谢这个研究班中勇敢地暴露出其困难情况的所有学员。
我的客户、同事和本书中所介绍的各位专家贡献了许多其他情况。我们去掉了这些难以应付的情况自身所具有的任何特征。这么做的目的是保护提供了这些情况的人,使他们的声誉和职业生涯不受伤害。
许多情况是从上述“Ask the Experts”论坛的提交请求中抽取出来的。我想感谢DM Review的那些出版者,谢谢他们允许我们使用那些提交请求,并感谢在DM Review管理“Ask the Experts”论坛的Web编辑Mary Jo Nott。
本书是通过汇编各位专家的、来之不易的智慧结晶而成的一本书,他们是我有幸认识和共事的同事。正如读者将要在他们的解决方案中所看到的,如果没有他们有深刻见解的贡献,就不会有这本书。特别感谢Larissa Moss和Joyce Bischoff,谢谢他们贡献了已完全超出他们的专家解决方案范围的杰出思想和建议。
也感谢那些最初的审稿者,谢谢他们在改进本书以及使本书更易读、内容更丰富等方面提供了优秀的建议。感谢DM Review的总编Jean Schauer,Seena Technologies的总裁Majid Abai,以及Dennis Fitzpatrick。我想感谢Lou Russell和Cort Pahl,谢谢他们给我提供了他们的看法和真知灼见。
已经写过书的人都知道各种编辑人员的工作量和专业知识。我向Addison-Wesley出版公司的编辑们致敬,其中包括Mary O’Brien,Alicia Carey和Simone Payment。On Writing中的Steven国王写道,你的编辑总是正确的。这句话特别适合本书。特别感谢我的技术编辑Chrysta Meadowbrooke。
如果读者正在阅读本书,这应归功于Curt Johnson和Chanda Leary-Coutu的市场营销技能。
最后,感谢Sisyphus给本书的封面增光,因为在所有认为他们在这个困难的数据仓库环境中的角色就是一个看不见解决方案的登山者的读者看来,这个封面就是他们的真实写照。
——Sid Adelman