云计算已经成熟,正迅速与新时代的参与者如亚马逊、谷歌和Salesfore.com一起向更多既定的 IT供应商进军。为了不被淘汰,Kognitio正在通过英国的服务供应商2e2来大力提升数据仓库,以此作为一项服务(DAAS)。术语之间的战争仍在 进行。GreenPlum公司吹捧它在福克斯互动媒体(FIM)的企业数据云(EDC)仓库平台,称其有高度分布式数据仓库,巩固了点击流处理和社交分析 网络(例如MySpace)。就其本身而言,Aster Data Systems公司利用谷歌的MapReduce功能和Gartner公司对它的评论,使其“前线数据仓库”成为品牌产品,因此提供了可信度和赞赏的声 音。
数据云
在一个完全独立的领域,数据云将对医疗保健和公共领域产生重大的意义。国家卫生信息网络(NHIN)主 要依赖于由付款人、供应商和管理人员构成的健康信息交换的关键路径。这是一个重要的用例,其数据高度分散、计算密集,并且在关键路径上建立电子医疗记录 (EMR)和医疗保健分析以支持业绩进行评定。不过,云基础设施最终将作为企业之间重要的功能区分。
数据仓库的提示和建议:不要混淆了工具与加速器。工具可取代数据集市或数据仓库;加速器被安装在现有的 系统上,它是不会消失的。后者获得了SAP的商业仓库系统的后端缓存频繁执行的资源密集型的查询牵引。Oracle RAC似乎也受益于加速器的倾向。
基于列的数据库几乎可以自负盈亏。根据该方案。因为基于列的数据库在本质上缩减了保存数据的所需要的空 间大小,因此组织可以大大节省存储开销。这可在应用先前的压缩算法之前发生。需要注意的是,由于您的具体情况可能会有所不同,所以还是需要引起注意。此 外,几乎没有企业会让他们的络网中心处于一种辐射型结构。不过,从性价比的上涨幅度上可以看出一些供应商(例如,ParAccel2009年6月21日基 准[www.tpc.org])向工具方面和标准关系型数据仓库方面发展。
如果你正在考虑用一个数据仓库工具执行已经准备好了的估价。如果你的公司只有有限的技术经验(或者没 有),就得做好充分的准备工作。说出关于公司使用新新技术的能力的真实情况。新技术往往产生新的角色和职责。性能创新能够使业务处理流程有新的进展。该技 术集成,人员和流程需要计划,或者获取和安装“货架软件”的风险成为现实。这适用于与任何新技术相结合。
该中心辐射型架构仍然是最灵活的。数据集成的一般原则是通过减少系统接口的数量来尽量减少成本,以支持 和维护。点对点是最没有效率的。在这种情况下,基于列的分析型数据库和工具将成为整个网络的节点,而不是中心,这在企业数据仓库在标准关系数据库方面仍然 是至关重要的。
通过相同的数据集市处理程序来管理基于列的型数据库和数据仓库工具。尽管分析型数据库(例如 ParAccel)提供了高可用性的功能,因为分析应用程序始终具有至关重要的使命,服务水平协定仍然没有严格执行你的业务的交易系统。
各个击破。处理大量数据,经过验证的可扩展性的路径在于通过并行处理-每一个多线程服务器都有一个自己 的存储器与高性能网络连接,这就好像作为一个单一系统呈现给最终用户。其他创新是在数据存储器地址空间里达到了较大的数据缓存。他们将减少或消除磁盘的写 入与输出,还有异步事务,但事务处理对存储区域网络进行严格地写入操作。
云计算和相关的“数据云”适合分布式数据和分布式企业。创业和那些喜欢研究样机的人也将受益于云模型。 云计算把软件看作是一种服务(SAAS),网格计算和虚拟化达到了一个新水平,提取支持计算资源的零售的整个数据中心所实现的接口。 在许多情况下,这是不恰当的。最终,数据云将在跨部门、分散式的企业内部变得至关重要。