云、社交和移动计算三大技术趋势在不断提供全新价值的同时,也驱动大数据不可阻挡的增长态势。据IDC的报告,未来10年全球数据量将以40%的速度增长,2020年将达到35ZB(Zettabyte),这意味着全球数据将进入“泽它”时代!
在这个时代,您能够通过掌控大数据提高运营效率,降低 IT 基础架构和数据管理成本,并更好地管理品牌和客户关系。不过,假如您无法适应不断增长的数据容量、种类和速度,大数据也可能代表了巨大的成本和法规遵从风险。数据本身是被动的,必须经过集成、分析才能得到利用。在新的技术趋势下,由于具备大容量、多结构化、增长速度快和价值密度低等特点,大数据治理需要借助新的技术手段和管理思路。
发挥大数据的业务价值
Big Data(大数据)这一术语从字面上看主要是容量方面的含义,但数据种类和数据速度的并行增长具有同等重要性,三者被统称为三“V”要点(Volume、Variety、Velocity),只有符合这三个特点才能称为大数据。Informatica认为,大数据是三种相互关联又迥然各异的技术趋势的汇合点,包括海量交易数据、海量交互数据以及海量数据处理。大数据集成则是用于发挥这些数据潜能的支持技术。
大数据机会存在于各行各业中。对于消费行业,能够通过捕捉 Facebook发帖、Twitter 留言、YouTube 视频、博客评论来进一步了解消费者、更有效地开展销售和提供服务并利用口碑营销手段;对电信业来说,通过掌控CDR、文本短信和移动设备数据,可减少客户流失并优化网络;金融服务机构能够根据实时市场事件采取行动,更好地管理金融风险;医疗机构则能够以来自新数据源的信息充实传统的数据仓库,由此实现更加锐利的分析洞察能力。
Big Data是新技术,数据治理是目标
对于遇到的各种大数据挑战,企业机构需要有效的解决方案,这就涉及到数据治理的问题。在Informatica看来,数据治理不是一个项目,而是一种体系和过程,涵盖于企业的整个信息化建设过程。该体系关注于信息系统执行层面,其目的是整合IT与业务部门的知识和意见,通过将流程、策略、标准和组织的有效组合,对企业的信息化建设进行全方位的监管,需要企业高层的授权和业务部门与IT部门的密切协作。数据治理项目包括四个关键要素:技术、策略和流程、标准和定义及组织。其中,技术要素包括数据访问、数据转换、数据质量、元数据、数据交互等等,我们从Big data定义来看,这种创新的技术应该归属到数据治理的技术范畴中。
采用成熟、先进的数据集成平台释放Hadoop潜能
企业开展数据治理,在理顺数据治理管理框架之后,技术和方案的选择就至关重要。借助Informatica数据集成平台,企业用户能够实现广泛的数据连接,即能实现海量交易数据的广泛连接功能,又可接入到海量社交互动数据,并且还针对海量数据处理的Hadoop平台开发了很多实用技术。这点非常重要,数据的广泛连接性是数据治理的重要基础。
大数据环境造成了结构化数据、半结构化数据和非结构化数据并存的格局,采用昂贵的设备进行数据治理当然好,但巨大的成本压力已成为很多企业难以承受的负重。Hadoop这种可以更容易开发和运行处理大规模数据的软件平台,能够以更经济的方式、更好的性能来处理数据,从而获得了企业的青睐。Informatica数据集成平台已经能够非常好地支持Hadoop架构:通过数据接入拓展其交互性,包括社交媒体数据,并且可将其通过批量或实时的方式导入Hadoop;通过在Informatica中利用图形数据设计数据集成任务及流程,提高了生产力,并且可将设计直接部署在Hadoop中进行自主执行。此外,Informatica还适时推出了一些基于Hadoop环境的最新解决方案,比如HParser和Xmap,使用户能够提高大数据的投资回报。
即使在快速演进的大数据时代,拥有长达近20年数据集成创新经验和领导才能的 Informatica 依然是业内唯一能够确保您实现数据最大回报的供应商。借助 Informatica 支持各项数据治理方案的综合平台和服务,您的 IT 组织能够充分释放大数据潜能,把大数据转化为重大机遇。