里克斯莫兰,“一日生活”摄影系列的创作者,有了一个新的项目作品,被称为“人类面对大数据”。纽约时报也采用这一名称,其文章标题是《大数据时代》和《数据大校园》。宣布大数据时代已经明确到来的标志是上个月斯科特•亚当斯的讽刺漫画《呆伯特》的问世。一个专栏导读说:“到处都是它,它什么都知道。它的名字叫大数据。”
大数据的故事就像是一个米姆决策。其有两方面的重要成分。首先是这个词汇本身没有太多的技术含量,但却朗朗上口,依稀令人回味。第二是这一词汇背后则蕴藏着具有巨大的技术发展潜力,同一些技术陷阱。
大数据是一个速记的标签,通常是指运用人工智能,如机器学习,在大量数据中捕获标准数据库。新的数据来源包括网页浏览数据、社会网络通信、传感器数据和监测数据。
结合海量的数据和软件算法打开了新的商业机会的大门。例如,谷歌和Facebook这样的大数据公司。去年,来自IBM的沃森(人工智能程序)击败了人类,在电视智力竞答节目“Jeopardy!”中获胜,便是大数据计算的一个胜利。从理论上讲,大数据可以提高从商业到医药领域中的决策,允许根据数据和分析,而不是直觉和经验来做出决定。
“这个词本身是模糊的,但它正在变得越来越真实。”康奈尔大学的计算机科学家乔恩•克莱因伯格说。“大数据是一个过程,一个口号,它有可能改变一切。”
长期以来,数据量的持续上涨一直是一个挑战。从19世纪后期,普查员就苦于不知如何将快速增长的美国人口进行计数和分类。1890年,当人口达到6300万的时候,人口普查迎来了一个创新突破。赫尔曼霍尔瑞斯发明穿孔卡片数据工具被证明是机器可读的,这些卡片于是成为了IBM公司的技术基石。
因此,大数据这一术语是对现实状况的一种修辞,当涉及到数据的时候,“大”是一个快速移动的目标。2008年,据一些计算机科学家和业内高管介绍,“大数据”开始在科技界获得的重视。Wired杂志上发表的文章,提出了中肯的机会及将会影响现代的海量数据。
Wired宣布,这种新的计算方式,开启了PB时代。这是一本很好的杂志,但“PB字节”的标签太技术而无法成为主流,不可避免地,PB字节数据将让位给更大的字节:艾字节:zettabytes和yottabytes。
起初,许多科学家和工程师冷笑道,大数据只是一个营销术语。但良好的营销加上有效的沟通,在任何领域都是有价值的技能。例如,数学家约翰•麦卡锡在1955年提出了“人工智能”一词时,他申请洛克菲勒基金会的资助时的巧妙的措辞便是一种绝妙而理想的营销。
在2008年年底,一批全国领先的计算机科学的研究人员开始接受大数据,计算机界联合会、计算研究协会与政府的国家科学基金会的合作,这代表了学术界和企业的研究人员接受大数据的概念。计算机协会出版了一份有影响力的白皮书《大数据计算:开创商业、科学和社会领域的革命性突破》。其作者是三位著名的计算机科学家,卡耐基•梅隆大学的兰道尔•布赖恩特(RandalE.Bryant)、加利福尼亚大学伯克利分校兰迪•卡兹(RandyH.Katz)、华盛顿大学的爱德华•拉佐斯加(EdwardD.Lazowska)。
上述专家的代言给了大数据以智力可信度。IBM技术研究员兼新兴互联网技术副总裁罗德A.史密斯说,他十分喜欢这个术语,因为它引导人们的思维从机械数据处理走向数据量的精确措施处理。“实际上,大数据真正在于其新用途和新见解,而不在于其那么多的数据本身。”史密斯先生说。
IBM通过其大数据营销,尤其是与客户产生共鸣。在2008年,史密斯先生的研究小组发布了一个网站,解释大数据主题,该网站的知名度速度被大大扩展。在2011年,该公司推出了Twitter帐号,包括#IBMbigdata。IBM公司有一个大数据的newsletter,并在1月份发表可以分电子书《了解大数据》。
自1976年成立以来,SAS软件研究所这家世界上最大的私人持有的软件公司,已通过数据库进行筛选开发软件,寻找价值并掘金。总部设在北卡罗来纳州Cary,N.C.的SAS,已在该领域有过许多营销术语,包括“数据挖掘”、“商业智能”和“数据分析。”
起初,SAS的首席营销官吉姆•戴维斯,将大数据视为另一个行业阶段性的概念炒作。
“我最初曾嘲笑过这个术语。”戴维斯先生回忆说,他指出他们公司的大企业客户,如银行和保险公司,已挖掘了几十年的大量数据了。
但大数据试图寻找挖掘所有网络数据以及外部数据库。SAS公司的技术已经利用网络时代的数据资产,改变了其市场。去年,公司开始采用大数据和“大数据分析,与此同时采用的还有他们已使用了多年的“高性能分析”。五月公司任命保罗肯特为公司的大数据副总裁。“我们不得不跟随着潮流。”戴维斯先生说。
大数据的支持者说其带来的回报远远大于风险。尽管如此,智能技术保证观察、记录,并作出有关人类行的为前所未有的推论应该可以促使一些新的想法的产生,无论是创造这些技术的人,还是使用它们的人。