伴随着“Web 2.0”理念的兴起,互联网正在由过去单纯的页面变成一个个平台,UGC模式大行其道,新技术浪潮不断涌现,互联网上的数据正在呈几何级数的增长,而相应的,这些海量数据也在一定程度上被不断创造新平台的我们所遗忘。
有时候,放慢脚步四处看看,是为了将来走得更快。来自伦敦的创业公司Importio正是抱着这样的念头,打造出一款大数据平台软件。他们刚拿到900万美金的种子融资。
CEO David White称,Importio旨在以网站为数据源,打造动态的数据库,开发者和公司可以从中连接或提取数据,进而创造出新的数据。为此他们设计了一套十分简洁的交互界面,用户只需在你想要抓取数据的网站上进行几次简单的点击操作,Importio会根据你的操作推算出你想要抓取的数据,进而创建一个与这些数据的实时连接,接下来你只需选择想要的导出形式(电子表格、数据库或是搜索索引),就可以获得一份指定内容、实时更新的数据了。
用简单的交互操作获取实时更新的海量数据,Importio的想法非常妙,但有两点需要注意:第一,目前许多大型网站都有一套相应机制来抵御来自外部的数据抓取,Importio的功效还有待检验;第二,这种抓取他人网站数据的做法很可能牵涉到一系列法律纠纷,Importio在这方面还需要下一番功夫。