扫一扫
关注微信公众号

先知先觉的数里淘金 电商行业的大数据作为
2012-11-24   畅享网

当人们还在置疑大数据的空穴来风时,沃尔玛的经典营销案例“啤酒与尿布”已经在业内广为流传。当人们还在置疑大数据的行业应用时,以互联网为代表的电商行业已经在利用大数据进行掘金。国金证券TMT行业分析师赵国栋表示,传统企业在大数据的应用上确实没有电商有先知先觉,因为电商的主要资产就是数据,有消费者的行为记录,能够快速了解消费者的需求。

大数据在电商的三种应用方式

“用户好不容易来了,死活也不能让他走”,这是所有电商的愿望,如何快速准确的吸引用户找到想要的商品;如何加大商品的有效曝光;如何满足用户的需求,推荐其偏好的商品;如何提高用户的活跃度,降低用户的弃单率,这些都是令电商一直很头疼的问题。

亚马逊通过自己研发的精准推荐系统每秒卖出的商品达72.9件,如此诱人的数字,令国内很多电商企业馋涎不已。亚马逊的经验有一个很奇怪的名字叫“鬼打墙式的推荐”,就是一路跟着你,所有浏览行为几乎都看得到。

所有电商都在学习亚马逊的经验,目前在电商中常用的推荐方式有1.买了还买2.看了还看3.浏览后买的4.对其它相关的感兴趣5.个性化邮件,据兰缪内衣技术总监田旭介绍,目前这些方式基本能满足需求,相关推荐主要集中在商品页和购物车页面。

据兰缪内衣技术总监田旭介绍,在Apache推出Hadoop之后,才开始有“推荐引擎”这种服务,之前只是谷歌、亚马逊有自己的一套东西。

推荐引擎是电商在大数据应用的一个主要方式,基于用户在网站上的浏览行为,对用户进行分门别类,有哪些用户购买了哪些商品,有哪些用户浏览了哪些商品,根据这些浏览、购买、评价行为为不同的用户推荐不同的商品。

智能邮件推送也是常用的一个方式,针对某个人的浏览行为推送一款产品。根据你的浏览和搜索记录,即使你没有产生购买行为,最终会把可能是你要买的产品发到你的邮箱。据田旭介绍,亚马逊在这方面做的更极致,,一般的直邮发一百万份,每一个都一样,但亚马逊是每一个人都不一样,他们会把单独一件商品直接发邮件推荐给用户,这个人看到马上崩溃了,立马就买了。

商品预测是亚马逊独有的一种方式。在新产品上线后,经过前5天的交易记录,就能得出一个分析结果,这个商品多长时间能卖完,是正常商品、热销的还是滞销的。如果商品没达到相应的标准,亚马逊可以根据和商家签订的退货协议,把剩余的商品全部退还商家。田旭说到,这个目前在国内还没有人能做到如此,这也是亚马逊能立于不败之地的原因。

电商的大数据作为

在大数据推动的商业革命暗涌中,要么学会使用大数据的杠杆创造商业价值,要么被大数据驱动的新生代商业格局淘汰。这是天赐良机,更是生死之战。目前大部分电商都有自己的“大数据”策略,在愈演愈烈的市场竞争上占取更有利的地位。

据知意图产品经理魏平介绍,在国内做得不错的有淘宝、京东这样的公司,他们有足够的资金和能力去自行研发,但是对于大部分电商企业来说自行研发消耗的成本巨大,中小型电商企业考虑其它的方式,自行研发是没必要的。

兰缪内衣技术总监田旭告诉记者,目前大数据在国内只有一种产品就是推荐引擎,从技术架构分为两种,一是厂商提供一体机的集成方案直接安装到本地的机房,如果数据量增大,可以直接加服务器,厂商会提供相应的监控和其它服务。二是云服务分析,用户只需要把服务厂商提供代码嵌入到网站上即可,进行分析之后,会有相应结果反馈回来。对于会不会担忧有数据的安全性的问题,田旭表示肯定是会担心,也需要未来在相关法律和法规的完善。此外,还有一个好处,采用这种分析方式,还会抓取同类网站上的数据,通过比对分析,得出相应的推荐结果。田旭说到,“采用大数据技术,可以提高转化率,一般可以在原有转换率的基础上提高15%,比如你现在的转换率是2% ,在使用推荐引擎以后会提高到2.3%。”

淘宝“云梯”计划

淘宝无论在人才、技术方面都有强大的实力,目前已经拥有国内最大的Hadoop集群,采用x86服务器,存储容量50PB。这个集群还有一个很好听的名字“云梯”,短短四年时间,已经由300台扩张到近2900台规模。

淘宝还根据自身的业务需求,开发了自己的Hadoop分支——ADFS。主要解决HDFS NameNode在设计上存在单点故障、内存瓶颈,以及集群重启时间过长,期间无法对集群进行写操作等问题。

阿里集团技术共享平台核心系统研发部海量数据技术专家罗李认为,在Hadoop技术的使用上,还是应该从业务解决出发,有海量数据需要处理,并且计算模型并不太复杂,对数据进行处理的过程可以分成一个个小的步骤去完成,就可以尝试Hadoop 技术。

京东“电商云“布局

京东商城目前正在构建一个“电商云”,用云计算给大数据提供一个开放式的、分布式的计算的技术支撑。据京东商城副总裁李曦介绍在分析和建模都投入了大量的力理,如何把分析结果快速的通过报表工具展现,如何为数据进行实时的建模,比如用户买了一段奶粉,当她再买的时候,仍会推荐一段奶粉,而不是二段、三段的奶粉。

京东商城数据部资深架构师李松林在数据收集方面早已实现了全面自动化,同时为了保证数据质量,以给最后的数据挖掘和分析,以及最终呈现给用户的关联搜索和个性化营销,他们采取了3种方法。一种是首先保证数据源的质量,其次是通过一些手段对初级收集的数据进行清洗,第三是从审计方面再次保证数据的质量。

当当网对于大数据的探索

当当网副总裁胡毅表示,数据挖掘其实最大的价值是让我们更多的去了解我们的用户。一方面是借助数据挖掘,使我们知道用户是一个什么样的情况,有些什么样的变化。第二方面,数据挖掘会对于改善我们的用户体验,帮助我们发现一些新的机会。

热词搜索:

上一篇:胡善庆:大数据终结传统 改变国家管理方式
下一篇:大数据加强企业信息安全 从收集大数据开始

分享到: 收藏