尿布与啤酒—数据仓库的经典故事ManBetX平台

日期:2019-01-28 09:03返回列表

  在美国或世界其他国家,人们谈到数据仓库时往往会津津乐道尿布与啤酒的故事。而这个故事的主角就是 Wal*Mart,它目前拥有世界上最大的数据仓库系统,总容量达到 24 TB。

  总部位于美国阿肯色州的 Wal*Mart是世界上最大也是发展最快的零售商, 1997年其营业额为 1,193亿美元。它在美国拥有三千多家分店和连锁店,1996年, Wal*Mart 在中国的深圳和东莞也相继开了两家分店。

  Wal*Mart 的数据仓库始建于80年代。自1980年以来,NCR 一直在帮助 Wal*Mart经营世界上最大的数据仓库系统。1988年 Wal*Mart数据仓库容量为 12GB,1989年升级为 24GB,以后逐年增长,1996年其数据量已达7.5TB,1997年为了完成圣诞节的市场预测和分析,Wal*Mart将数据仓库容量扩展到 24TB。

  利用数据仓库, Wal*Mart对商品进行市场类组分析 (Marketing Basket Analysis),即分析哪些商品顾客最有可能一起购买。 Wal*Mart数据仓库里集中了各个商店一年多详细的原始交易数据。 在这些原始交易数据的基础上, Wal*Mart利用自动数据挖掘工具(模式识别软件)进行分析和挖掘。一个意外的发现就是:跟尿布一起购买最多的商品竟是啤酒!按常规思维,尿布与啤酒风马牛不相及,若不是借助于数据仓库系统,商家决不可能发现隐藏在背后的事实:原来美国的太太们常叮嘱她们的丈夫下班后为小孩买尿布,而丈夫们在买尿布后又随手带回了两瓶啤酒。既然尿布与啤酒一起购买的机会最多, Wal*Mart 就在它的一个个商店里将它们并排摆放在一起,结果是尿布与啤酒的销售量双双增长。由于这个故事的传奇性和出人意料,所以它一直被业界和商界所传诵。

  这个故事仅仅是 Wal*Mart借助数据仓库而取得的一连串成功故事的一个花絮而已。如今,ManBetX平台 Wal*Mart利用 NCR 的 Teradata 对超过 7.5TB的数据进行存储,这些数据主要包括各个商店前端设备(POS、扫描仪)采集来的原始销售数据和各个商店的库存数据。 Teradata 数据库里存有 196亿条记录,每天要处理并更新 2亿条记录,要对来自 6000多个用户的 4.8万条查询语句进行处理。销售数据、库存数据每天夜间从 3000多个商店自动采集过来,并通过卫星线路传到总部的数据仓库里。 Wal*Mart数据仓库里最大的一张表格 ( Table)容量已超过 300GB、存有 50亿条记录,可容纳 65 个星期 3000多个商店的销售数据,而每个商店有5万到8万个商品品种。利用数据仓库, Wal*Mart在商品分组布局、降低库存成本、了解销售全局、进行市场分析和趋势分析等方面均有卓越表现,下面分别介绍这几个方面。

  作为微观销售的一种策略,合理的商品布局能节省顾客的购买时间,刺激顾客的购买欲望。 Wal*Mart利用前面提到的市场类组分析 (MBA),分析顾客的购买习惯,掌握不同商品一起购买的概率,甚至考虑购买者在商店里所穿行的路线、购买时间和地点,从而确定商品的最佳布局。

  加快资金周转、降低库存成本是所有零售商面临的一个重要问题。 Wal*Mart 通过数据仓库系统,将成千上万种商品的销售数据和库存数据集中起来,通过数据分析,以决定对各个商店各色货物进行增减,确保正确的库存。数十年来, Wal*Mart的经营哲学是代销供应商的商品,也就是说,在顾客付款之前,供应商是不会拿到它的货款的。NCR 的 Teradata 数据仓库使他们的工作更具成效。数据仓库的决策支持系统每周要处理 2.5万个复查查询,其中很大一部分来自供应商,库存信息和商品销售预测信息通过电子数据交换 (EDI) 直接送到供应商那里。ManBetX平台,数据仓库系统不仅使 Wal*Mart省去了商业中介,还把定期补充库存的负担转到供应商身上。1996年底, Wal*Mart开始通过 Web站点销售商品,商品都是从供应商处直接订货。 Web站点销售相当成功,在其投入运营的第1个周末就卖出了一百多万件商品。

  各个商店在传送数据之前,先对数据进行如下分组:商品种类、销售数量、商店地点、价格和日期等。通过这些分类信息, Wal*Mart对每个商店的情况都有细致的了解。在最后一家商店关门后一个半小时,Wal*Mart已确切知道当天的运营和财政情况。凭借对瞬间信息的随时捕捉,Wal*Mart对销售的每一点增长、库存货物百分比的每点上升和通过削价而提高的每一份销售额都了如指掌。

  Wal*Mart 利用数据挖掘工具和统计模型对数据仓库的数据仔细研究,以分析顾客的购买习惯、广告成功率和其它战略性的信息。 Wal*Mart每周六的高级会议要对世界范围内销售量最大的15种商品进行分析然后确保在正确的时间、正确的地点有正确的库存。

  Wal*Mart 利用数据仓库对商品品种和库存的趋势进行分析,以选定需要补充的商品,研究顾客购买趋势,分析季节性购买模式,确定降价商品,并对其数量和运作作出反应。为了能够预测出季节性销售量,它要检索数据仓库中10万种商品一年多来的销售数据,并在此基础上进行分析和知识挖掘。

  Wal*Mart 神奇的增长在很大程度上归功于建立了基于 NCR Teradata的数据仓库系统。数据仓库改变了Wal*Mart, 而 Wal*Mart 改变了零售业。在它的影响下,世界顶尖零售企业Sears、 Kmart等先后建立了数据仓库系统。1996 年, Wal*Mart 和 NCR 联合获得数据仓库研究所 VLDB 技术领域的最佳实践奖。ManBetX平台凭借数据仓库, Wal*Mart 乘风破浪,1997年其销售额增长 15%,Walton 家族财产也雄踞《福布斯》世界富豪最新排名第二,仅次于微软的比尔盖茨。 Wal*Mart 的成功给人以启示:自知者英,自胜者雄,唯有站在信息巨人的肩头,才能掌握无限,创造辉煌。