导言
许多公司已经在IT方面进行了耗资巨大的投资,以便更有效地管理企业从而在竞争中占领优势地位。在过去的30年中,企业中不断增长的大量重要数据都已经采用电子方式进行存储,而数据量在将来不短的时间里还将继续增长,然而,如果不对数据的健康性进行考虑的话,企业就不能充分利用其价值,这是因为信息隐藏于数据中,想要洞悉其意义并非易事。例如,一个零售商店可以每天将每位客户的购买信息详细地保存下来,但想明了隐含其中的众多微妙的购买模式却依然困难;同样,一家保险公司可以将索赔的历史资料详细保存下来,但想找出其中欺诈行为的共同特征也仍然很不容易。
幸运的是,数据挖掘领域的进步可帮助客户更有效地改进数据,并从中获取透视信息,使企业在竞争中脱颖而出。简而言之,数据挖掘工具能让客户找出以前无法探知的隐藏于重要业务数据中的信息,这些数据消耗了大量存储空间,可能存贮于文件或数据库管理系统中,也可能存贮于各种操作系统平台中。对于这种数据挖掘工具来说,准确、高效和开放的体系结构是相当重要的。
本文将对成功实施数据挖掘的业务需求及相关技术进行探讨,另外将对IBM对数据挖掘问题的解决方法进行讨论。
业务需求
许多行业中的公司,如零售、金融、保健、保险等,一般都要维护大量的客户行为及偏好等方面数据,而隐藏其中的客户行为模式可帮助企业调整营销策略、降低风险并改善营亏情况。
例如,零售商通常想了解商品的共同销售情况,知道了72%的客户在购买某种苏打的同时会购买另一种土豆片,这将有助于商家对商品的陈列进行适当调整,优化利用货柜空间,同时改进销售策略。进行这样的相关度分析的结果是,零售商将不必在销售苏打时对土豆片进行打折,因为这将造成不必要的利润损失。
另一种类似的需求是对某段时间内发生的历史购买模式进行了解。例如,某一种模式可能是这样的:64%的顾客在订购某种睡袋和背包后,随后将订购野营帐篷。了解到这个信息后,邮购公司就可以通过缩小或扩大营销对象范围来获得更高成功率,增加销售收入。
其他行业中,很多也有类似需求,都希望从日常存储的数据中找出隐藏模式以满足业务需要。数据可以是多方面的,比如采油数据、证券市场数据、消费者数据等等,众多公司所面临的问题是怎样在一个合理的时间框架和可接受的成本范围内将这些模式发掘出来,这正是新技术成果(比如IBM解决方案)发挥威力的地方。
潜在的行业应用领域
金融和保险行业很久之前就已经意识数据挖掘的好处,但实际上这种技术在许多领域都可以有效应用。本部分将列出一些应用领域的例子,IBM的解决方案可以在这些领域中得出不定的且有益的结果。
零售/市场营销
鉴别客户的购买行为模式
找出客户人口统计特征间的联系
预测何种用户将会对邮件产生反应
银行业
探测欺骗性信用卡使用行为模式
鉴别“忠诚”客户
预测将改变信用卡隶属关系的客户
测定客户群的信用卡开支
找出不同财务指标间隐藏的相关性
从历史市场数据中找出证券交易规律
保险和保健
赔付分析:测定何种医疗程序是共同赔付的
预测何种客户将购买新的保险项目
鉴别风险客户的行为模式
鉴别欺诈行为
运输
在各条路线间确定配送计划
分析装载模式