10
大数据方案工程
现在,你准备将之前所有的训练和展望工作总结为一个方案。但什么是“方案”?构建一个方案需要什么具体的技巧和流程?
大数据的问题在于并没有一个现成的技术方案。你不能仅安装Hadoop、预测性分析或一个数据应用,就假设它能提供一个大数据方案。数据行业之前就存在这个难题,在过去的10~15年间,数据仓库技术和商业智能技术一直在寻找组织内的相关性。为了获得大数据和预测性分析的成功,需要一种被称为方案工程的新工程技术。
工程学有很多科目——系统工程、电子工程、机械工程,何不设立一个方案工程?方案工程会是这样定义的:
确认一个组织的关键业务计划并将其分解为业务支持能力和支持性的技术成分,以便支持组织的决策和数据货币化工作,这种过程称为方案工程。
让我们看看方案工程流程中的各个步骤。
方案工程流程
令人惊讶的是,方案工程的流程有点像玩乐高积木。最成功的乐高项目是那些心中已有目标的——一个完全定义好的、有合理限制范围的方案。我想要建造海盗船、城堡还是空间站?有了乐高积木,这三个我都可以建造。不同的方案会要求不同的积木按照不同的路线构建成不同的形状。要获得大数据在业务上的成功,重要的是提前确认你的组织想要构建的方案,然后按照正确的路线或指引,组装和集成正确的数据和技术能力,最终得到成功的方案。
在这个环节中,我提出了方案工程的6个步骤,以便确认、构建并开发出一个业务方案(如图10–1所示)。方案工程的6个步骤包括:
明白组织如何赢利。
确定你的组织的关键业务计划。
集体讨论大数据的业务影响。
将业务计划分解为用例。
证明用例是合适的。
设计并实施大数据方案。
图10–1 方案工程的流程
这个过程要求你提前花时间进行创造性思考,了解你的组织是怎样赢利的。这意味着你要花时间识别你的组织的战略名词,也就是那些战略业务实体——客户、商店、雇员和产品,你的组织围绕这些建立了细分的业务流程(例如获得、维护、优化、管理)。你需要明白这些战略名词在组织的价值创造过程中所处的地位。你需要确认组织的关键业务计划,明白这些计划希望对战略名词产生怎样的影响。这种认知和信息将会引导你的方案工程工作并使其重点突出。这些活动使用的途径和方法在第7章中已经介绍了。
第一步:明白组织如何赢利
假设你是组织的总经理。花时间仔细考虑组织是如何赢利的。例如,组织将如何增加利润、减少成本、降低风险或增强适应性?
组织有很多方法可以赚更多钱。比如增加利润可以包括:增加贵宾卡或金卡的会员数、增加商店或网站的客流量、降低客户流失率、提高每一单购物的利润、提高自有品牌的销量占市场购物篮的百分比、改进交叉销售或向上销售的效果、优化营销效率(如图10–2所示)。降低成本可以包括降低存货成本和供应链成本、减少欺诈和业务缩水、提高营销支出的效率、整合供应商、改进及时的运输和配送、优化降价促销以及提高资产的利用和转换。
图10–2 大数据可能带来的商机
花时间识别并了解组织的战略名词,确定那些名词是如何提高组织的赢利能力的。例如如果你在航空业,枢纽是你的业务中很重要的名词,只要你能够增加每个枢纽的航班数量(例如增加飞机的转机次数或者提高候机楼和停机坪的使用效率),就意味着每天更多的航班,也意味着更多的钱。如果你经营电影院,优惠是非常重要的名词。只要你能够增加影院客户的优惠市场购物篮(例如购买汽水和爆米花或者买大容量的饮料还是小容量的饮料),也意味着更多的钱。
花时间使用组织的产品或服务,直接体验组织的产品或服务的性能。成为一个客户,去熟悉用户体验并了解客户和合作商对产品的感觉。
有了这些观察,你已经做好了准备,可以提起笔开始展望有关客户、产品及运营的新的认知将如何帮助组织提高赢利能力。例如你的组织处在B2C市场,你可以很容易地想到组织可以利用客户互动的内部数据(比如电子邮件、客户评论、服务日志或医生的医嘱)以及客户互动的外部数据(比如社交媒体上的发帖、点评类网站或日志),挖掘有助于优化客户互动过程的洞见(例如描述客户特征、细分、确定目标、获得、激活、培养、维护以及拥护),打造更具赢利性的客户(如图10–3所示)。
正如我们在第8章中讨论到的,在大多数行业中:
• 0~25%的客户贡献了超过100%的利润。
• 50%~60%的客户没有贡献利润。
• 10%~25%的客户贡献负利润。
图10–3 客户赢利能力的分布
因此,方案工程在B2C行业中面临的挑战在于如何利用大数据分析来:
将客户移动到赢利曲线的上方(通过交叉销售使他们购买别的商品、通过向上销售使他们购买更具赢利性的商品和服务、将品牌产品换成自有产品以提高市场购物篮的赢利性)。
以更加节约成本的方式服务不产生利润的客户(例如通过网络、自助服务或通过合作伙伴)。
第二步:确定你的组织的关键业务计划
下一步是进行初步研究,了解你的组织的关键业务计划。这包括阅读年度报告、听取分析师的意见、搜集执行管理层最近的演讲和展示。如果可能的话,采访高级业务管理人员,了解他们的首要业务计划、业务机会以及他们认识到的可能阻碍组织成功实现首要业务计划的关键挑战(稍后我会在这一章中提供一些建议和案例,说明如何阅读一个组织的年度报告以挖掘大数据商机)。
捕捉每一个确认的业务计划或业务机遇的关键信息,例如:
• 业务的利益相关者以及他们的地位、责任和期望。
• 衡量业务计划成功与否的关键业绩指标和度量。
• 递交的时间。
• 关键成功因素。
• 期望的结果。
• 核心任务。
注意回顾第6章中使用大数据战略文件将组织的企业战略分解成它的关键业务计划、期望结果和关键成功因素。
第三步:集体讨论大数据的业务影响
方案工程的下一步是集体讨论大数据和预测性分析将如何影响所选的业务计划。就像在第7章中谈到的,大数据和预测性分析可以通过4种途径推动组织的关键业务计划(大数据业务的四大驱动因素,如表10–1所示):
表10–1 大数据业务的四大驱动因素
以最低的粒度挖掘更多详细的事务性数据,以保证更加精确的决策。例如,分析详细的事务性数据,比如客户忠诚度,以保证更加精确的决策。针对不同的客户、不同的季节或节假日以及不同的所在地或地理位置挖掘新的数据货币化机遇。
整合新的非结构化数据,保证更加令人信服、更加完整的决策。这既包括内部非结构化数据,例如客户评论、呼叫中心的记录、电子邮件、医生的医嘱以及服务日志,也包括外部的非结构化数据,例如社交媒体上的发帖、日志、智能手机应用以及第三方或公开的数据。我还加入了传感器产生的数据,例如智能电网、汽车间通信以及这一类的智能应用。这些不同种类的新数据提供了新的变量、指标和维度,可以把这些融入分析模型以获得可操作的、实质性的业务洞见和业务推荐。
提供实时(低延迟性)的数据,以缩短从出现数据事件到分析该数据事件之间延迟的时间,这保证了更频繁、更及时的决策和数据货币化。这既包括建立基于需求的客户分类(根据某些例如超级碗这样的重大事件的结果),也包括从智能手机和移动应用中挖掘的实时的、基于地理位置的洞见。
将预测性分析融入核心业务流程,以提供新的机会挖掘隐藏在数据中的因果关系(原因和影响)。预测性分析为业务上的利益相关者提供了新思路,鼓励他们在探索新的数据货币化机遇时使用新的动词,如优化、预测、推荐、评分以及预报。
在这一章中我会提供不同行业的一些案例,说明如何利用大数据业务的四大驱动因素来生成业务方案。
第四步:将业务计划分解为用例
开展一系列采访和思维/展望训练,集体讨论支持所选的业务计划所需的用例,对这些用例进行确认、定义、整合以及优先级排序。就像在第9章的愿景训练环节提到的,你要捕获每一个已经确认的用例的以下信息:
• 所选定的人物和利益相关者,包括他们的地位、责任和期望。
• 如果业务的利益相关者可以得到更详细、更多样化的数据,他们会尝试回答或者可以回答的业务问题。
• 业务的利益相关者尝试做的业务决策以及支持性的决策过程,包括时间设置、决策过程以及下游的利益相关者。
• 衡量业务是否成功的关键业绩指标和关键度量。
• 数据要求,包括来源、可获得性、获得方法、更新频率、粒度、维度和层次结构。
• 确认分析算法和建模要求,例如预测、预报、优化和推荐。
• 捕捉用户体验的要求,这可以和用户的决策过程紧密联系。
这是采用排序矩阵的大好机会,运用群体动力把不同的业务用例进行排序,并建立信息技术人员和业务人员的共识,以推举出比较优先的用例。
注意在第三步和第四步中有绝佳的机会可以运用之前在第9章中谈到的思维训练,集体讨论新的想法,将这些想法融入业务相关的用例,并且根据业务价值和可执行性将这些用例排序。
第五步:证明用例是合适的
现在是时候采用数据和技术证实用例的可行性了。这是引入价值证明分析实验的好机会,可以充分利用可得到的数据和技术能力证明用例是合适的(财务模型、投资回报率和分析支撑)。你对想要的结果有详细的定义,包括关键决策、业务问题、关键业绩指标以及所有其他在第四步中捕捉到的方案细节。你也应该明确地知道建立价值证明所需要的数据(例如数据源、关键度量、粒度、获取频率、维度及其他)、必要的技术和分析能力。价值证明分析实验流程应该包括:
• 从内部和外部数据中收集需要的数据,将数据融入单个数据平台。你想要详细数据,而不是整合后的数据,因为你将要在详细的数据中挖掘实质性的、重要的、可操作的细微差别。你也应该探索使用第三方数据,其中有些数据可以从公开渠道获得,有助于提高分析的质量。这也是引入社交媒体数据的好时机,特别是如果你正在处理的是以客户为中心的用例。
• 在分析之前进行数据的梳理、校对以及准备,定义并执行必需的数据转换流程。这很可能会包括几个数据提炼流程,以建立新的综合指标,例如频率(事件多久发生一次)、时间(最近一次事件发生的时间)以及排序(事件发生的顺序),这可能会更好地预测业务绩效。
• 定义分析测试计划,包括测试假设、测试用例和衡量标准。
• 根据定义好的关键业务指标和关键成功因素建立分析模型并进行细微调整。参与这一环节的数据科学家可能会继续探索新的数据源以及新的数据转换技术,这可能有助于改善分析模型的可靠性和预测能力。
• 定义用户体验的要求,特别是了解分析结果的接收方,以及接收方将如何使用分析结果。
• 建立实例和框架帮助业务的利益相关者了解这些分析结果和模型将如何被融入他们日常的业务流程。
价值证明分析实验的目的是证明业务用例是合适的,建立和巩固基本的数据模型和分析模型以提供分析支撑。你想要加强大规模详细的结构化、非结构化数据与预测性分析的融合,得到更有预见性、实时的分析模型,可以为选定的业务方案传达有实质意义的、可操作的洞见和推荐。
第六步:设计并实施大数据方案
基于价值证明分析实验环节的成功,现在可以定义并建立详细的数据模型、分析模型、技术架构以及生产路线,以便将分析模型和洞见融入关键的运营及管理系统。实施计划和路线将需要确定:
• 数据源和数据获得的要求: 这应该包括一个详细的计划,对获取的数据类型和数据存储的位置进行优先排序(来自同一个数据渠道及分析视角)。该计划需要确定结构化和非结构化数据以及内部数据,这意味着数据计划需要每4~6个月更新一次,添加一些可获得的新数据源。
• 检测战略: 你很可能需要从现有的业务流程中捕捉关于客户、产品和运营的新数据。检测战略需要涉及的新标签、存储信息以及其他检测技术将如何被用来捕捉新的事务性数据。
• 实时的数据源和分析要求: 当数据进入业务流程时,具体的用例将要求实时(或低延迟性)的数据源、分析以及决策。这些实时的要求必须经过整个技术和架构堆栈的处理,包括ETL、ELT(提取加载转换)算法、数据转换、提炼、内存内计算、复杂事件处理、数据平台、分析模型和用户体验。
• 数据管理能力: 大数据行业已经积累了不少经验,开发了很多优秀的工具和方法,可以帮助企业进行数据管理(例如主数据管理、数据质量和数据治理)。但是即使在数据质量足够好的情况下,组织仍需要根据所支持的决策和业务流程进行处理。组织需要认真思考这个问题,避免浪费时间使不完美的数据完美,特别是当数据支持的决策或业务流程并不需要完美的时候(例如广告投放、欺诈检测、基于地理位置的营销以及降价促销管理)。这部分方案要求了解并回答“什么时候90%的准确数据就足够好了”这个问题。
• 数据建模能力: 数据建模的要求包括所有的传统数据仓库架构方法——操作数据存储、数据准备区、数据集市、企业级数据仓库,再加上很多新的、可获得的数据平台及数据联合工具和技术。数据建模计划需要考虑数据库设计和NoSQL数据库(NoSQL意为“不仅仅是SQL”)、Hadoop以及Hadoop分布式文件系统(简称HDFS)的角色。
• 商业智能: 大多数组织已经有了商业智能环境或经营业绩监控环境,在其中处理关键业绩指标、报告、警报和仪表盘要求。现在是时候思考该如何利用诸如非结构化数据、实时数据源以及预测性分析这样新的大数据功能拓展这项投资。我们在第1章的业务模式成熟度指数部分谈到过,组织已经投入了可观的时间、金钱和人力资源建立一个围绕许多关键内部业务流程的商业智能环境。现在是时候开发一个关于如何最佳地利用并拓展商业智能投资的计划了。
• 高级分析的能力(统计分析、预测性建模以及数据挖掘): 这是数据科学组织的范畴,其中大多数我们已经讨论过了,关于营造一个能让数据科学小组自由工作的环境的重要性(我会在下一章谈到分析沙盒的一些高级体系结构组件)。组织还应该开发一个实验战略,找出那些运用实验方法获得关于客户、产品和运营的新认知的业务领域。
• 用户体验要求: 用户体验计划需要包括框架和模型过程,以确保知道分析结果和模型将如何在企业用户的日常运营、管理报告和仪表盘中体现。利用这个机会了解内部用户、外部客户以及业务伙伴对用户体验的要求,并且探寻如何将分析认知融入那些用户环境。
方案工程的业务方案
尽管方案工程将来可能不会成为炙手可热的工作,但是它会越来越重要,因为数据的数量和多样性不断增加,技术能力不断拓展(受到风险投资家和开源运动爆炸性增长的推动),移动设备和更小型的移动应用重新定义着用户体验。随着数据和技术的变革,你将会专注于提交投资回报率高、回收期短的业务方案。
那么,你要如何利用这些大数据的业务驱动探索或展望大数据和高级分析会如何帮助你定义并提交推动核心业务计划的方案?让我们看几个例子。
客户行为分析的案例
客户行为分析中蕴含的大数据机遇在于整合客户的具体事务、新的社交媒体数据以及移动数据。整合的目的是挖掘对客户的新认知,这些认知可以优化你和客户的互动生命周期的全过程,例如描述客户特征、锁定目标、细分类别、获得、激活、交叉销售/向上销售、维护和拥护。这些对客户和产品的认识最终可以通向个性化营销,特别是加上可以通过移动应用获得的实时的客户活动数据和地理位置数据。为了对客户行为有新的认识,组织可以实施以下方案:
• 将所有具体的客户互动事务,例如销售历史、回报、支付历史、客户忠诚度、呼叫中心记录、消费者评论、电子邮件交流以及网站点击,整合进一个单独或虚拟的数据存储库。
• 利用高级分析法分析具体的客户互动事务,对最有价值的客户和客户类型建模并评分,建立更加精细的行为类别,利用这些行为类别和客户评分改进目标客户的特征描述以及客户分类战略。
• 整合并提炼预期数据(例如姓名、公司以及联系信息),通过引导性事件和第三方市场资源收集得到。
• 向客户和预期数据中添加第三方数据,从Acxiom、Experian、BlueKai和nPario这样的供应商处得到客户的人口统计数据,比如年龄、性别、受教育程度、收入水平以及家庭信息。
• 从例如脸谱网、推特、领英、Yelp、Pinterest等网站上捕捉并综合有关产品、服务和公司的相关社交媒体数据。
• 搜索、监控并捕捉产品和公司的拥护者和反对者对产品和公司的相关评论,他们活跃于像WordPress、Blogger和Tumblr这样的博客网站。
• 使用文本分析、Hadoop或MapReduce挖掘社交媒体和博客数据,以便对客户的兴趣、爱好、社团组织以及社交关系产生新的了解,这些可用来改进目标客户的特征描述以及分类模式。
• 利用移动应用实时地掌握客户的地理位置、购买行为以及偏好,从而推动实时的、基于地理位置的推广、提议和交流。
预见性维护案例
对于B2B公司来说,在大数据领域中最重要的机会可能是向它们的业务(以及潜在消费者)市场提供预见性维护服务。大数据分析可以利用电器、设备以及机械产生的传感器数据实时地分析、评分并预测维护需求。任何运作机械的行业,例如汽车、航空、火车、农业机械、家电、能源设备、涡轮机、服务器、商业设备,都可以从预见性维护中受益,这归功于传感器数据和实时分析的结合。为了对预见性维护有新的了解,组织可以构建以下方案:
• 实时地捕捉由电器、设备以及机械的传感器产生的未加工的非结构化日志和错误代码,将它们直接放入Hadoop和HDFS(不要求任何数据预处理,也没有预定义的数据模式)。
• 高级分析历史性能数据,在个体和内容层面建立正常的电器、设备和机械性能构成的预见性模型。像控制图这样的六西格玛技术会非常有助于识别不正常的产品性能。另外,六西格玛法是一种在制造业被普遍了解的方法。
• 利用预先的数据提炼技术,例如频率、时间和次序指标,确认可能暗示维护需要的事件或事件阈值的合并。考虑通过使用关联分析模型算法挖掘活动,并创建一个活动购物篮。
• 整合外部动态数据源,例如天气(温度、降雨、降雪、冰冻、湿度和风力)、交通和经济数据源,确认可以拓展预测模型的新变量。例如,查明湿度可能对你的风力涡轮机产生什么影响,或者雨雪会对火车准点有什么影响。
• 利用实时分析环境监控实时流传感器数据,实时地将其与性能模型和控制图比较,标出潜在的性能问题,并进行评分和排序。
• 向关心的群体(比如技术商或消费者)发送自动警报,包括推荐的维护信息(例如位置、预计被替换的零件、预计的维修人员的技能以及维护的最佳操作文件),创建优化的服务日程表及维修人员日程表。
• 在维护的时候捕捉被替换零件的产品或部件磨损数据,从而在单个设备/机械和零件的层面改进预见性维护模型。
• 整合并分析磨损数据,从而产生有关性能的认知,将其打包并返售给设备、机械、产品和组件的制造商。
营销效果案例
每家公司都会花钱做营销,而且这部分支出越来越多地被用在高度可衡量的数字媒体渠道。对线上营销(以及像电视、印刷品和广播这样的线下渠道)支出的效果进行量化是一个艰难的挑战。可以更加精确地量化并鉴定推动业务和销售绩效的营销渠道和手段的组织能够更好地优化营销支出。为了更好地衡量营销效果,组织可以制订以下方案:
• 合计总的营销支出,包括所有的数字渠道(展示、搜索、社交和移动)和线下渠道(电视、印刷品和广播)。
• 提案并整合所有的营销活动和事务(呼叫、投标、提案以及销售失败和成功)以及线上转化活动,再将这些活动与不同的营销活动和支出建立联系。
• 对于数字数据,从单个用户层面上(cookie级别的详细信息)捕捉展示、关键词搜索、社交媒体发帖、网站点击、鼠标悬停以及相关的转化事务,将其整合放入一个市场购物篮。
• 计算综合指标以及营销手段的频率、时间和次序,从而量化不同营销手段的效果(归因分析)。
• 在活动数据中加入外部数据,例如天气、季节、地方经济、地方性事件以及其他类似的数据,从而改进活动模式和预测效果。
• 将当前活动的业绩与过往活动的业绩以及类似活动的业绩进行比较,从而确认并量化过往活动的业绩驱动。
• 利用从第三方直接营销活动中捕捉到的预期数据建立预期数据库,在其中你可以开展直接营销活动。
• 从例如BlueKai和nParioDMP这样的供应商处获得新的关于客户的数字化认知。
• 开发一个实验战略,测试不同营销手段、营销信息处理和营销渠道的效果。
• 分析社交媒体数据,从而捕捉消费者的兴趣、爱好、社团组织以及社交关系,这些可以提高对客户特征描述、分类以及目标锁定的效率。
• 捕捉实时的社交媒体来源,从而实时地分析、监控活动和产品的发展趋势并采取行动。
• 利用对营销效果的分析和了解,推动活动开始前的不同媒体的分配建议(例如如何分配包括电视、印刷品、线上活动、展示、关键词及其他营销渠道在内的营销支出)和活动中的业绩建议(例如如何再分配包括广告网络、关键词、目标受众和类似条目在内的数字媒体支出)。
减少欺诈的案例
大数据提供了实时识别潜在的欺诈活动的全新技术。新的数据源(例如社交媒体、具体网站和手机)和大数据创新(例如实时分析)使组织在传统的静态欺诈模型的基础上建立动态的、自主学习的欺诈模型,这种模型会在行为性活动、事务性活动以及可能具有欺诈性的活动组合出现之时就做上标识。这是一则大数据欺诈侦测案例:
• 采用实时的数据平台,捕捉并管理来自海量内部和外部数据源的大容量实时数据传送(例如购买、授权和退货)。
• 使用数据库内分析法加快基于历史事务的欺诈侦测模型的开发和改进。
• 使用预测性分析法分析实时事务,根据上万个维度和维度组合对不正常的事务、行为和趋势评分,把这些评分和历史条目进行比较,标识出可能的欺诈情况。
• 采用超前的数据提炼技术,例如活动和事务的频率、时间和排序,创建对可能的欺诈活动、行为和趋势的更加超前的概要描述。
• 整合移动数据和基于地理位置的分析,从而动态地识别并监控出现潜在欺诈行为可能性较高的地理位置、业务和其他(例如加油站、折扣零售商和便利店)。
• 将实时欺诈侦测模型融入运营系统(例如POS机系统、呼叫中心和消费者信息传递系统),从而实时地查询具体的事务或事务组合。
• 利用社交媒体数据确认可能的欺诈群体网络或协会。
网络优化案例
无论你经营的是设备网络(服务器、转换站或风电机组)还是零售商店(门店、网站或分公司),都存在非常珍贵的关于客户和产品的新的数据资源,这些可以被用来确保你“在正确的时间、正确的位置有正确的网点”提供令人愉快的用户体验。负荷过重或不足经常是对网络的重大挑战,那些能力要求和需要会随着消费者和产品的行为和趋势迅速变化。为了优化你的网络运营,一个网络优化方案应该具备:
• 面对所有不同的网络组件和元素,整合网络节点数据(例如日志文件)。在具体事务水平下保留大量历史记录。
• 整合社交和移动平台上的消费者数据,确认并量化客户、网络、市场偏好和行为趋势的变化。
• 在数据资产中添加外部数据源,例如天气、地方性事件、节假日和地方经济数据,继而提供可以提高容量规划和资源调度模型的预测能力的新预测指标。
• 使用高级分析规划网络容量的要求(基于节点、一天中的某时刻,一周的某一天等),计算关键网络支持变量,例如人员、存货、替换的零件和维护日程。
• 利用实时分析重新分配网络容量(资源调度、扩大或缩减云资源及其他),从而支持每天、每小时、不同地理位置的使用模式变化。
作为一个方案工程师,不仅需要深刻认识你的组织正尝试解决的业务问题,而且需要深入了解新的大数据和预见分析创新的能力。采用方案工程流程有助于确认你“在正确的时候采用了正确的技术能力解决正确的业务问题”。如果你对正在解决的问题没有具体了解,在大数据分析能力方面也没有牢固的基础,你会很快回到原来的老方法,用技术“发现业务问题”。
阅读年度报告
我强烈建议利用一个组织的公开文件(例如年度报告和季度财务文件)和公告(例如新闻发布和主管演讲)挖掘大数据的业务机遇。本书的这部分将提供几个真实案例,告诉你从哪些方面来研究年度报告,从而确认可能的大数据机遇,以及如何快速评估应该怎样利用大数据推动那些机遇。
我一直十分惊讶于很少有人花时间阅读公司的年度报告,或者找出组织领导小组中的高级成员做的公开发言和演讲。特别是“总裁致股东的信”,这是一个宝库。正是在年度报告中,总裁会提到过去的一年中他们为公司做的重大事项。依我拙见,这通常占据整封信75%的篇幅,可以直接跳过。信函最后的25%才是最有信息量的,因为正是在这部分中总裁提到了下一年的关键业务计划。让我们回顾几个年度报告。
金融服务公司的案例
下面摘录自一家金融服务公司致股东的信:
这一年我们迈过了一个重要的交叉销售的大关。美国西部地区过度存款家庭目前平均每户持有6.14款我们的产品。我们在东部的零售户平均持有5.11款,而且这个数字还在增长。纵观我们所有的39个社区银行州和哥伦比亚特区,平均每个存款家庭持有5.7款产品(去年是5.47)。25%的存款家庭持有8个或更多的我们的产品。40%的存款家庭持有6个或更多。即使我们的交叉销售达到了8,我们也只完成了一半。每个存款家庭大约持有16款产品。经常有人问我为什么我们将交叉销售的目标设为8(eight),答案是这听上去和“棒极了”(great)谐音。我们新的庆祝语可能会是“让我们向着10再次出发”!
信的这部分强调了一个业务计划,那就是提高客户交叉销售的效果,达到每个存款家庭持有10款产品的目标,这与目前每个家庭持有5.7款产品相比是一个提高。然而10可能是一个大胆的目标,很明显组织中的一些高官(可能主管市场营销的)被特许改善交叉销售的成效。
这里是一些例子,说明了大数据帮助提高交叉销售效果的业务计划。
• 使用具体的客户财务数据和家庭持有账户的类型,再加上关键的账户信息(例如账户持有的时间、账户余额和账户余额的趋势)和家庭人口统计数据,建立更加精细的家庭分类。
• 运行分析模型,计算这些新的家庭类型额外购买某一款理财产品的可能性。例如,持有这些产品并且具有这些人口统计特征的家庭有一定的可能性会额外购买这种产品。
• 针对不同的产品组合和家庭特征,建立不同的模型。
• 使用从脸谱网、Pinterest、Yelp和推特上得到的社交媒体数据来识别理财产品的趋势,识别那些可能进行跨产品推广的候选产品。例如抵押贷款再融资很热门,就试着将抵押贷款再融资和住宅抵押信贷额度进行捆绑。将这些趋势运用到你的家庭/产品交叉销售模型中,从而确定直接营销目标。
• 用仪器标识所有的直接营销和数字营销活动,看哪些信息和提案对哪些受众人群最起作用。
• 开发一个实验战略,以确认对哪些受众群体测试哪些提案。实时捕捉结果并对正在进行的活动进行调整。
零售案例
这个案例使用了一家零售商2011年年度报告的信息。在年度报告中,公司至少有两个部分可以进行结构化数据(例如销售终端、存货、退货和订单交易)和非结构化数据(例如社交媒体、网站日志和消费者评价)的整合,进而推动关键业务计划。下面是致股东的信的第一部分:
我们的战略是以一贯低于别处的价格向我们的会员提供种类丰富的高质量商品。我们寻求将每一条产品线上的特定产品限定于畅销的型号、尺寸和颜色。我们的核心仓储业务中平均每个仓库有大概3 600个活跃的库存单位,这与折扣零售商、超市和超级购物中心45 000~140 000个,甚至更多的库存单位是截然不同的。很多消耗品只能成箱或多包来卖。
这部分强调了大数据有机会帮助推动商店商品类别的优化。特别是大数据可以通过以下这些渠道进行帮助。
• 整合人口统计数据和产品销售数据,从而预测最佳的店铺空间安排(从一个独立商店的角度)。根据地方性事件,例如五月五日节或旧金山巨人队的主场比赛,更加频繁地(可能每周一次)更新最优的店铺空间安排。
• 整合社交媒体信息、消费者评论(例如那些从呼叫中心、电子邮件和网站上得到的)以及店铺和产品的销售数据,从而计算并追踪各个店铺(根据产品类别或季节)的净推荐值和消费者情绪。使用这些信息确认表现不佳的店铺、产品和产品类别并采取行动。
• 利用社交媒体数据确认产品和市场趋势(根据商店和产品类别),这些可以影响商品定价、店内营销和商店空间管理计划。
• 针对不同的商品测试不同的店铺空间安排方案,得出结论并给出建议,从而优化单个店铺和商场的商店空间安排。
接下来是这家零售公司的第二个案例,强调了提高自有品牌的销售效率的业务价值(例如在接下来的几年中,将自有品牌占已售产品的比例从15%提高到30%)。
我们在开发自有品牌以加强会员忠诚度的同时,仍然专注于全国性品牌商品的销售。经过19年的努力,我们的自有品牌产品占所出售产品的比例达15%,但是销售额仅占20%。我们相信我们有能力在接下来的几年中将自有品牌产品的市场占有率提高到30%,同时继续向我们的会员提供优质的品牌产品,这始终是我们产品选择的一部分。
这里给出几个案例,说明大数据如何被用来提高自有品牌的销售效率:
• 整合销售数据、存货数据和社交媒体数据,从而算出最有可能(成功率最高的)引入自有品牌的产品类别。根据不同商店、地理位置和产品类别进行评分。
• 挖掘社交媒体数据,从而确认能够围绕自有品牌产品开展直接营销、店内推广和销售的消费者感兴趣的领域。
• 整合以往的自有品牌产品销售数据,并将这些数据关联到当地的地理变量,例如经济状况、失业率、住房销售和房屋价值的变化、交通状况等。
• 在不同的地理环境和不同的店铺中测试不同的自有品牌战略,从而决定在具体的地理环境中,某些自有品牌产品战略是否更加容易被接受。
经纪公司的案例
第三个案例来自一家经纪公司2010年的年度报告。以下摘自致股东的信:
如果我们想透过客户的眼睛看世界的话,客户反馈是必要的。2009年我们继续了CPS(客户推荐值)项目,采访了客户并邀请他们根据愿意推荐我们的程度从0到10给我们打分。CPS计算的是“推荐者”的数量减去“批评者”的数量,得到客户忠诚度的净指标。个体投资者对我们的CPS评分达到了37%,这是我们的价值定位、投资帮助和指导以及消费者服务的重大收获。独立投资顾问对我们的CPS评分仍旧很高,他们赞赏了我们的回访服务,退休计划赞助者对我们的CPS评分也不错。
年度报告强调了公司计划继续推行客户推荐值项目。2010年,公司获得了至今为止最高的评分,37%。这里给出了几个例子,说明大数据如何被用来推动CPS项目。
• 利用社交媒体网站和博客,建立一个更加及时的、复杂的CPS,这会是一个衡量客户感受和视角的更好的指标(例如,他们向其他人推荐电影的可能性)。
• 整合来自呼叫中心、消费者评论和收到的电子邮件的与消费者的非结构性对话。
• 建立加入了社交数据和不同金融交易的分析数据库,根据最有价值的消费者类别将CPS进行分类并追踪。将客户的金融交易模式与类别分析匹配,从而根据客户类别标识出可能的CPS值下降趋势。
• 建立分析模型分析CPS变量,例如经纪人、经纪公司、经纪人的地理位置、金融话题、一周中的某一天、一天中的某个时段等。将分析结果分类,从而挖掘CPS和经纪合作变量之间的关联。
• 使用CPS对关键客户进行分类。利用推特和脸谱网上的数据监控最有价值的客户类型的情绪趋势,以便更快地察觉并量化(评分)潜在的客户流失和相关的业绩驱动。
• 捕捉关键的经纪人的统计信息(背景、教育、资格认证和经验年数)和业绩数据(客户业绩、满意度评分),从而模型化经纪人的统计信息和客户CPS之间的关联性。
• 建立实时的追踪控制图持续监控关键的经纪合作变量,以防止陷入潜在的困境。根据不同的经纪互动水平建立控制图,例如经纪人、经纪人的地理位置、经纪公司和金融主题。
你已经想到了大数据改变业务的力量,这股力量挑选出的新的关于客户、产品和市场的洞见可以被用来推动高保真的、更加频繁的业务决定。但是为了推动业务转型,你需要“事先在脑中规划好”。你需要花时间了解组织的关键业务计划,思考大数据业务驱动带来的可能性范围(例如更多具体的结构性数据、新的非结构性数据、实时/低延迟性的数据和预测性分析)。开启你的大数据之旅的最佳之举是选择能够在公司年度报告中找到的关键业务计划。
小结
本章介绍了大数据方案工程的概念,提供了从机会确认到方案实施的6个步骤。我举了不同行业的几个例子,强调了一个业务方案能够如何利用新的数据源和新的大数据技术创新。
接着你学习了如何阅读一份年度报告(和其他的公开可获得的数据资源),从而确定在一个组织的业务计划中,哪些会受到大数据的实质性金融影响。然后我回顾了几个例子,通过回顾不同行业的年度报告,确认大数据可以如何影响组织的关键业务计划。
