大数据 BIG DATA,这个词我们大家一定不陌生,只要我们用度娘搜索一下,就会出现它的定义、特征、应用、意义等等一大堆信息,然而读下来却像是味同嚼蜡,读完像是懂了又像是什么都不懂。
大数据,跟我们日常生活有关系吗?
能指导我们针对问题做决策吗?
能为决策提供可信的数据支撑吗?
普通人真的能跟大数据扯上关系吗?
北大光华学院王汉生先生,通过他的作品《数据思维》告诉我们,作为非专业从事数据研究的我们,不需要关心数据本身,我们需要的是“数据思维”。
数据思维关心的核心问题:解决业务问题创造商业价值,让数据变成商业价值。
那好,我们关心上述命题中的两个关键概念:
1- 什么是数据:凡事可以被电子化记录的才叫数据。因此数据有很强的时代特征,过去不是数据的今天可能已经成为数据了,因为随着科技的发展,我们电子化记录的课题越来越多,比如影像,声音等等。那么,未来什么样的东西会变成数据?也是一个值得我们思考和关注的方向。
2-什么是价值:这里我们专指商业价值,也就是对我们商业模式的核心业务产生的积极正面的影响。定义清楚这两个概念之后,我们就需要解决一个问题,从“数据”到“价值”这个通道,我们如何实现?王汉生先生给我们指出,这个通道分为3个过程。
第一步:把一个业务问题定义为一个数据可分析问题,这个过程叫做回归分析。做到这一步需要什么能力?首先要确定业务的核心目标,即确定Y,然后思考什么样的因素可能会影响这个Y,也就是一系列的X,如果我们能把Y和X阐述清楚,那么这就是数据可分析问题。也就是领导者或决策者要认识到你所做的事情和哪些数据相关。
第二步:从这里之后就是一个纯技术问题,由专业人员通过技术分析、机器学习、各种各样的回归模型、深度学习的算法,来抽象出X和Y之间的相关关系,通俗的说,就是这一系列的X,是如何影像Y的,是否存在直接的因果关系,如不存在,那么这些因素是如何相关的?
第三步:当我们有了数据分析和模型之后,如何把它产品化。所谓的产品,不一定是一个物理存在的实体,它可以是一个优化的流程,可以是一项制度,可以是一款软件或者小程序,任何在商业环境中被实施而且产生价值的,都叫做产品。产品化的实现,就不只是专业的数据分析团队的任务,很多时候还需要结合管理者的智慧。
书中王汉生先生还表达了他朴素的数据观:数据预测不可能达到一个极其精准的高度,因为有可预测的,就一定有反预测的存在,这种预测的精度会有一个极限,这个极限不可能因为任何技术手段的提高而改变。不要过度放大数据的商业价值,在大多数场景下,数据是不能产生特别了不起的效果,要有这个谦卑的起点。我们要做的是,认可和接受这个预测的不准确,然后通过产品和商业模式的创新,让更多的人体会到它的美好。
至于如何将一个业务问题定义成一个数据可分析问题,王汉生先生在书中有许多生动的例子,大家可以阅读原作。
在这里我结合自己的工作,试图提炼一下自己工作内容中的Y与X。
Y:寻找优质供应商,采购优质产品。
X1:目标供应商现有的客户群以及与这些客户的合作关系,这个可以体现在总客户数量和与每一个客户在过去5年中的年交易量,每个单品的结算价格以及与行业平均结算价格的比对,客户的付款周期,这样可以分析出该供应商目前的客户组成结构,如是否有长期稳定的优秀客户,而我作为新客户,是否有突破的机会。
X2:目标供应商的短期-中期-长期发展规划:比如年计划年增长率是多少,3年之后5年之后他的现有客户是否能消化所有对方的产量。每个单品的质量评价,是不是高于平均质量水平,是否值得我作为重点目标去开发。生鲜作为非标产品,质量是非常难衡量的,所以可以体现在三方质检的数量上,以及该质检的具体内容的分析。
X3:目标供应商每个单品的产季与国内销售市场销售价格曲线的对比。一切价格都取决于供求关系,如果产季短且集中在该单品产出的高峰期,是很难在目标市场赢得好价格的,因此要研究单品的出产周期。
X4:对单品在销售市场销售价格的预测,因为好的产品只有在对的时间段到达市场才会产生客观的利润:该预测的依据数据主要有三点。第一、历史同期价格以及每个时间段所发生的事情(例如假期、天气、大事件等,这里可以单独重新提炼一个Y和X系列来分析)。第二、产区的供给情况,整个行业产量总趋势,这个趋势也与气候、病虫害等系列因素相关。第三、该单品的替代品的供给情况,例如同类单品,同一单品的其他产地国的供应情况等等。
但是必须注意的是,数据的采集是有成本的,要分析做这些数据分析能产生的价值是否能覆盖掉采集这些数据的成本。另外,数据采集的可操作性,因为很多数据关系到竞争者的核心利益,如果是这样,那么这些数据基本是拿不到的。
通过该X系列,就能指导我更精准的把握单品品种以及提高目标供应商的命中率,从而提高自己的业绩,为公司创造更大的价值。