数据产品的设计误区

数据产品(data product)在大数据与人工智能智能时代有很多定义,比较倾向的是:通过使用数据方便最终目标实现的产品。在该定义中,避免了简单的将数据产品与解决问题的方案等同起来。如淘宝数据魔方、百度指数、站长统计平台等都是数据产品。由于数据产品的特殊性,在设计数据产品的时候通常有很多的误区,其中之一是过分依赖高深的算法和客观的机器纪录与机器学习等。


作为数据工程师,通常具有严谨的精神,在面临实际问题的时候,总是希望先找到一种适合的算法、模型、机器学习方案,但是,通常情况下,这个需要投入很多资源才能实现。有个案例是研究餐馆的餐桌的使用率与环境变量的关系,如果采用建模的方式,需要人脸识别、机器学习等高深的数据工具,但是,采用人工的方法,进行餐桌时间的纪录,既在设计前期避免了巨大的投入,又能够对可能的假设进行验证,以方便形成后期数据产品设计的可行方案。另外一个著名的案例是Facebook的朋友推荐模型,如果采用数据模型与算法,估计会非常复杂,在研究的早期采用人工的办法,找到了最为简单的办法,其实背后所依据逻辑非常简单,如果甲与乙是朋友,乙与丙是朋友,则,有可能甲与丙是朋友,背后的算法非常简单,对Facebook朋友圈的扩大起来很重要的作用,到现在为止,Facebook仍在使用该系统,笔者在最近在Facebook交了一位俄国朋友,结果,Facebook最近把该先生的 几乎所有朋友全部推荐过来了。机器与人在数据产品设计最初的表现见下图,在最初时候,使用人工能够节省工作时间与工作投入。

总之,数据产品设计的时候,不要完全依赖机器与算法,需要从最早想要实现的目标来布局,避免走入胡同中,浪费大量的投资,当产品的初设成熟之后,再进行算法、机器学习的产品设计阶段。

作者: 远景顾问

Business consultant, focus on improving people, process and performance.

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注

此站点使用Akismet来减少垃圾评论。了解我们如何处理您的评论数据