表格改变字段时,该如何兼容历史数据?
admin
2021-01-09 16:43:30
0

当原有产品无法满足当前业务发展时,有时候我们会通过改动表格中的字段设计满足业务新需要、服务新场景。而改动“数据表格”的字段很容易引发数据冲突的情况,所以我们有必要去解决“表格改变字段”后产生的数据冲突,去兼容历史数据,减少改动对数据产生的负面影响。那么问题来了,我们该怎么去兼容历史数据呢?

表格改变字段时,该如何兼容历史数据?

业务是不断变化发展的,产品也是会随之不停迭代的,数据表格作为基本组件也常常需要变动,这在我们的日常工作中是非常常见的。

比如下面这个例子,一款分析淘宝商家移动端店铺数据的产品,其中菜单“流量来源”是对店铺流量的分析,在店铺发展初期“淘内免费”、“付费流量”、“自主访问”能够支撑业务方对于店铺数据的分析,但是随着店铺业务不断发展做大做强,对于流量分析的颗粒度要求越来越细,只是对流量的简单划分已经无法满足业务方的需求。希望能对于淘内流量能有更细的分类,帮助业务方对店铺流量有更细致的了解,从而根据不同流量大小调整运营策略,促进店铺销售数据的发展。现状:淘内免费 付费流量 自主访问期望:手淘搜索 我的淘宝 淘内免费其他 手淘微淘 手淘扫一扫等需求:改动“流量来源”数据表格中的字段

当原有产品无法满足当前的业务发展时,为了满足业务的新需要,服务于新的场景。不得不要求我们去改变最初的产品设计,改动表格中的字段设计。而改动“数据表格”的字段很容易引发数据冲突的情况,包括数据类型冲突、数据格式冲突等。

如果在改动表格字段时,不去考虑数据冲突的影响,不去考虑如何兼容历史数据,会导致产品内的数据在完整性和一致性上出现问题,比如上文中案例如果不进行历史数据兼容处理,选择在3.19号上线新的统计功能,关于流量的划分就会存在两种不一样的统计方式,19号前的流量数据划分方式和19号之后不一致,按月维度下没有办法对3月的流量数据做一个统一划分。

历史数据一定意义上成为了“脏数据”,有句话说的好叫“垃圾数据进垃圾数据出”,数据质量对于分析结果的重要性甚至高于分析方式和模型。混入脏数据后产出的结果对业务造成严重的影响,甚至做出了错误的决策,带来不可磨灭的损失

因此,我们有必要去解决“表格改变字段”后产生的数据冲突,去兼容历史数据,减少改动对数据产生的负面影响。那么问题来了,我们该怎么去兼容历史数据呢?

01 历史数据都是需要保留的吗

表格改变字段出现数据冲突的情况后,在我们去兼容历史数据之前可以先思考一个问题:历史数据都是需要保留的吗?一起来看下下面的两个场景。

场景1

某电商to b产品,在一次迭代中,对“店铺销售”菜单增加了“客单价”字段,那么历史数据中的客单价对我们有意义吗?

表格改变字段时,该如何兼容历史数据?

场景2

我们设计了一套问卷用于统计“国内大学生的不同专业的就业情况”,投放问卷一段时间后对问题就行了修改,那么收集的历史数据对我们还有意义吗?

表格改变字段时,该如何兼容历史数据?

通过两个具体的场景,我们可以发现“历史数据”在不同的场景下的保留策略是不同的:

相关内容