人们往往认为数据是客观的,因为它来自真实世界,是不带有情感和立场的。但是,在当今激烈竞争的信息时代,越来越多的证据表明,数据是一个加工过且被解释的产品。从这个角度看,所谓的客观数据只是人们在信息社会中发挥的一种充当神话的作用。
首先,人们可能会对数据的收集过程和采样方法产生怀疑。事实上,对于那些不愿公开数据收集方法和来源的组织,数据是否可信往往是个问题。此外,人们也需要警惕数据被忽略或随意删除等操作产生的误差。
其次,数据的处理和解释也需要高度警惕。统计学家和数据科学家们往往要在数据中进行选择、分类、过滤、变换等处理,以此来发掘数字背后的意义。然而,在选择处理方法时,个人的偏见和意识形态也可能会对结果产生影响。即使是相同的数据,不同的处理方式也可能会得到截然不同的结论。
最后,从一个更广泛的视角看待问题,人们还需要意识到,数据即使是来自一个看似非争议决不带偏见的来源,但由于时间、政治、文化等各种因素的影响,它也很可能是有偏见的。比如一个时期的调查结果即使有大量人口,但如果是有限样本会导致样本来源的错误。
这不是说数据没有价值或没有必要。但是我们需要越来越意识到数据也是有远多于其物理外在名片的属性和背景存在的,必须移出我们对数据客观、无偏等表面价值的固着想象。数据之所以有价值,除了在代表真实世界一事,还在于它能够提供有用的信息工具,有助于我们自己、社会和世界的理性化管理。
了解更多有趣的事情:https://blog.ds3783.com/