大数据时代如何避免陷入“算法崇拜”

网友投稿 862 2022-11-18

本站部分文章、图片属于网络上可搜索到的公开信息,均用于学习和交流用途,不能代表睿象云的观点、立场或意见。我们接受网民的监督,如发现任何违法内容或侵犯了您的权益,请第一时间联系小编邮箱jiasou666@gmail.com 处理。

大数据时代如何避免陷入“算法崇拜”

要防止陷入"算法崇拜",还需从源头上了解算法的前世今生,而算法是和数据紧密联系,算法源于大量数据的产生和沉淀,为了让数据具备可追溯和可归纳,同时让数据具备商业化价值,各种各样的算法产生了。

举个例子,墨迹天气APP是较早的提供天气实时服务的手机应用,它的技术原理是通过对接公共开放的天气数据接口(技术上叫API接口),获得海量的、实时的天气数据,获得的原始数据只是各种有关天气的参数,普通人根本看不懂,怎么让大众都能直观的看明白呢?

于是产品经理设计出APP呈现出来的视觉效果和产品的实现逻辑,而JAVA工程师开发出整个APP的系统后台供数据导入,关键的原始天气数据则由算法工程师根据产品模型进行逻辑演算,最终呈现出来就是我们看到的APP界面。

再深入理解一下这个案例,比如我们看到墨迹天气APP今天显示温度是20度,下雨,于是算法工程师会把类似温度、下雨量等数据综合分析,然后再提取与这个温度适配的穿衣出行的常规数据,比如天气是下雨的20度,会提醒你穿秋衣并且带伞,而不下雨的20度,则会提醒你穿秋衣和利于出行游玩。

更厉害的算法还会进行深度计算,除了利于出行游玩,还会推荐周边哪些地方适合游玩等信息,这就需要APP除了对接天气数据,还需要对接生活、出行和旅游景点等数据。

通过上述案例,我们看到一款优质APP算法的复杂性,也正是因为算法的复杂程度,包括获取各种数据的渠道和难度不一,结果是建立了一定的技术壁垒,同时,技术其实都是通用的,关键是数据壁垒让竞争对手无法超越,从而产生了"信任垄断"效应,由此逐步在用户心目中建立了信任感而引发"算法崇拜",这点我们在下节详述。

对于技术,我们一贯的观点是技术的就是人文的,技术终归是为人性服务,大数据和算法也不例外,脱离了人性的技术,也就无所谓应用和商业价值。

既然算法是源于数据,我们先看一下数据到底是什么?根据科技作家,原阿里副总裁涂子沛老师在《大数据》中非技术语言的描述:

数据分为两种,一种是小数据,就是像气温、面积、大小等源于测量的数据,或者一般性统计,如人口多少、土地面积多少这些常规的数据;另一种就是大数据,源于记录的行为,也就是基于有信息背景的数据,有规律可循、有行为痕迹可循。过往的大数据通过各种行为的记录,今天则是产生于无处不在的传感器和微处理器。

海量的数据无论是小数据还是大数据,首先是一个沉淀的过程,当我们需要数据时,会从一个个数据仓库中提取数据进行数据清洗,这个过程把不需要的数据过滤掉,留下对自己有价值的数据,最后进行数据分析和演算,而分析和演算就是通过算法来实现。

目前,我们通过算法主要演绎四种数据,分别是:

行为数据:也就是我们生活和工作的各种行为产生的数据。如餐厅消费、坐地铁打车等;

状态数据:即某个事物或生物的固有状态数据。如台风参数、森林绿化指标、人体状态等;

社交数据:我们通过微博、微信、抖音等社交媒体产生的登陆、时间、评论、分享等行为数据;

工业数据:生产、设计和制造过程中产生的数据,这是工业智能化的基础。

而算法就是基本基于以上四种数据进行各种分析、演绎和模型输出,最终呈现出我们看到的各种应用,包括人工智能和物联网的发展,也是基于算法来实现。比如搜索引擎的推荐算法、地图应用的导航算法、外卖APP的排名算法、音乐APP的偏好算法等等。

正是大数据的庞大和算法的复杂,导致的数据壁垒使得算法呈现神秘感,而从古开始,人们对未知领域力量的感知会油然而生一种莫名的信仰和崇拜,就如对神秘的太空一般。

上一篇:数据科学家与数据分析师的三个区别
下一篇:大数据的三大特质与应用挑战
相关文章

 发表评论

暂时没有评论,来抢沙发吧~