原标题:无处不智能:AI数据的“消费升级”,刚刚开始
“新基建”的哨声吹响,想必大家已经从各个渠道感受到了产业智能化的火热。
这一次,AI不再停留于“人工智能又碾压人类了”的科幻剧情,而是化身为社会通用型技术,各种家居、汽车、商超、3C产品等领域,都开始高频出现带有AI身影的宣传。
其中,人工智能三要素——数据、算法、算力中,最基础、最核心的部分——数据,自然也就成为烹饪产业智能化这道美味所必不可少的原材料,也愈加受到更多瞩目。
如果我们将产业智能化的红利,看做是等待切分的蛋糕。那么坐在电脑前对图片或文字一点点打上标签的数据标注师,可能就是在智能沃土上种植小麦的人。
这些处理好的食物,被算法工程师拿到后投喂给机器,教会它们认识什么是猫,什么是狗,行人和红绿灯的区别,“这几天天天天气不好”表达了什么意思……

听起来,AI数据的“种植”是不是挺简单的。确实,在人工智能前期发展阶段,AI数据采集和标注,也常常被看做一个“没有壁垒”的事情,甚至称之为新时代的血汗工厂。
但就如粗谷吃多了总会开始追逐健康、有机、精加工,AI数据行业也早已在我们目之所及的地方,开启了一次“制造升级”。
产业智能化的滋味,你和数据都想了解
虽然AI数据不是算法训练的唯一要素,但绝对是不可或缺的一部分。
一方面,AI数据更丰富且廉价的领域,更容易诞生出AI的火苗。比如机器翻译发展了数十年,积累了非常多的双语对照语料,因此一遇机器学习便化龙,深度神经网络的引入很快让翻译系统的效果全面超越了以统计模型为基础的SMT(统计机器翻译)。如今,NWT神经机器翻译早已是智能语音产品的标配了。
另外,AI数据的质量也决定了AI产品是否贴合使用场景,影响着用户体验乃至产品生命周期。在挖掘人工智能产业化富矿的时候,对AI数据的重视,再怎么强调都不为过。