数据采集标注:AI产业落地的「价值」新高地( 五 )

但事实上 , 为算法提供足够优质的婴儿奶粉 , 并不是一件容易的事 。

在数据采集标注服务中 , 尤其是数据标注 , 一度被外界描述为“血汗工厂”——在不少中国的三四线城市乃至山区 , 从事数据标注的人们遍布其中 , 无数大量、廉价的标注工作填充着他们的闲余时间 , 进而为人们带来一定的报酬 。

但就本质而言 , 这种机会正在越来越少 , “随着标注行业的持续推进 , 更多重复性的数据已经不需要再被标注 , 更多精细化的、专业化的数据和场景才是目前的刚需 。 ”

摘掉廉价劳动力的帽子 , 不难发现数据AI数据服务行业正在发生着从量到质的本质变化 。

一个最简单的例子是 , 如果是人脸检测 , 那么利用人们的拉框标记就可以很快满足需求 。 但随着专业AI公司要求的提升 , AI已经不再仅仅是做人脸检测 , 而是视线追踪、或是微表情检测 。 很显然 , 这类需求很难通过互联网或者众包用户采集完成 。

有不少前沿性的公司已经意识到这种改变 , “Testin有数的办法是自建数据采集基地 , 搭建专门的场景实验室 。 目前 , Testin有数已经有了200多人的研发与产品经理 , 以及近千人的数据标注团队 。 ”

推荐阅读