帮百度AI干脏活累活的公司，都死了( 六 )_：帮百度AI干脏活累活的公司

这两三年，AI模型对数据采标的复杂度和精细度要求也越来越高了。比如说，现在，做一个人脸拉框，人脸的拉框精度要求在五像素以内或者三像素以内；又或是，整批数据精确度需在97%或者99%以上。贾宇航认为，精度的提高是AI行业发展的必然结果。对于AI行业，有一句话叫 Garbage in, Garbage out，低精度的标注数据对于算法没有任何意义。只有能持续输出高精度采标数据，才是一个能持续保持竞争优势的服务商。

第二，更庞大、更多样的数据规模。庞大在于数据量会更大，以传感器为例，随着传感器成本下降，并被大量应用，将有更多大量的数据需要被标记；更多样指的是更丰富的数据维度，在今年的CES展上，松下推出的智能家居解决方案，不仅仅通过电视上的摄像头观测人脸的疲劳度，还通过椅子上的电容传感器，去检测人的心跳。而之前，疲劳检测只是通过摄像头捕捉人脸。将来，更多维度的数据将被收集，不单单是2D的图象、声音，3D的激光雷达以及心跳数据等也将被纳入到采标的范围内。

3.转折点

需求侧的变化，不可避免地在供给侧引起不小的地震。供给侧开始从密集劳动型行业向新产业、新模式——工具+众包转型。洗牌开始了，数据采标迎来了下半场。