帮百度AI干脏活累活的公司,都死了(13)

据昝智介绍,龙猫数据是较早使用众包模式做数据采标的,“我们用众包把事情做成了,很多跟进者也开始用众包去做。”昝智认为,龙猫数据打造出了“倚天剑”。他不觉得学龙猫数据的人能够做好众包,“早进入这个行业的玩家,有一把宝刀,他们用这把宝刀获得了利益,然后看到别人拿了倚天剑获得了更大利益,为了造倚天剑,他不可能把宝刀丢了。刀丢了,他们可能啥都没了。但不丢刀,他们又很难造出倚天剑。因为人的精力是有限的,思维是局限的,他们不可能一边把精力放在宝刀上,又一边造倚天剑,而且造倚天剑还比我们造得好,这不科学。”

昝智认为,龙猫数据没有宝刀,“接到客户需求,我们只能优化系统,才能保证准确产出数据。对于他们来说,接到客户需求,他们还有退一步的路可以走,那就当场监督大家认真去干。他们是有退路的,我们也没有退路,我们必须把它搞定。有退路的时候,人一急了,就容易选退路了。”据了解,目前,龙猫众包平台有400多万用户,其中只有一千多是做标注的。龙猫数据的标注业务主要由一千多个渠道商团队承担。

2.建模还是不建模?

贾宇航提到数据标注的产业链可分为三个部分:人员、工具以及算法。而Testin云测坚持做好人员+工具,不做算法。“数据具有可复制性这一特点,如果采集标注公司会算法,这有点像一个算法公司找另一个算法公司做标注,这一份数据到底是否用于乙方的提升,这中间存在一定的争议。”“我们是在数据领域服务的企业,而不是卖算法的公司。我们只负责完成企业的数据采标需求就可以了,完成了交付,我们将彻底清除客户数据。”

推荐阅读