网文平台Pratilipi创始人Ranjeet:我们要做印度的“阅文集团”( 六 )

Pratilipi提供的就是YouTube这样的平台。如果你在Pratilipi上发表一些内容,它的质量还不错,那你就可以在很短的时间内获得百万的阅读量,就个人而言,如果没有一个大平台的帮助,几乎没有人能获得百万阅读量。

志象网:Pratilipi如何甄别平台上的非法或者不适合展示的内容?

Ranjeet:不适宜出现的内容,主要有仇恨言论、假消息,或者是质量很差的内容等。

除去那些本身质量很差的内容外,其他内容的基本上遵循两种方法:一是用户自己可以将这些内容屏蔽,他们会选择原因,这些原因就会反馈到我们的语言团队,然后我们会进行处理,类似于Facebook或YouTube。

另一种方法其实也是推荐引擎的一部分,有一些专门为此设计。它检测平台的仇恨言论、侵犯版权之类的内容,然后也会对此进行标记,然后反馈到我们的语言团队去核查。

这个引擎也会参考多种参数,会用到机器学习,我们有自己的数据科学家来负责。

机器学习在能真正能使用之前,需要大量的训练数据。Pratilipi因为已拥有大量的用户和内容,所以积攒了较多的数据。但是,印度本地语言训练的数据仍然比较欠缺,所以它还是不那么准确。但这正是我们在尝试解决的问题。

推荐阅读