对话旷视孙剑:比TensorFlow还早半年,旷视Brain++的进化法则( 八 )

其具体方式是先以少量的标注训练出一个初级的算法 , 然后以这个算法来标注数据 , 接着对于算法标注过程中遇到的不确定的数据 , 人工的对其中最不确定的数据进行标注 , 算法则再一次对剩余数据进行自动标注 , 进而以最小的时间与成本代价获得了更高效更快速的标注结果 。

此外 , 在数据方面 , 旷视还在今年年初联合北京智源人工智能研究院发布了一个包含70万张图片的数据集Objects365 , 其中包含了365中常见的物体以及超过一千万个标注框 , 是目前世界上最大的物体检测数据集 , 相较此前最大的COCO数据集 , 是其十倍之多 。

Brain++中的人工智能基础框架则可以简单地认为是旷视完全自研的TensorFlow或者PyTorch 。

作为一个典型的第二代AI开发框架 , Brain++相较“前辈”Caffe更灵活 , 可定义的程度也更高 。 另外 , 旷视还结合了其自主研发的旷视AutoML技术可以为神经网络针对不同平台进行自动的优化 , 进一步提升了算法的灵活性 。

使用者每个人都能像登录虚拟机一样登录计算平台 。 而且不必调试好之后再提交任务 , 只要自动申请需要的CPU/GPU数量 , 而且还可以在训练的过程中随时停下来进行调试 , 找出错误的地方后然后继续训练 。

推荐阅读