识别率可怜的只有2%,AI人工智能识图展开的最后冲刺却令人期待( 二 )

这说明目前的(机器学习)模型还不够完善 。 虽然已经有不少研究尝试利用人工数据提升模型的能力 , 但我们发现 , 这些模型在面对某些真实数据(来自真实照片)时往往会出现严重且高度一致的错误判断 。

过去几年以来 , 图像识别工具已经变得越来越好 , 识别速度也越来越快 。 这在很大程度上要归功于斯坦福大学创建的 , 并且其规模仍在持续拓展的开放数据集ImageNet 。 这个庞大的数据库成为人工智能重要的训练素材集合 , 也可以作为新AI系统的参考基准 , 用于训练系统进行图像识别 。

然而 , 解决这最后5%的准确度缺口是个巨大的挑战 。 正因为如此 , 研究人员们才尝试探索其中的原因——即计算机为什么无法解析某些特定图像 。 通过这套新的图像集合 , 研究人员们以手工方式搜索Flickr , 寻找可能会令AI软件陷入混乱的照片 , 将其添加到这套名为ImageNet-A的新数据集内 。 这个数据集中 , 世界上最先进的视觉AI模型确实无法正确识别其中98%的照片 。

推荐阅读