想学 AI,先搞懂这件小事!( 三 )

责编 | 胡巍巍

近年来 , 随着人工智能技术的普及 , 特别是大规模人脸识别技术的应用 , 市场对于大规模向量高性能检索的需求越来越急迫 。 本文主要阐述大规模向量检索场景下的数据管理策略 , 包括如何使数据更适合向量检索引擎的并行检索 , 如何减少数据在各级缓存中置换的性能损耗 , 以及未来的优化方向 。

什么是向量检索?

我们知道 , 计算机只是一个电子设备的集合体 , 它没法像人一样感知这个世界 。 怎样使得计算机也能认识这个世界呢?计算机只认识数字 , 它只能通过数字来量化这个世界 , 用一组数字来表示一个事物 , 这样的一组数字就是一个向量(Vector) 。 如果一个向量由n个数字组成 , 它就是一个n维向量 。

拿目前广泛使用的人脸识别技术来说 , 计算机从照片或视频中提取出人脸的图像 , 然后将人脸图像转换为128维或者更高维度的向量 。

推荐阅读