想学 AI,先搞懂这件小事!( 七 )

根据使用的场景 , 可以分为静态库和增量库 。 静态库就是数据固定不变的 , 一旦完成数据导入 , 基本不会再接收新的数据 , 这种场景主要注重检索的性能;增量库在用户使用向量检索的过程中可能还伴随着持续的数据插入 , 需要考虑的问题要多一些 , 比如数据插入后多久可见 , 怎样兼顾检索效率和插入效率 , 如何保证宕机数据不丢失等等 。

目前 , 用于向量检索的最热门工具是Facebook开源的FAISS向量搜索库 , 另外 , 微软也开源了一个SPTAG库 。 用户可以无需深入了解向量聚类和向量相似性计算的算法 , 就能使用这些库实现简单的向量检索 。 但是这些只是最基础的工具库 , 其功能并不包括对向量数据的管理 , 不具备高可用性 , 缺乏监控手段 , 没有提供分布式方案 , 以及缺少各种语言版本的SDK等等 , 这也使得用户需要基于它们进行大量的开发才能满足生产环境的要求 。

【END】

热 文 推 荐

? 5G 比 4G 快 , 不只是因为......

? 抖音回应视频泄露: 草稿不会上传后台; 苹果开卖5000元印度版iPhone XR; Jboot 2.2.5发布|极客头条

推荐阅读