()F是纯暴力计算的算法,精度最高,但需要在全体候选集上计算相似度,单条查询向量的计算量为万*次浮点运算()F在F的基础上通过F倒排索引,将候选集划分成多个簇(),然后选取部分离查询向量较近的簇计算相似度,,如果将候选集分成_=4个簇,每次查询只选取_=64个簇,则单条向量的计算量为F的6,即65万*次浮点运算
()FQ对比F算法,使用了 牙买加 WhatsApp 号码列表 乘积量化,将维向量切分成组子向量,每组子向量训练出个聚类中心,如果=8,=56,则单条查询的计算量为8*56*次浮点计算+万*8次查表+万*8次加法运算在F算法的基础上,我们考虑通过向量子空间划分的方式,将全量候选集划分为多个向量子空间,每次检索时选取其中的一部分向量子空间,从而减少不必要的计算量,提高检索性能

考虑到外卖搜索的强属性,可以基于来进行向量子空间划分构建索引时,根据商家的地理位置(经纬度)计算值,将全量商品数据划分为多个向量子空间检索时,根据用户的地理位置信息计算其值,并扩展至附近9个或5个块,在这些块内采用F算法进行向量检索,可以有效减少计算量这种向量子空间划分方式有效地提高了检索性能,但是存在
|