基于数据网格环境的k近邻查询

庄毅 庄越挺 吴飞

浙江大学计算机科学与技术学院,杭州310027

摘  要:

提出一种在网格环境下的k近邻查询方法——GkNN.到目前为止,尚未有文献提出数据网格环境下的k近邻查询算法.当用户在查询节点提交一个查询向量和k,首先以一个较小的查询半径。在数据节点进行基于双重距离尺度的向量缩减,然后将缩减后的向量按照向量“打包”传输的方式发送到执行节点,在执行节点并行地对这些候选向量进行距离(求精)运算.最终将结果向量返回到查询节点.当返回的向量个数小于k时,扩大半径值,继续循环直到得到k个最近邻向量为止.理论分析和实验证明该方法在减少网络通信开销、增加I/O和CPU并行、降低-向应时间方面具有较好的性能,非常适合海量高维数据的查询. (共10页)

相关文章:

主题相关 参考文献(15篇) 耦合文献(43篇) 
参考文献+更多
相关期刊+更多
    社区热帖+更多
    • 快讯
    征稿/教育/培训/出国