微软开源了 Bing 搜索背后的关键算法
微软刚刚宣布开源一项 Bing 搜索背后的关键算法——SPTAG,它使 Bing 能够快速将搜索结果返回给用户。
SPTAG (Space Partition Tree And Graph)是分布式近似最近邻域搜索(ANN)库,为大规模矢量搜索场景提供高质量矢量索引构建、搜索和分布式在线服务工具包。利用 SPTAG 算法作为开源 Python 库的核心,Bing 能够在几毫秒内搜索数十亿条信息。 当然,矢量搜索本身并不是一个新想法,微软所做的是将这一概念应用于深度学习模型。 首先,团队采用预先训练的模型并将数据编码到矢量中,其中每个矢量代表一个字或像素。然后使用新的 SPTAG 库生成向量索引。随着查询的进入,深度学习模型将该文本或图像转换为向量,该库紧接着就能在索引中找到最相关的向量。 微软表示,SPTAG 库迄今已对超过 1500 亿条数据进行了编目,包括单个单词、字符、网页代码段和完整查询。 “Bing 每天处理数十亿个文档,现在的想法是将这些条目表示为向量,并搜索这个 1000 亿以上向量的巨大索引,以便在 5 毫秒内找到最相关的结果”。 Bing 团队期望开源 SPTAG 可用于构建可识别基于音频片段所说语言的应用,或用于让用户拍摄植物照片并识别属和物种的服务。 该库现已开放使用,并提供构建和搜索这些分布式矢量索引的所有工具。 【编辑推荐】
点赞 0 (编辑:92站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |
- 微软、苹果、Google及火狐四大浏览器将终止支持TLS 1.0、1.
- windows-7 – 作为开发人员,我应该升级到Windows 7,如果是这
- 如何做好Linux系统安全加固之账号安全?11个安全小技巧分享
- windows-xp – 通过无线适配器连接两台笔记本电脑,无需无线
- 微软第一个测试版的 Chromium 的 Edge 浏览器已经上线
- 用于Linux桌面的4个扫描工具
- windows-vista – 如何诊断关机时挂起的Windows PC?
- windows-7 – Windows 7可以做软件RAID 10(1 0)
- win10专业版和企业版的差别有哪些方面
- 将数据传递到Windows中的电子