必威体育Betway必威体育官网
当前位置:首页 > IT技术

微软 Bing 背后的关键算法开源了

时间:2019-10-08 10:10:00来源:IT技术作者:seo实验室小编阅读:77次「手机版」
 

微软bing

几年前,网络搜索很简单,用户输入几个关键字,然后就可以一页一页的查看搜索结果。

如今,用户还可以直接用手机拍照,然后把照片放到搜索框,或者通过ai助手就可以搜索,甚至还可以直接输入问题,得到一个确切的答案,而不是返回无数页的搜索结果

用户的搜索的偏好并不是什么新鲜事——自从Web搜索诞生以来,竞争一直很激烈,如今,由于人工智能的进步,满足这些不断发展的需求变得越来越容易,其中包括必应搜索团队微软亚洲研究实验室(Asia research lab)的研究人员首创的AI技术

近日,微软在GitHub上发布了一款最先进的人工智能工具,它可以作为一个开源项目更好地满足人们不断变化的搜索需求。本周三,微软还通过微软的人工智能实验室发布了用户示例技术和相关视频

算法称为SPTAG (Space Partition Tree And Graph)分布式近似最近邻域搜索(ANN)库,允许用户利用深度学习模型在几毫秒内搜索数十亿条信息,这足以说明返回搜索结果有多快。

640?wx_fmt=png

这种搜索方式比关键字搜索更简单。例如,如果用户输入“巴黎塔有多高?”Bing可以返回一个自然语言的结果,告诉用户埃菲尔铁塔有1063英尺,尽管搜索查询中从未出现过“埃菲尔”这个词,搜索结果中也没有出现“高”这个词。

首先,微软采用预先训练的模型并将数据编码到矢量中,其中每个矢量代表一个字或像素。然后使用新的 SPTAG 库生成向量索引。随着查询信息的进入,深度学习模型将该文本或图像转换为向量,该库紧接着就能在索引中找到最相关的向量。

微软表示,通过bing搜索,SPTAG 库迄今已对超过 1500 亿条数据进行了改进,其中包括单个单词、字符、网页代码段和完整查询等。

“Bing 每天处理数十亿个文档,现在的想法是将这些条目表示为向量,并搜索这个 1000 亿以上向量的巨大索引,以便在 5 毫秒内找到最相关的结果”。

640?wx_fmt=png

该库现已开放使用,遵循MIT许可协议,目前在GitHub上已经获得 1280 个Star,131 个Fork(GitHub地址:https://github.com/microsoft/SPTAG)

精彩回顾

♡ 程序员究竟能干多少年?

♡ 互联网公司各岗位真实工作内容起底

♡ 一次尴尬的采访和程序员的传奇脑洞!

♡ 天一冷,程序员都穿上格子衫

♡ 史上最真实的行业鄙视链曝光

♡ IT公司老板落水,各部门员工怎么救

♡ 宿命之战:程序员VS产品经理

♡ 作为一个前端,可以如何机智地弄坏一台电脑

♡ 程序员跟产品经理打起来了,这是一个需求引发的血案...

♡ 后端说,你个前端不会用 headers吧,我怒了!

♡ 有个厉害的程序员女朋友是什么体验?

♡ 多年来,程序员经常加班的真相终于揭开了…

640?wx_fmt=gif

相关阅读

拼多多平价背后:一个万亿增量的大市场

今年互联网最火的两个词是下沉和增长,一夜之间,所有的互联网企业都在做下沉市场,都在做用户增长,而目前做下沉和增长最好的当属鼻祖拼

MD5算法

算法原理 对MD5算法简要的叙述可以为:MD5以512位分组来处理输入的信息,且每一分组又被划分为16个32位子分组,经过了一系列的处理后,算

各种排序算法总结(全面)

目录 冒泡排序 改进的冒泡排序(鸡尾酒排序) 选择排序 插入排序 二分插入排序 希尔排序 快速排序 归并排序 堆排序 计数排序 基数

匈牙利算法

本文是结合趣写算法系列之–匈牙利算法的学习笔记。什么是二分图?简单来说,如果图中点可以被分为两组,并且使得所有边都跨越组的边界

可能是求质数最高效的算法

这标题,怎么感觉好像有点震惊体的意思了。先上代码: C++版: #include <iostream> using namespace std; int prime(int n); int main

分享到:

栏目导航

推荐阅读

热门阅读