欧易

欧易(OKX)

国内用户最喜爱的合约交易所

火币

火币(HTX )

全球知名的比特币交易所

币安

币安(Binance)

全球用户最多的交易所

百度智能搜索到底有多智能?

时间:2022-09-22 21:44:43 | 浏览:649

u1s1是什么意思?干饭人又是个啥?当在北戴河阿那亚的剧场里被突然问到类似稀奇古怪的问题,一时发懵的我只想当场掏出手机,给对方来个“百度一下”。说起来,搜索这项“旧技术”最近的讨论声浪还真有点大。君不见那边新搜索工具广告天天见,这厢听着海风

u1s1是什么意思?干饭人又是个啥?

当在北戴河阿那亚的剧场里被突然问到类似稀奇古怪的问题,一时发懵的我只想当场掏出手机,给对方来个“百度一下”。

说起来,搜索这项“旧技术”最近的讨论声浪还真有点大。

君不见那边新搜索工具广告天天见,这厢听着海风看话剧的百度万象大会现场,老牌搜索引擎也打出了“百度一下 生活更好”的新Flag。

其实,正如百度集团执行副总裁沈抖现场所说,大家对搜索太过熟悉,以至于感受不到其中技术的变革,搜索的技术存在感那是真“感知不强”。

但实际上,“AI技术为搜索提供了持续进化的动力”。

要知道,从古早的文本检索到今天的人工智能,网络世界的网页数量已经从千万级别,增长到了千亿级别,其中囊括的内容可能比世界上所有图书馆加起来还要丰富。

在今天,想要高效连接今天的互联网用户和海量信息,搜索引擎其实真的没那么简单。

那么,究竟是怎样的技术在驱动搜索引擎更智能地读懂你的需求,连接丰富而又准确的信息?

技术本身在海量信息增长面前,又经历了怎样的进化?

今天,不如就借着这阵势,我们来好好说道说道。

从文本检索到人工智能

现在,在使用搜索引擎时,你可能不只会用几个关键词,还会直接输入你想问的问题。

但其实早期的搜索引擎采用的是文本检索的方式,只能做到用户查询关键词和网页文本内容的匹配。

可想而知,虽然这样的方式也能把不同网页的关联度进行排序,但总体的搜索质量是比较差的。

而实际上,网页之间有着丰富的链接关系,就像高引论文往往本身质量更高,高质量的网页通常也会被更多的网页链接。

为了进一步挖掘和利用这种链接信息,1996年,李彦宏开发了Rankdex,即超链分析算法。这是世界上首个使用超链接来衡量网站质量的搜索引擎。

也就是说,搜索引擎在收到一个用户查询之后,不仅仅会去匹配网页的内容,还会看看其他网页对这个页面的“评价”。

在此之后,谷歌也提出并使用了类似的PageRank技术,并大获成功。

超链分析算法,可以说是当今每个主要搜索引擎排名算法的基础。值得一提的是,在谷歌创始人拉里·佩奇的第一项网页排名专利申请中,也引用了Rankdex。

如果说早期的搜索技术门槛不算高,从超链分析这个阶段开始,一些今天大家伙普遍依赖的搜索引擎,就开始一骑绝尘,拉开差距了,比如谷歌,比如百度。

并且这些做搜索引擎起家的公司,如今也都成为了人工智能领域的先行者。

而事实上,甚至在人工智能未成显学之时,为了让搜索结果更快、更精准、更个性化,搜索领域的巨头们就已经着手将机器学习的方法引入到搜索引擎中。

谷歌就在2016年上线了基于反向传播技术的RankBrain算法。该算法可以基于语义分析和词库联想,帮助用户更快地搜索冷门的搜索结果。

而如今在NLP领域大火的BERT,也已被部署到谷歌搜索当中。有了预训练语言模型的加持,即使你输入的是一大段文字,搜索引擎也能够get到你想查什么。

根据谷歌的数据,BERT的引入为至少10%的搜索结果带来了改善。

国内,百度同样是最早投入人工智能技术研发的科技公司,在2010年就成立了单独的NLP部门。

以搜索引擎技术为核心,在过去十余年中,百度演化出了语音、图像、知识图谱、自然语言处理等人工智能技术。这些长期的技术积累,甚至在今天进一步拓展到了自动驾驶、AI芯片等领域。

这也是为什么,在今天,搜索引擎不仅仅能按照你输入的文字进行搜索,甚至直接给一张图、一段音乐,AI也能理解你想要获取怎样的信息。

正如沈抖所说,打开百度App,你说出想问的问题,可能旁边的人还没听清,百度搜索已经能够提供精准的答案。而当你在阿那亚的任何一个角落,看到不认识花草苗虫,打开相机使用视觉搜索,也能快速得到答案。

智能搜索时代背后的关键技术

所以,进化到智能搜索时代,让搜索引擎高效连接你和信息的核心技术,具体又有哪些?

正好,在百度万象大会上,沈抖也介绍了百度AI是如何推动搜索持续进化的。我们一项一项来看个仔细。

深度语义匹配模型

2013年,百度搜索就上线了基于百亿级用户行为数据的SimNet语义匹配模型,使得搜索结果的相关性得到明显提升。

简单来说,SimNet利用词向量技术解决了关键词匹配失败的问题,可以有效得到同义词、近义词之间的相似度,并且具有较强的泛化能力。

在实际应用场景下,海量的用户点击行为数据会被转化为大规模弱标记数据,再搭配并行训练算法,SimNet首次实现了可完全取代基于字面匹配的策略,而且可以直接建模非相似度类的匹配问题。

其核心网络结构形式,包括BOW、CNN、RNN、MMDNN等。

而基于这样的深度语义模型,百度搜索已经将一次全库语义检索的时间优化到了10ms。

跨模态深度阅读理解技术

前文也说到,有AI加持的搜索引擎,不仅仅能读懂文字,还能听懂语音、看懂图片。

其实,机器认知世界的方式,也不仅仅局限在自然语言,还包括对语音、视觉等多模态信息的综合应用。

为此,百度重点研发了知识增强的跨模态深度语义理解技术。

一方面,打造拥有超过50亿实体5500亿事实的多元异构知识图谱。通过将知识作为背景信息,增强了模型的语义推理能力。

另一方面,通过知识关联跨模态信息,运用语言描述不同模态信息的语义,进而让机器实现图像和语言、语音和语言的一体化理解。

基于这项阅读理解技术,百度还在EMNLP-MRQA 2019阅读理解国际测评中,以超出第二名近2个百分点的优势获得冠军。

智能化多模搜索技术

2015年,百度就提出了多模搜索的理念,探索从文本搜索向语音、视觉、视频等多模态搜索的演进。

而这或许也是智能化搜索在用户层面最直观的体现——在百度App中,你可以体验语音搜索、拍照搜索、实时翻译、植物识别、视频搜索等丰富的搜索方式。

除了前面提到的跨模态语义理解,在语音搜索上,百度搜索还集成了语音识别、语音合成等多项AI技术,让搜索引擎能“听”会“说”,不仅能够听清、听懂,还能深入理解语义,给出绘“声”绘色的最佳搜索答案,让搜索引擎与用户之间的交互方式变得更加自然、流畅、便捷。

视觉搜索上,百度搜索综合了图像识别、人脸识别、OCR、物体检测、实体匹配等多项视觉技术,并依托于搜索系统对全网图像、视频内容的索引以及用户行为,得以细粒度的识别用户实时录制的视频流、拍照及上传图片中的实体和文字,进而围绕实体在用户视觉场景下的需求,链接并组织相关内容及服务提供给用户,实现诸如拍题搜索、商品搜索、实时翻译、植物识别等智能视觉搜索能力。

是的,不仅仅是图文,作为当前最红火的通用信息载体,视频现在也可以直接用来搜索,并且结合百度超大规模的知识图谱,能实现精准的搜索、定位。

本次万象大会上,百度短视频生态平台总经理宋健还最新发布了好看视频知识图谱产品功能,并提出“帧视频”的概念。

“帧视频”能延伸知识信息的密度,让短视频的知识含量浓缩到“帧”的颗粒度,推动短视频成为更好的知识获取的载体。

智能搜索不只是搜索

说了这么多,有没有觉得日常的搜索背后,涉及到的信息量属实庞大?

在今天,信息的获取方式看似便捷,但海量资讯涌来的同时,也带来了越来越多的无效信息。

这也是为什么我们会希望搜索的结果更加精准。

而在此之外,我们还更希望搜索更能读懂人的意图,更节省时间、更高效地解决问题。

基于这样的用户需求,如百度,一方面在持续增强搜索本身的属性,形成知识服务产品体系,提高首条搜索满意度。

而另一方面,因为搜索天然与各种服务场景具有连接性,百度也在围绕“搜索+服务”做加法,以进一步降低用户的决策成本,提升服务能力。

所以,这也就解释了为什么百度App品牌升级为“百度一下 生活更好“。

在这样的背景之下,智能时代的搜索不再是简单的信息检索,而是人们与信息、服务等各种解决方案之间的高效连接方式。

此外,智能搜索和智能推荐融合,还会进一步扩大化这种效率的提升。

沈抖对此解释说:

所谓“人格化”,是放大每一个创作者的才能,并把生态里的创作者和用户直接相连,更快速地满足用户需求。

百度副总裁、百度App总经理平晓黎就举了这样的例子:在知识分享领域,以往通过搜索,人们只能找到相关的静态页面;而搜索进化后,百度还可以直接将搜索结果连接到能提供该结果的人,如专家、自媒体、知识博主等,进一步消除信息差。

而“服务化”,则是让用户“所见即所得”。

围绕这样的核心战略,基于搜索,百度把短视频和重点垂类放在了关键位置上,百度健康、百度电商业务也在万象大会上首次公开亮相。

归根结底,从搜索到服务的落地,有很多的场景可以选择,而这些场景的服务实现,又恰恰需要搜索不断进化,从搜索到智能搜索。而想要做到这一点,背后对技术能力的要求着实不低。

事实上,也有不少业内人士认为,搜索自诞生之初,就拥有类似于人工智能的属性:你在搜索框中提问题,机器来找出答案提供服务。

而作为人工智能技术的第一块试验田,不论是搜索还是机器都在不断进化,搜索现在也确实成为了人工智能技术的集大成者。

其越来越“机智”的进化背后,驱动力正是来自百度这样的企业、研究机构长期积累的AI能力,让搜索从原来的搜索分发,到提供服务,提供人格化的内容和交互体验。

下一个十年,搜索技术还会有怎样的超进化?

你还有怎样的期待,不妨在评论区一起聊一聊~

参考链接:
[1]https://en.wikipedia.org/wiki/Robin_Li
[2]https://lusongsong.com/info/post/406.html?__SAKURA=11996c0e2fcf9a9a499373a06e725a6ea1618368577_198393
[3]https://zhuanlan.zhihu.com/p/80491738
[4]https://blog.google/products/search/search-language-understanding-bert

— 完 —

量子位 QbitAI · 头条号签约

关注我们,第一时间获知前沿科技动态

相关资讯

百度搜索引擎已死?百度回应

搜索结果中百家号内容占比小于10%广州日报讯 (全媒体记者倪明)22日晚,一篇名为《搜索引擎百度已死》的文章刷屏。文章指责用百度搜索引擎,搜索出的结果一半以上会指向百度自家产品,而百家号充斥着大量营销和质量低劣的内容,导致百度搜索的内容质量

百度一下,你就知道了?再见,百度不想再做搜索引擎了

欧界报道:“百度一下,你就知道”这句广告词想必所有的网友们都知道,对于绝大多数网友而言,百度应该是认识的第一个网络工具,这么多年来,百度搜索早已深入到网民的心中,百度就等于搜索,尽管目前百度也推出了其他方面的APP,但是百度的这一形象难以改

百度搜索遭质疑:众里寻他千百度 那人却在三页后?

睡前聊一会,梦中有世界。大家好,我是党报评论君。对很多人来说,搜索引擎是通往互联网世界的入口。但就在最近,一篇引来广泛转载的文章却指出,百度搜索结果的第一页上,大量内容都会指向百家号等自家产品,表示这像是“百度自家的站内搜索”。百度公司也迅

李彦宏:搜索是百度根基,百度搜索首条满足率达51%

搜索是百度的根基 【李彦宏:搜索是百度根基 ,百度搜索首条满足率达51% 】在百度2019第二财季业绩会上,李彦宏表示,百度搜索首条满足率达51% 。李彦宏的内部信中,他也强调搜索是百度的根基,是百度的核心价值,要始终坚定地投入,做最好的搜

“百度搜索引擎已死”?逃离百度

21世纪经济报道 杨清清 北京报道1月23日,百度APP向21世纪经济报道记者推送了一条达沃斯相关的企业新闻,作者为不知名的百家号小号,随后相关企业向记者证实其为假消息。【编者按:百度“窘态”】百度又一次引起争议,这一次是因为百度搜索的结果

百度App日活超2.3亿 百度搜索迎来全面视频化

在2020百度移动生态大会上,百度副总裁、百度App总经理平晓黎在演讲中提到,截至目前,百度App日活已突破2.3亿,每天人均打开次数超过10次。过去一年,百度App人均使用时长和服务次数增长均超过30%,端内搜索规模同比增长59%,首位满

百度搜索总裁:全民视频大爆发时代已经来临,百度将全面拥抱

5月22日,在主题为“新生态,联未来”的2018百度联盟生态峰会上,百度高级副总裁、百度搜索公司总裁向海龙以“新‘视’代”为题发表了主题演讲。向海龙表示,技术的发展让视频成为最直接最高效的沟通方式,全民视频大爆发时代已经来临,百度依托AI能

百度:使用百度搜索如遇假冒、钓鱼欺诈等网站受损失,将不设上限“全额”先行保障

新京报快讯 百度微信公号发布关于百度搜索品牌官网、公立医院的三问三答。其中表示,尽管百度一直致力于打击仿冒网站、黑色产业等,但总有一些不法分子想方设法,试图侵害网民的权益。因此,早在2013年5月,百度就与中国消费者协会联合发起了首个搜索引

百度李彦宏:百度搜索和信息流仍是核心业务

而该说法也十分符合一直在网上流传的“百度All in AI”的说法。但是在今年的极客公园创新大会IF2018上,李彦宏首次否认了百度All in AI说法。李彦宏在与极客公园创始人张鹏对谈的环节,李彦宏称自己从来没有说过“All in AI

“一搜就是百家号”,百度搜索引擎已死?百度最新回应来了……你赞成吗?

一直以来,百度搜索长期占据着国内搜索引擎市场的“头把交椅”,大量网民通过百度搜索,在纷繁的互联网上寻找自己想要的信息。但是最近,有人却对百度的搜索质量出了质疑。1月22日晚,一篇名为《搜索引擎百度已死》的自媒体文章刷屏,指责百度搜索结果一半

百度回应“搜索引擎百度已死”:百家号内容小于10%

22日晚,一篇名为《搜索引擎百度已死》的文章刷屏。文章指责百度搜索结果一半以上会指向百度自家产品,尤其是百家号,而百家号充斥着大量营销和质量低劣的内容,也导致百度搜索结果的内容质量大幅下滑。23日,百度发布回应,称目前百度搜索结果中,百家号

有用户反映百度搜索无法使用 百度方面人士:正在查

11月9日早间,多位微博用户在社交平台反映,百度首页页面无法登陆,搜索功能无法正常使用,电脑版和手机版网页均登不上。一位用户微博写道:“百度为啥突然崩了…换了三个浏览器都打不开,拿手机也打不开。”《每日经济新闻》记者接触的多位“百度使用异常

“百度搜索引擎已死”文章引争议 百度副总裁如此回应

【CNMO新闻】近日一篇名为《搜索引擎百度已死》爆红网络,文章认为百度搜索已经沦为百度的引流工具,其中搜索结果一半以上都会指向百度自家产品,百家号尤为严重。此外百家号素质参差不齐,充斥着大量营销和低质量文章,导致阅读质量大幅下降。讽刺的是,

产品经理日报第1088期|百度推出新产品——熊掌号,服务于百度搜索

哈喽,你我相约七点半,你来了么^_^产品经理日报继续为您带来今日最新的资讯:百度正式发布熊掌号,提供链接全网内容能力;Twitter开始清理违规认证账号,移除认证徽章标志;百度发布手机百度语音版:无需唤醒词语音控制信息流;PayPal 推出

刷屏!搜索引擎百度已死?搜索结果内容低俗、大量指向百家号?百度回应,作者也回应了

昨日,自媒体新闻实验室一篇名为《搜索引擎百度已死》的文章刷屏。文章指责百度搜索结果一半以上会指向百度自家产品,尤其是百家号,而百家号充斥着大量营销和质量低劣的内容,也导致百度搜索结果的内容质量大幅下滑。对此,百度回应称,百家号内容占比小于1

友情链接

网址导航 SEO域名抢注宝宝起名网妈妈知道币圈邵阳新闻头条网跆拳道培训网今日泰安黄明昊歌迷网水族养鱼器材网丝绸绸缎网中医养生网免费算姻缘网铜金属期货网蓝月亮洗衣液评测网西藏旅游网全球军事网宋氏起名字大全今日牡丹江社区团购网
慧为智能股票-慧为智能股票行情走势、美格智能股票行情、美格智能股票千股千评、美格智能股票代码、美格智能最新消息、赛为智能最新消息股价、达华智能最新消息股吧、慧为智能科技股票行情。
慧为智能股票 aihuobi.cn ©2022-2028版权所有