瑞彻斯特logo

AI变革下的“百度一下”

2018-11-02 10:20


AI变革下的“百度一下”

  百度世界大会,百度一年一度的技术和产品展示。

  在今年的百度大会上,Apollo、DuerOS、信息流&手百等都产品均发布了自己与AI结合的最新进展。

  作为百度最广为人知的核心业务,百度搜索也在AI技术的不断加持与变革中,进展飞快。

  如今“百度一下”,有了崭新面貌。

AI变革下的“百度一下”

  AI变革百度一下

  在百度世界大会现场,搜索工程师们透露了最新进展。

  他们认为,虽然搜索系统从被创造的第一天起就是一个人工智能系统,但是随着近年来深度学习技术的快速发展,在AI时代的搜索更加的智能化。

  其中集成了人工智能领域在自然语言处理、机器学习、图像识别、视频理解、语音识别等方向的前沿算法以及高性能架构,变得更加的智能化。

  也可以说:搜索是当前人工智能技术的集大成者。

  具体则体现在三大方面:

  对语义的理解更加精准,排序效果显著提升

  Smart Answer的能力

  从文本搜索向语音、视觉、视频等多模态搜索演进

  而且,这些技术表现,也并非完全神龙见首不见尾,每一项技术之于产品的提升,其实并不是无迹可寻。

  不妨一项项拆分理解。

  AI变革-语义理解

  这项可能要从搜索技术原理说起。

AI变革下的“百度一下”

  在深度学习加持之前,百度搜索更多的策略来自经验匹配规则和大数据挖掘和统计信号。

  如:QUERY = ABC,工程师就会去找和ABC完全匹配的内容和结果。

  算法上则是传统的BM25、proximity等人工算法,而更多Query语义理解和内容语义理解的问题,选择采用多层优化同义词挖掘、相关词挖掘、紧密度、重要性计算等等方法来解决。

  但是,这种做法的较大不足在于错误传播,并且挖掘的方法的泛化效果较差,导致了很多语义相关的结果无法召回,同时系统对结果好坏上没有连续过渡的判断。

  而如果运用深度学习,一切则变得不同。

  通过深度学习技术,让多层神经网络可以自动从百度搜索海量的数据中去学习目标,抑制错误传播的问题,让更多语义相关的结果被召回和排序到合理的位置,更好的满足用户的搜索需求。

  比如在用户搜索中,查询词 “用高温开水将勺子汤锅后,勺子上有一层灰” ,得到结果的过程中,就涉及语义理解。

AI变革下的“百度一下”

  搜索工程师透露,百度早在13年上线了深度语义理解模型,较好地解决了这类问题,深度模型能从海量的数据中自动学习到了“高温”和“开水”、“烫”之间的关联关系,同时也学到了“有一层灰”和“表面污垢”的相关性。

  而如果采用传统匹配算法,在近义相关结果上,就很难将相关性算好。

  正是得益于深度学习算法,最终帮助实现了排序算法提升,可以将优质的结果排上来,提升用户体验。

  此外,早期语义计算还存在一些明显的不足和问题,全文内容信息未引入建模过程,导致建模并不充分。

  进而会有两方面挑战:

  一方面,已成功应用的模型多针对短文本进行建模,在长文本方面直接应用效果并不理想。

  另一方面,对长文本进行在线计算、增加更多的匹配细节信息会导致模型运算量急剧提升,这对系统架构和运算能力是一个非常严峻的考验。

  所以在模型和架构上,也必须要有相应对策。

  百度搜索团队探索后给出2大针对性方案。

  深度学习模型上,研发了Content-Matching-Matrix内容理解模型, ,首次成功刻画了索引对象内容的语义相关性,提供了语义匹配细节信息。

AI变革下的“百度一下”

  △Content-Matching-Matrix内容理解模型结构示例

  基础架构上,研发了Ranking-Service搜索智能化架构,首次将GPU引入大规模搜索引擎在线语义相关性计算中,实现了百度搜索上复杂语义模型的毫秒级运算。

AI变革下的“百度一下”

  △Ranking-Service搜索智能化架构示例

服务支持

我们珍惜您每一次在线询盘,有问必答,用专业的态度,贴心的服务。

让您真正感受到我们的与众不同!

合作流程

网站制作流程从提出需求到网站制作报价,再到网页制作,每一步都是规范和专业的。

常见问题

提供什么是网站定制?你们的报价如何?等网站建设常见问题。

售后保障

网站制作不难,难的是一如既往的热情服务及技术支持。我们知道:做网站就是做服务,就是做售后。