53、机器学习排序算法经典模型:GBDT

这周我们讨论机器学习排序算法中几个经典的模型,周一分享了配对法排序中的一个经典算法,即排序支持向量机(RankSVM),这个算法的核心思想是把支持向量机应用到有序数据中,试图对数据间的顺序进行直接建模。 今天,我们来聊一聊利用机器学习进行排序的一个重...

AI技术内参

52、机器学习排序算法经典模型:RankSVM

到目前为止,我们在专栏里已经讨论了关于搜索引擎方方面面的很多话题,包括经典的信息检索技术、查询关键字理解、文档理解以及现代搜索引擎的架构等等 。同时,我们也从机器学习角度出发对搜索引擎的最核心部分,也就是排序算法进行了最基本的分享,囊括了单点法排序学...

AI技术内参

51、社区检测算法之“模块最大化 ”

一起来回顾下本周的内容。周一我们介绍了用图(Graph)来表达网页与网页之间的关系并计算网页的重要性,就是经典的PageRank算法。周三我们介绍了PageRank的一个姊妹算法,HITS算法,并且分析了这两种算法的内在联系,这两类算法都希望给网页赋...

AI技术内参

50、经典图算法之HITS

这周我们分享的内容是如何理解网页和网页之间的关系。周一我们介绍了用图(Graph)来表达网页与网页之间的关系并计算网页的重要性,就是经典算法PageRank。今天我来介绍一下PageRank的姊妹算法:HITS算法。 HITS的简要历史HITS是Hy...

AI技术内参

49、PageRank算法的核心思想是什么

上周我们介绍了信息搜索系统的历史进程,剖析了搜索系统的多轮打分系统,还深入探讨了倒排索引,聊了聊它的核心技术。 这周我要和你分享的是在互联网搜索引擎兴起之后的一个研发需要,那就是如何理解网页和网页之间的关系,特别是怎么从这些关系中提取网页中除文字以外...

AI技术内参

48、搜索索引及其相关技术概述

本周我们分享的主题是从宏观上来剖析现代搜索架构。周一我介绍了搜索系统的一个大的分类,一类是从20世纪50年代开始研发并使用的传统文本匹配信息检索系统,一类是从2000年开始发展并逐渐成熟的机器学习信息检索系统。周三我们剖析了搜索系统的另一个框架体系,...

AI技术内参

47、多轮打分系统概述

周一我为你介绍了搜索系统的一个宏观分类,包括传统的文本匹配信息检索系统和机器学习信息检索系统。这个分类可以让你非常清晰地了解信息搜索系统的历史进程,并对这两种搜索系统的特点有所了解。 今天我们就来剖析搜索系统的另一个框架体系:多轮打分(Scoring...

AI技术内参

46、大型搜索框架宏观视角:发展、特点及趋势

我们在前几周的专栏里讲解了一系列最经典的信息检索(Information Retrieval)技术以及基于机器学习的排序学习算法(Learning to Rank)。然后我们花了一定的时间讨论了两个关键搜索组件的核心技术要点,包括查询关键字理解(Qu...

AI技术内参

45、文档理解的重要特例:多模文档建模

本周我们重点分享搜索系统中的一个重要部件,那就是文档理解。周一我们首先分享了文档理解最基本的一个步骤,那就是给文档分类,主要是看不同文档表达什么类别的信息。然后,周三我们聊了聊另外一个重要的文档理解组件,也就是文档聚类的一些基本的概念和技术。今天我就...

AI技术内参

44、文档理解的关键步骤:文档聚类

周一我们分享了文档理解最基本的一个步骤,那就是给文档分类(Classification),主要是看不同文档表达什么类别的信息。今天我就来聊一聊文档理解的另外一个重要组件:文档聚类(Document Clustering)。 文档聚类的类型和了解文档分...

AI技术内参
14849505152268