17、存储系统:从检索技术角度剖析LevelDB的架构设计思想你好,我是陈东。 LevelDB是由Google开源的存储系统的代表,在工业界中被广泛地使用。它的性能非常突出,官方公布的LevelDB的随机读性能可以达到6万条记录/秒。那这是怎么做到的呢?这就和LevelDB的具体设计和实现有关了。 L...2025-11-02检索技术核心20讲
18、搜索引擎:输入搜索词以后,搜索引擎是怎么工作的?你好,我是陈东。今天我来讲讲搜索引擎的核心架构。 搜索引擎你应该非常熟悉,它是我们学习和工作中非常重要的一个工具。它的特点是能在万亿级别的网页中,快速寻找出我们需要的信息。可以说,以搜索引擎为代表的检索技术,是所有基于文本和关键词的检索系统都可以学习...2025-11-02检索技术核心20讲
19、广告系统:广告引擎如何做到在0.1s内返回广告信息?你好,我是陈东。今天我们来讲广告系统。 说到广告系统,很多人可能没有那么熟悉。但是在互联网行业中,广告系统其实是非常重要,并且非常有代表性的一种系统。 一方面是因为,广告是许多互联网公司的重要营收来源。比如,我们熟悉的Google和Facebook,...2025-11-02检索技术核心20讲
20、推荐引擎:没有搜索词,“头条”怎么找到你感兴趣的文章?你好,我是陈东。今天我来和你讲讲推荐引擎。 我们每天都会接触推荐引擎,最常见的,就是当我们用手机浏览资讯类App的时候,经常会用到的“下拉刷新”功能。你会发现,每次刷新之后,这些App都能给你推荐你最关心的“头条信息”。 那这些资讯类的App,是怎么...2025-11-02检索技术核心20讲
21、倒排检索加速(一):工业界如何利用跳表、哈希表、位图进行加速?你好,我是陈东。欢迎来到检索专栏的第一次加餐时间。 很多同学在留言区提问,说基础篇讲了这么多检索的基础数据结构和算法,那它们在工业界的实际系统中是怎么应用的呢?真正的检索系统和算法又是什么样的呢? 为了帮助你把这些基础的知识,更好地和实际应用结合。我...2025-11-02检索技术核心20讲
22、倒排检索加速(二):如何对联合查询进行加速?你好,我是陈东。欢迎来到检索专栏的第二次加餐时间。 在上一篇加餐中,我们讲了工业界中,倒排索引是怎么利用基础的数据结构来加速“求交集”过程的。现在,相信你已经对跳表、哈希表和位图的实际使用,有了更深刻的理解和认识了。然而,在日常的检索中,我们往往会面...2025-11-02检索技术核心20讲