25、马尔科夫模型:从PageRank到语音识别,背后是什么模型在支撑你好,我是黄申。 上一节,我们介绍了基于概率的语言模型。概率语言模型的研究对象其实是一个词的序列,以及这个词序列出现的概率有多大。那语言模型是不是也可以用于估算其他序列出现的概率呢?答案是肯定的。 通过上一节我们知道,语言模型中有个重点:马尔科夫假设...2026-03-02程序员的数学基础课
26、信息熵:如何通过几个问题,测出你对应的武侠人物你好,我是黄申。 之前和你聊了概率在朴素贝叶斯分类算法中的应用。其实,概率在很多像信息论这样的应用数学领域都有广泛的应用。信息论最初就是运用概率和统计的方法,来研究信息传递的。最近几十年,人们逐步开始使用信息论的概念和思想,来描述机器学习领域中的概率...2026-03-02程序员的数学基础课
27、决策树:信息增益、增益比率和基尼指数的运用你好,我是黄申。 上一节,我通过问卷调查的案例,给你解释了信息熵和信息增益的概念。被测者们每次回答一道问题,就会被细分到不同的集合,每个细分的集合纯净度就会提高,而熵就会下降。在测试结束的时候,如果所有被测者都被分配到了相应的武侠人物名下,那么每个人...2026-03-02程序员的数学基础课
28、熵、信息增益和卡方:如何寻找关键特征你好,我是黄申。今天我们来说说特征选择。 我们已经讨论过信息熵和信息增益在决策树算法中的重要作用。其实,它们还可以运用在机器学习的其他领域,比如特征选择。你可能对“特征选择”这个名词不太熟悉,没有关系,我先花点时间,给你介绍一下什么是特征选择,以及机...2026-03-02程序员的数学基础课
29、归一化和标准化:各种特征如何综合才是最合理的你好,我是黄申,今天我来说说特征值的变换。 上一节我讲了如何在众多的特征中,选取更有价值的特征,以提升模型的效率。特征选择是特征工程中的重要步骤,但不是全部。今天,我来说说特征工程中的另一块内容,数值变换。也就是说,我们可以使用统计中的数据分布,对连...2026-03-02程序员的数学基础课
30、统计意义(上):如何通过显著性检验,判断你的A、B测试结果是不是巧合你好,我是黄申,今天我们来聊聊统计意义和显著性检验。 之前我们已经讨论了几种不同的机器学习算法,包括朴素贝叶斯分类、概率语言模型、决策树等等。不同的方法和算法会产生不同的效果。在很多实际应用中,我们希望能够量化这种效果,并依据相关的数据进行决策。 为...2026-03-02程序员的数学基础课