familyld/Machine_Learning: 周志华《机器学习》阅读笔记

原作者: [db:作者] 来自: 网络收藏邀请

开源软件名称（OpenSource Name）：

familyld/Machine_Learning

开源软件地址(OpenSource Url)：

https://github.com/familyld/Machine_Learning

开源编程语言(OpenSource Language)：

Jupyter Notebook 99.5%

开源软件介绍(OpenSource Introduction)：

Machine_Learning

注：Github的Markdown渲染器不支持渲染latex公式，Chrome浏览器用户请安装GitHub with MathJax插件，谢谢你的关注。无法科学上网的同学可以找到resource文件夹中的 GitHub with MathJax 0.2.3.crx 文件，下载后拖入到Chrome浏览器插件页安装即可。有部分公式过于复杂，该浏览器插件也无法覆盖，所以推荐还是下载到本地查看，之后会有渲染为 pdf 的打算。使用Sublime Text的朋友可以用 OmniMarkupPreviewer 插件来浏览，所有公式经过检查都是显示正常的~

本项目主体是对周志华教授的《机器学习》一书所做的笔记，以及书中习题的试答（周教授未提供习题的标准答案，笔者仅作试答，如有谬误，欢迎指出。习题中带*星号的题目难度较大。）。除此之外，本项目还会逐渐引入一些对其他精彩的机器学习相关文章的摘录与点评。想了解《机器学习》一书不妨查看周教授的主页，上面除了简介之外也包含了该书各印刷版的勘误情况。

全书共16章，因此，我的笔记也分为相应的16个章节，可以从以下目录进行快速访问：

这16个章节可以大致分为3个部分：第1部分包括第1~~3章，是本书的引入部分，介绍了机器学习的一些基础知识；第2部分包括第4~~10章，介绍一些经典而且常用的机器学习方法；第3部分包括第11~16章，介绍了一些进阶知识。除前3章以外，各章内容相对独立，可以根据兴趣和时间选择学习。

内容简介

绪论

本章首先讲述了什么是机器学习以及机器是如何学习的，然后引入了一些机器学习的基本概念。接下来从假设空间和归纳偏好两个方面来讲述模型的产生。最后介绍了机器学习的发展历程以及应用现状。

模型评估与选择

本章首先引入了经验误差和泛化误差的概念，从而很自然地引伸出了机器学习中模型选择的问题。然后通过评估方法、性能度量、比较检验三个章节来讲述模型选择的整个流程。最后还介绍了偏差-方差分解，这可以帮助我们更好地解释模型的泛化性能。

线性模型

本章首先通过最简单的线性回归讲述如何利用线性模型进行预测，并且使用最小二乘法来进行参数估计。接下来从单属性扩展到多属性的情形，也即多元线性回归，并进一步推广到可以求取输入空间到输出空间的非线性函数映射的广义线性模型。然后针对分类任务，介绍了两种线性分类方法——对数几率回归（逻辑回归）和线性判别分析（LDA）。接下来讨论了使用二分类模型解决多分类问题时的三种拆分策略。最后还介绍了解决类别不平衡问题的几种思路。

决策树

本章首先介绍了决策树模型的结构以及决策树学习的目标，然后自然地引入了在建立树结构时如何选择最优划分属性的问题，并介绍了三种最为常用的指标（信息增益、信息增益率和基尼指数）。针对过拟合问题，作者讲解了预剪枝和后剪枝这两种解决方案以及它们各自的优缺点。接下来还给出了数据集的连续值离散化以及缺失值处理的一些思路。最后简单地介绍了结合线性模型从而实现减少预测时间开销这一目的的多变量决策树模型。

神经网络

本章首先介绍了神经网络最基本的组成单位——神经元。然后引入了最简单的只有两层神经元的感知机，并在此基础上又引入了多层网络和多层前馈神经网络的概念。接下来介绍了神经网络的典型学习方法——BP算法，分为标准BP算法和累积BP算法两种。针对过拟合问题和陷入局部最小问题，作者给出了一些比较常见的思路。接下来作者还简单地介绍了一些其他的神经网络模型。在本章的最后，作者简要概述了今年最火的深度学习的思想，以及如何节省训练时间开销。

支持向量机

本章首先引入了支持向量机中最基础的两个概念——间隔和支持向量。然后介绍了如何把获取最大间隔超平面转换为对偶问题并使用SMO算法求解。接下来介绍了如何使用核函数来解决线性不可分问题以及有哪些常用的核函数。针对过拟合问题，作者介绍了软间隔这个概念以及软间隔支持向量机的求解方式，并讨论了常用的替代损失函数。接下来，作者介绍了支持向量回归以及对应的求解方法。在本章的最后，作者还介绍了核方法，也即通过引入核函数将线性学习器转换为非线性学习器的方法。

贝叶斯分类器

本章首先介绍了贝叶斯决策论的基础，贝叶斯分类器的目标是什么。然后介绍了如何用极大似然估计来估计概率模型的参数。接下来介绍了基于属性条件独立性假设的朴素贝叶斯分类器，以及基于独依赖估计的半朴素贝叶斯分类器。然后又介绍了更为强大的贝叶斯网络，从结构、学习、推断三个方面详细地进行了讲述。最后，针对缺失值问题，作者简要地介绍了EM算法。

集成学习

本章首先介绍了集成学习中一些最基本的概念和假设，以及集成学习的两个大类。接下来，作者介绍了几个常用的集成学习算法，包括Boosting算法族的AdaBoost算法，还有并行式集成算法的代表——Bagging算法和随机森林算法。除了这些常用算法之外，从多个基学习器结合的角度出发，作者介绍了一些常用的结合策略。在最后一个小节中，作者从误差-分歧分解的角度解释了为什么基学习器的多样性越大越好，并且介绍了一些多样性的度量指标，最后给出了一些增强多样性的方法。

聚类

本章首先介绍了聚类任务的目标和应用方式，然后首先讲述了聚类任务中的两大基本问题——性能度量和距离计算。接下来，作者介绍了三种不同的聚类思想，包括原型聚类、密度聚类和层次聚类，每一种聚类思想都有很多衍生的聚类算法。

降维与度量学习

特征选择与稀疏学习

计算学习理论

半监督学习

概率图模型

规则学习

强化学习

鲜花

握手

雷人

路过

鸡蛋

该文章已有0人参与评论

请发表评论

全部评论

专题导读

More+

10-27 六六分期app的软件客服如何联系？(六六分期

11-06 可心卡盟:win10系统火狐flash插件崩溃怎么

11-06 亲亲特价:怎么删除回收站图标

11-06 济南大学虚拟社区:鲁大师节能降温的具体办

11-06 xlueops.exe:无线网络安装向导

11-06 女斗合众国:win7系统cf与主机连接不稳定怎

11-06 0xc000022-[cf烟雾头]cf怎么调烟雾头

11-06 qizideyouhuo:应用程序无法正常启动0xc0000

11-06 ipz-185:win7系统vcf文件怎么打开

11-06 傻哥蹦迪:win10系统s4怎么打开usb调试

11-06 八神浩树gtaste:回收站清空了怎么恢复

11-06 妖尾之黑色守护:win10系统电脑没有1440x900

11-06 校园至尊魔王小说:win7系统浏览网页时字体

11-06 女斗合众国:win10系统访问共享文件夹提示请

11-06 tokyo hot n0654:恢复win7系统默认字体一招

11-06 雨酷仙境:设置win7系统转移临时文件夹腾出

11-06 阿穆纳伊之杖:win7系统开始菜单在右边还原

11-06 tunespotting:win10系统火狐flash插件总是

11-06 甘尔葛分析师：计谋网站seo关键词暴涨有什

11-06 蔡贵霖: 计谋网站seo关键词暴涨有什么秘密

11-06 博益网首页:ao3网页版进入不了解决方法

11-06 漏斗子专栏: 网站数据分析小白易懂精华篇

11-06 见证双虹怎么做:win7系统开启telnet命令的

11-06 颾狐蝶蜋:系统资源不足无法完成请求的服务

11-06 国光中学校歌:提交网站到alexa查询详细步骤

11-06 西安有情天:静态网页和动态网页的区别

11-06 红木雅尚斋:外部链接构造对网站的好处

11-06 前官礼遇：防止域名劫持–增强域安全性的10

11-06 密传二转答案: 中文分词算法有哪些

11-06 金泉家园邮编:百度快照劫持的表现及应对方

MicrosoftLearning/Principles-of-Machine-Learning-Python: Principles of Machine L ...发布时间：2022-08-18

rapidsai/cuml: cuML - RAPIDS Machine Learning Library发布时间：2022-08-18

剪的笔顺,诠释剪的笔画,认识剪的部首

1 六六分期app的软件客服如何联系？(六六分期

六六分期app的软件客服如何联系？不知道吗？加qq群【895510560】即可！标题：六六分期

阅读：19645|2023-10-27

2 可心卡盟:win10系统火狐flash插件崩溃怎么

今天小编告诉大家如何处理win10系统火狐flash插件总是崩溃的问题，可能很多用户都不知

阅读：10109|2022-11-06

3 亲亲特价:怎么删除回收站图标

今天小编告诉大家如何对win10系统删除桌面回收站图标进行设置，可能很多用户都不知道

阅读：8404|2022-11-06

4 济南大学虚拟社区:鲁大师节能降温的具体办

今天小编告诉大家如何对win10系统电脑设置节能降温的设置方法，想必大家都遇到过需要

阅读：8762|2022-11-06

5 xlueops.exe:无线网络安装向导

我们在使用xp系统的过程中,经常需要对xp系统无线网络安装向导设置进行设置，可能很多

阅读：8715|2022-11-06

6 女斗合众国:win7系统cf与主机连接不稳定怎

今天小编告诉大家如何处理win7系统玩cf老是与主机连接不稳定的问题，可能很多用户都不

阅读：9767|2022-11-06

7 0xc000022-[cf烟雾头]cf怎么调烟雾头

电脑对日常生活的重要性小编就不多说了，可是一旦碰到win7系统设置cf烟雾头的问题，很

阅读：8703|2022-11-06

8 qizideyouhuo:应用程序无法正常启动0xc0000

我们在日常使用电脑的时候，有的小伙伴们可能在打开应用的时候会遇见提示应用程序无法

阅读：8069|2022-11-06

9 ipz-185:win7系统vcf文件怎么打开

今天小编告诉大家如何对win7系统打开vcf文件进行设置，可能很多用户都不知道怎么对win

阅读：8750|2022-11-06

10 傻哥蹦迪:win10系统s4怎么打开usb调试

今天小编告诉大家如何对win10系统s4开启USB调试模式进行设置，可能很多用户都不知道怎

阅读：7597|2022-11-06

客服电话

电子邮件

familyld/Machine_Learning: 周志华《机器学习》阅读笔记

开源软件名称（OpenSource Name）：

开源软件地址(OpenSource Url)：

开源编程语言(OpenSource Language)：

开源软件介绍(OpenSource Introduction)：

Machine_Learning

内容简介

绪论

模型评估与选择

线性模型

决策树

神经网络

支持向量机

贝叶斯分类器

集成学习

聚类

降维与度量学习

特征选择与稀疏学习

计算学习理论

半监督学习

概率图模型

规则学习

强化学习

请发表评论

全部评论

上一篇：

下一篇：

投资者说20130606:win7系统启用Administrat

TerrorBite/MinecraftBot: Bukkit plugin t

DELPHI操作EXCEL

googlearchive/paper-toggle-button: A tog

CVE-2022-34221

剪的笔顺,诠释剪的笔画,认识剪的部首

六六分期app的软件客服如何联系？(六六分期

florent37/ViewAnimator: A fluent Android

florent37/Shrine-MaterialDesign2: implem

CVE-2020-36276

SimpleSoftwareIO/simple-sms: Send and re

关于我们

产品与服务

解决方案

139-2527-9053