0%

西瓜书

0204 K折交叉验证

image-20240115195857331

0205 测试集分割留出法

image-20240115200322730

0206 验证集

image-20240115200552460

0207 均方误差

image-20240115200948281

0208错误率与精确度公式

image-20240115201639265

image-20240115201820121

0209查准率与查全率

image-20240115202522563

0210P-R反向关系原理

image-20240115204224315

image-20240115204442507

image-20240115205515474

0211 P-R反向关系图

image-20240115205723559

image-20240115205822764

image-20240115210156902

0212 P-R加权调和平均数

image-20240115210607952

0213 macro_microP-R

image-20240115211245502

image-20240115211401246

0214 使用P-R曲线比较不同模型

image-20240115211805687

0215 ROC曲线

image-20240115212739034

0216 排序损失rank-loss

image-20240120205407448

0217 AUC与rank-loss

image-20240120205845857

0403 熵的度量:一般分布

image-20240316115401863

image-20240316115626781

0404 信息的度量:信息增益

image-20240316120030435

0405 决策树ID3算法举例:好坏西瓜

image-20240316120857159

0406 好坏西瓜继续分叉

image-20240316121121335

0407 增益率简述

image-20240316121421026

0408 决策树CART基尼指数

image-20240316123131555

0409 基尼指数计算:第一次分叉

image-20240316123340068

0410 基尼指数计算:第二次分叉

image-20240316124037637

0411 基尼指数计算:第三次分叉与终止

image-20240316124324228

0412 CART算法回归树

image-20240318113957124

多个特征,第一步算法SSR最小值

防止过拟合:如设定小于20不再分割

0413 剪枝处理

在训练集上使用信息增益得到决策树:

image-20240318114909636

image-20240318115034225

0414 预剪枝一

预剪枝是一种贪心算法,能剪就剪

image-20240318115415202

0415 预剪枝二

image-20240318115627704

image-20240318115804138

最后这里,全部是坏瓜,所以也不再分

image-20240318115943306

经过预剪枝,得到的图是:

image-20240318120142603

0416 后剪枝

后剪枝是能不剪就不剪

image-20240318120723808

最终是:

image-20240318120842391

image-20240318120931067

补充:Prune Regression trees

0417 连续值C4.5二分法信息增益最大准则

image-20240318121551534

0418 决策树缺失值处理

image-20240318121853668

image-20240318122313628

image-20240318122500736

0701 贝叶斯分类器综述

0702 贝叶斯定理—一个应用

https://www.matongxue.com/madocs/279/

0703 贝叶斯定理

https://www.matongxue.com/madocs/279/

image-20240320103534165

0704 预热——一个半朴素贝叶斯的例子

image-20240320103738904

0705贝叶斯决策论

image-20240320105552909

image-20240320105728365

image-20240320105910528

image-20240320110043237

0706 最大似然估计

https://www.matongxue.com/madocs/447/

image-20240320111820618

0709 最大似然估计——公式与取对数

image-20240320112532737

image-20240320112722367

image-20240320112804276

image-20240320113055666

image-20240320113151728

image-20240320113406505

image-20240320113430304

image-20240320113519442

image-20240320113606279

0711 拉普拉斯修正

image-20240321111636788

image-20240321111730575

拉普拉斯修正避免了因为训练集不充分而导致的概率估计为0的情况

拉普拉斯修正实际上是假设了属性值与类别均匀分布,这是在朴素贝叶斯学习过程中额外引入的关于数据的先验

0712 EM算法

image-20240321112303279

image-20240321112439716

image-20240321112701578

image-20240321112826435

0802 集成学习的威力

image-20240321114406985

0803 AdaBoost原理看个例子包懂

image-20240321114637180

https://zhuanlan.zhihu.com/p/27126737

0804 AdaBoost算法实现

0807 Gradient Boosting简述

image-20240323114332358