程序员行莫

线性回归详解

线性回归详解 引言 想象一下,你要预测一个学生的成绩: 方法1:只看学习时间,时间越长成绩越好(简单方法) 方法2:看学习时间、复习次数、作业完成度等多个因素(复杂方法) 线性回归就像这两种方法——通过找到输入和输出之间的线性关系,来预测未知的结果。 本文将用生动的类比、详细的数学原理和丰富的可视化

行莫 发布于 2025-11-24

机器学习算法常见距离计算

机器学习算法常见距离计算 引言 想象一下,你要判断一个新来的同学和谁最相似: 方法1:看直线距离有多远(欧式距离) 方法2:看需要走多少条街才能到达(曼哈顿距离) 方法3:看最远的那一维差距有多大(切比雪夫距离) 方法4:根据情况灵活选择距离计算方式(闵可夫斯基距离) 在 KNN(K-Nearest

行莫 发布于 2025-11-24

交叉验证与网格搜索详解

交叉验证与网格搜索详解 引言 想象一下两种不同的考试方式: 传统方式:只用一套题训练,用同一套题测试,容易"死记硬背" 交叉验证:用多套题训练和测试,轮流使用,更真实地评估能力 想象一下两种不同的调参方式: 手动调参:一个一个试,费时费力,容易遗漏最优解 网格搜索:系统性地尝试所有组合,自动找到最优

行莫 发布于 2025-11-24

手写数字识别数据集

手写数字识别数据集 MNIST数据集(Mixed National Institute of Standards and Technology database)是一个用来训练各种图像处理系统的二进制图像数据集,广泛应用于机器学习中的训练和测试。 作为一个入门级的计算机视觉数据集,发布20多年来,它

行莫 发布于 2025-11-23

鸢尾花数据集

鸢尾花数据集 Iris 鸢尾花数据集内包含 3 种类别,分别为山鸢尾(Iris-setosa)、变色鸢尾(Iris-versicolor)和维吉尼亚鸢尾(Iris-virginica)。 数据集共 150 条记录,每类各 50 个数据,每条记录有花萼长度、花萼宽度、花瓣长度、花瓣宽度4项特征,通过这

行莫 发布于 2025-11-23

机器学习:KNN 算法详解

机器学习:KNN 算法详解 引言 想象一下,你要判断一个新来的同学是什么性格: 方法1:观察他的所有特征,分析他的行为模式(复杂方法) 方法2:看看他身边最亲近的几个朋友是什么性格,他很可能也是类似的性格(简单方法) KNN(K-Nearest Neighbors,K近邻)算法就像第二种方法——通过

行莫 发布于 2025-11-22

Scikit-learn 详解:机器学习领域的瑞士军刀

Scikit-learn 详解:机器学习领域的瑞士军刀 引言 想象一下,你要做一道菜: 没有工具:需要自己磨刀、生火、准备所有工具,费时费力 有专业工具:有现成的菜刀、炉子、调料,轻松高效 Scikit-learn 就像机器学习的"专业工具包",提供了现成的算法、工具和接口,让你能够快速、高效地进行

行莫 发布于 2025-11-22

机器学习拟合概念详解:从欠拟合到过拟合

机器学习拟合概念详解:从欠拟合到过拟合 引言 想象一下三种不同的学习方式: 欠拟合:就像学生没学会,练习题都做不对 正常拟合:就像学生学会了方法,练习题和新题都能做 过拟合:就像学生只记住了练习题,新题不会做 理解拟合概念,就像理解学习的三种状态。本文将用生动的类比、数学表示和实际代码,帮你深入理解

行莫 发布于 2025-11-22

机器学习算法分类:从有监督到强化学习

机器学习算法分类:从有监督到强化学习 引言 想象一下四种不同的学习方式: 有监督学习:就像有老师教,给你题目和答案,让你学会解题 无监督学习:就像自学,没有答案,自己发现规律 半监督学习:就像老师只教一部分,剩下的自己学 强化学习:就像通过试错学习,做对了给奖励,做错了不给奖励 理解这四种学习方式,

行莫 发布于 2025-11-22

机器学习建模步骤

机器学习建模步骤 引言 想象一下,你要建一座房子: 明确需求:确定要建什么样的房子(问题定义) 准备材料:收集砖块、水泥、钢筋等(获取数据) 处理材料:清理、分类、检查质量(数据基本处理) 设计图纸:规划房子的结构(特征工程) 开始建造:按照图纸施工(模型训练) 检查质量:验收房子是否符合要求(模型

行莫 发布于 2025-11-22