我个人的机器学习(Machine Learning)学习笔记与示例代码仓库。附带图示与实践脚本,便于系统化自学与复盘。
- 系统化笔记:从概念到算法到建模流程,结构清晰
- 可运行示例:配套 Python 脚本,直接上手训练与评估
- 图文结合:Markdown + 图片资源,帮助理解关键概念
notes/章节笔记(Markdown)ipynb/章节笔记(Jupyter Notebook),内容与notes/相同assets/每章配图与示例资源LICENSE项目许可证(GPL-3.0)
- Python 3.8+(推荐使用 Anaconda 管理环境)
- 主要依赖:
- scikit-learn
- numpy
- pandas
- matplotlib
安装示例:
pip install scikit-learn numpy pandas matplotlib-
阅读笔记
- 在
notes/目录中按序浏览,例如:01_机器学习概述.md、02_KNN算法(K-近邻算法).md
- 在
-
运行示例代码(以鸢尾花 KNN 分类为例)
- 脚本位置:
assets/02_KNN算法(K-近邻算法)_assets/利用KNN算法对鸢尾花分类/03_KNN算法_鸢尾花案例.py
- 脚本位置:
python assets/02_KNN算法(K-近邻算法)_assets/利用KNN算法对鸢尾花分类/03_KNN算法_鸢尾花案例.py该脚本演示:
- 加载数据集(Iris)
- 标准化特征(StandardScaler)
- 训练 KNN 模型并评估准确率(score/accuracy)
- 对自定义数据进行分类与概率输出(predict/predict_proba)
- 探索更多脚本
- 特征预处理:
01_特征预处理_归一化操作.py、02_特征预处理_标准化操作.py - 调参与验证:
04_网格搜索和交叉验证.py(GridSearchCV + 交叉验证)
- 特征预处理:
- Markdown 阅读:Obsidian、Typora 等工具均可良好展示图片与链接
- 代码运行:建议创建独立虚拟环境,按需安装依赖,逐个脚本实践
- 图片引用:本仓库使用相对路径,确保在仓库根目录打开与预览
- 图片不显示:请确保以仓库根目录为工作路径,或使用支持相对路径的编辑器
- 依赖缺失:按上文安装依赖;若使用 Anaconda,请在对应环境下执行安装命令
- 中文路径:部分系统/终端对中文路径支持不一致,建议在支持 UTF-8 的终端运行
- 章节文件名:
NN_主题.md(例如:01_机器学习概述.md) - 资源目录名:
NN_主题_assets - 图片与资源放置在对应章节的
assets/子目录中,并用相对路径引用(例如:../assets/01_机器学习概述_assets/image.png)
- 欢迎提出 Issue 或提交 PR(修正错别字、补充示例、完善说明等)
- 建议遵循清晰的提交信息与简洁的修改范围,便于审阅与合并
本项目使用 GPL-3.0 许可证,详情见 LICENSE。
- 感谢 黑马程序员 提供的机器学习课程,提供了宝贵的学习资源
- 感谢 scikit-learn 官方文档 提供的详细说明与示例代码