このプロジェクトは、東京工業大学の「機会学習」の授業で課された最終レポートをコーディングしたものです。
課題内容は、mnist画像データセットのクラスタリングモデルを Pythonの機械学習ライブラリであるscikit-learnを使用してモデリングする、というものでした。
モデリングにあたり、標準化、正規化などの特徴量スケーリングを行いました。
モデルの選択にあたってはscikit-learn公式サイトのモデル選択チートシートを参考にしました。
また、ハイパーパラメータの調整やクロスバリデーションなども行い、より精度の高いモデルを目指しました。
説明可能AIへの理解を深めるため、決定技モデルの可視化も行いました。
プロジェクト作成にあたり、マークダウン形式で授業中に習った手法、コードをまとめました。
レポートは、ML_reportに全ての内容が含まれています。
授業で学んだ機械学習の手法、モデルをコードで実装するにはどうするかというのを、実際に手を動かしながら身につけるというのが目的でした。 また、実際に機械学習の研究や実務でも使われることの多い、sciit-learnのインターフェースに慣れることも目的の一つでした。
必要なライブラリをインストールし、ipynbを実行することでモデルの学習ができます。
- MacBook Pro (15-inch, 2018)
- macOS Big Sur Version 11.2.1
- python 3.9.1
- jupyter 4.7.1
- sciit-learn Version 0.24.0