【機械学習】「仕事ではじめる機械学習」を読んでのメモ - 旅行好きなソフトエンジニアの備忘録

１章　機械学習プロジェクトのはじめ方

1.2　機械学習プロジェクトの流れ

1. 問題を定式化する
* ○○のために××が必要。そのために機械学習を利用する。機械学習が○○に貢献しているかどうかの判断として、□□をKPIとする

2. 機械学習をしなくて良い方法を考える
* ルールベースで期待する精度が出るのに機械学習を適用しようとしていないか
* 100%の精度が得られるといった実現不可能な期待はないか
*（画像処理で十分なのにCNNを適用しようとしていないか）

3. システム設計を考える
* 予測結果はどういう形で利用するのか
* 予測誤りをどこでどうやって吸収するのか

4. アルゴリズムの選定
* 過去に類似の問題がどのように解かれているか（Kaggle等を調べる？）
* PCAやt-SNEでデータの特性を可視化してあたりをつけられないか
* （問題設定が複数考えられる場合は顧客に前もって確認しておく。例えば顧客はクラス分類問題を求めているようで、実は対象の大きさも知りたいと思っており、セグメンテーション問題として扱わなければならないかもしれない。逆に顧客はセグメンテーション問題を求めているようで、実は対象の大きさは必須ではなく、ラベリング負荷が減るのであればクラス分類問題として扱っても良いかもしれない）

5. 特徴量、教師データとログの設計をする
* ビジネスドメインに詳しい人に予測に必要な情報を確認する

6. 前処理をする

7. 学習・パラメータチューニング
* ロジスティック回帰等シンプルなアルゴリズムをまず適用する
* （学習データで精度が出ない？　⇒　モデルを大きくする、学習期間を長くする、別のモデルを試す）
* （バリデーションデータで精度が出ない？　⇒　データを増やす、正則化を適用する、別のモデルを試す）

8. システムに組み込む
* 予測性能とKPIをモニタリングし、継続してビジネスに貢献しているのか確認／改善を続ける
* 改善を続けることが出来る組織づくりもしておく