1.1. 機械学習の種類#
機械学習は大きく教師あり学習(supervised learning)、教師なし学習(unsupervised learning)、強化学習(reinforcement learning)に分けられます。本節では、それぞれの特徴を簡単に紹介します。
1.1.1. 教師あり学習#
教師あり学習とは、ラベル(正解データ)が付いたデータを使って学習を行う手法です。たとえば、収量予測を考えると、栽培期間中の気温や肥料の量といったデータに加えて、実際に得られた収量の情報が必要になります。医療分野では、X 線画像診断を行うために、画像そのものだけでなく、その画像に悪性腫瘍が含まれているかどうかという情報も不可欠です。このように、教師あり学習では予測したい項目をあらかじめデータとして集める必要があります。予測対象となる項目をラベル(label)と呼び、目的変数(objective variable)または応答変数(response variable)、または「正解データ」と表現することもあります。これに対して、ラベルを予測するために利用するデータ、たとえば気温や X 線画像などは、特徴量(feature)または説明変数(explanatory variable)と呼ばれます。機械学習では、与えられた特徴量とラベルの対応関係をコンピューターが学習し、特徴量を入力するとラベルをできるだけ正確に予測できるようなモデルを構築していきます。
教師あり学習は、ラベルの種類によって回帰(regression)と分類(classification)に分けられます。回帰は、目的変数が連続値の場合を指します。次のような応用例が考えられます。
気温、降水量、日射量、施肥量などから収量を予測
患者の年齢、血圧、コレステロール値、喫煙状況から心血管疾患の発症リスクを予測
腫瘍の大きさや治療法から治療後の生存期間を予測
移植手術後の拒絶反応のリスクを予測
分類は、目的変数がカテゴリ値(例えば「ある・なし」「良性・悪性」など)の場合を指します。例えば、次のような応用例が考えられます。
圃場のドローン画像からウィルス病害に感染した個体を検出
X 線画像から特定の疾患の有無を予測
血液検査結果から疾患の有無を診断
代表的なアルゴリズムには、ニューラルネットワーク、ロジスティック回帰、サポートベクトルマシン、決定木、ランダムフォレスト、線形回帰、スパース回帰などがあります。線形回帰やスパース回帰は連続値を扱うため回帰問題でよく使われます。一方、それ以外のアルゴリズムは回帰・分類の両方に応用可能です。たとえば、ニューラルネットワークは主に分類問題で用いられますが、回帰問題にも応用できます。
1.1.2. 教師なし学習#
教師なし学習(unsupervised learning)は、ラベルがないデータを使って学習する手法です。ラベルがなくても、データ内のパターンや構造を見つけることが目的です。一般的な方法は、データをいくつかのグループ(クラスタ)に分けるクラスタリング(clustering)です。例えば次のような応用例が考えられます。
疾病データベースや電子カルテの記録から、症例の共通点を洗い出し、治療計画や治療法を改善に役立てる。
遺伝子発現データをクラスタリングして、似たような発現パターンを持つ遺伝子をグループ化し、バイオマーカーを見つける。
また、教師なし学習は次元削減(dimensionality reduction)あるいは特徴抽出(feature extraction)にも用いられます。高次元データを低次元に圧縮することで、計算効率を上げたり、データの可視化を容易にしたりできます。代表的な手法には、階層型クラスタリング、k-means、トピックモデル、主成分分析(PCA)、t-SNE、UMAP などがあります。
1.1.3. 強化学習#
強化学習(reinforcement learning)、コンピューターやロボットが、試行錯誤を通じて最適な行動を学ぶ手法です。環境に対して行動を選択し、その結果として得られる報酬を基に学習を進めます。報酬は行動の良し悪しを評価する指標で、正の報酬は「成功」、負の報酬は「失敗」に相当します。コンピューターはこれらの情報を使って、どの行動が最も利益(報酬)をもたらすかを徐々に学習していきます。イメージしやすい例としては、自転車の練習があります。最初は転んでばかりですが、試行錯誤を重ねるうちにバランスを取り、スムーズに乗れるようになります。この過程では、行動→結果→報酬の繰り返しが、学習の中心になります。