交差検証による学习と评価

n-ozawan

2025.06.20

AI 骋検定対策机械学习

皆さん、こんにちは。尝笔开発グループの苍-辞锄补飞补苍です。
暑いですね。梅雨はどこに行ったのでしょうか。建物の中にいても热中症になることがありますので、细目に水分补给をしましょう。

本题です。
机械学习の目的は、手元にあるデータを学習することにより、未知のデータに対して予測することです。この未知のデータに対して正しく予測できているのかを評価する手法として交差検証があります。今回は交差検証についてのお話です。

交差検証

概要

机械学习を行った後には、そのモデルの汎化性能（未知のデータに対してどれぐらい高い予測性能を出せるのか）を評価する必要があります。そのため、机械学习用に収集したデータのすべてを訓練データとして机械学习させてしまうと、そのモデルの評価が正しくできません。よって、机械学习用に収集したデータから、訓練用のデータと検証用のデータに分割して机械学习を行います。これを交差検証と言います。

交差検証は言い换えれば、そのモデルが过学习していないかを评価するための手法です。过学习はモデルの汎化性能を低下させます。交差検証を行うことで过学习の兆候を検出し、ハイパーパラメータやモデル构造を调整することにより过学习を抑えることができます。

交差検証にはいくつかの方法があります。本日はホールドアウト検証、办-分割交差検証、リーブワンアウト交差検証の3つを取り上げます。

ホールドアウト検証

ホールドアウト検証は、データセットを训练用データと検証用データの2つに分割し、训练用データでモデルを学习させ、検証用データでその性能を评価する方法です。一般的には、データの7～8割を训练用、残りを検証用に使います。

分割は无作為に行われるため、その分割内容によってはデータの偏りが発生し、评価结果が不安定になりやすいデメリットがあります。一方で学习?评価の回数が1回で済むため计算コストが低くなります。

办-分割交差検証

办-分割交差検証は、データセットをk個のほぼ等しいサイズのフォールド（分割）に分けて評価する方法です。各フォールドを1回ずつ検証用データとし、残りのk-1個を訓練用データとしてモデルを学習?評価します。これをk回繰り返し、すべてのフォールドで得られた評価結果の平均を最終的なモデル性能とします。

ホールドアウト検証と比べて、全てのデータを効率的に学习?评価することができるため、评価结果が安定しやすくなります。一方で办回分の学习?评価が必要なため、计算コストが高くなります。

リーブワンアウト交差検証

リーブワンアウト交差検証は、データセット内の各データを1つずつ検証用データとし、残りすべてを训练用データとしてモデルを学习?评価する方法です。これをデータの数だけ繰り返し、すべての评価结果の平均を最终的なモデル性能とします。

この方法は、データを最大限に活用でき、评価のバラツキが少ないという利点がありますが、データ数が多い场合は学习?评価の回数が増えるため、计算コストが非常に高くなります。特に小规模なデータセットで、より厳密な评価を行いたい场合に利用されます。

おわりに

データセットの数が十分に多い場合は、ホールドアウト検証が有効となります。一方で、データセットの数が少ない場合はリーブワンアウト交差検証により効率的に学習する方が良いでしょう。办-分割交差検証はそのどちらでも有効で、計算コストとのバランスを考慮して、目的に応じて適切なkを选択します。データ量や计算资源、评価の目的に応じて、适切な手法を选択することが重要です。

ではまた。