データ分析手法 - 重回帰分析

重回帰分析

重回帰分析とは、教師あり学習の回帰分析の一つで複数の説明変数を用いて目的変数との関係を推定する手法です。結果に対して各説明変数がどの程度の影響を持つか知りたい時や、説明変数をもとに将来の結果を予測したい際に活用されています。

手法について

重回帰分析とは、説明変数と目的変数の因果関係を見ることで、結果を表す目的変数に対して要因を表す説明変数がどの程度影響しているかを明らかにする回帰分析の手法の一つであり、2つ以上の説明変数と目的変数の相関関係を数式化したものです。
目的変数と、目的変数に影響を与えそうな複数の説明変数を選択し、それぞれの回帰係数や定数を算出します。それらを回帰式に当てはめることで目的変数を算出することができます。説明変数の選択方法として、投入変数の中から予測値が最も高い説明変数の組み合わせを選択するステップワイズ法や、投入変数のすべてをモデルに投入する強制投入法などがあります。

手順・式

重回帰モデルの回帰式を適用することで、予測値を得ることができます。
予測値と回帰係数のデータの単位は統一する必要があります。

【回帰式】

※a :定数
 b1~bn :回帰係数
 x1~xn :説明変数の値

メリット・デメリット

【メリット】

①理解がしやすい
 それぞれの説明変数の影響力がわかりやすいです。

【デメリット】

①多重共線性の問題があると結果の解釈がしにくい
 説明変数間の相関関係が強い場合は多重共線性になりやすく、回帰係数の異常値や精度の低下につながります。

②説明変数は数値化する必要がある
 使用する説明変数の値は全て数値である必要があるため、文字型のデータは数値型にダミー変数で置き換える必要があります。

データ分析手法 ー 重回帰分析