回帰式の計算

2変数に密接な関係があるかどうか、相関関係が あるかどうかを調べましたが、今度は その2変数を式で対応づける作業を行います。 その対応関係を表す式である回帰式の 計算について学習します。 今回も「応用統計学a」で習ったArcMapは一切使わず、Excelだけで勉強していきます。 基礎から勉強しますので、「応用統計学a」を履修していなくても大丈夫です。

以下の実習では、 千葉県内の倒産件数と有効求人倍率のデータ のデータを使用していきますので、クリックして下さい。 データそのものは相関係数の時と同じです。

変数x, yのデータがn組あるとき、つまり

変数x, yのデータの組

のようなデータがあるとき、変数x, yの関係を

y=a+bxの1次式

のような1次式で表現することを考えます。 この場合、xを説明変数、yを 目的変数といいます。 (書籍によっては、xを独立変数、yを従属変数、またはxを説明変数、 yを被説明変数とするものもあります。)

この式のa,bはデータから 決定されます。つまり、実際の値であるyと1次式で表現されるa+bxとの間の差、 残差の2乗の和が最小となるa, bの組合せが 選択されます。

残差の2乗の和を求める式

途中の計算を省きますが、定数項a回帰係数bを求める式は以下のようになりま す。

定数項、回帰係数を求める式

また回帰式のあてはまりの良さを示す基準として、決定 係数と呼ばれる係数を利用する場合があります。 その決定係数R^2を求める式は以下のようになりま す。

決定係数を求める式


上記の式を利用しながら、

  1. 「倒産−求人」のワークシートを見ながら、 倒産件数、有効求人倍率のデータをExcel上で入力せよ。

  2. 「倒産−求人の計算(1)」のワークシートを見ながら、 倒産件数と有効求人倍率との相関係数、回帰係数、定数項、決定係数を決定せよ。 また散布図を作成し、回帰式、決定係数を表示させよ。

  3. 「倒産−求人の計算(2)」のワークシートでは、「倒産−求人の計算(1)」の ワークシート中、残差の大きいデータを2つ(平成4年、11年)削除した データ群に対する計算結果である。上記の場合と同様に、 倒産件数と有効求人倍率との相関係数、回帰係数、定数項、決定係数を決定せよ。 また散布図を作成し、回帰式、決定係数を表示させよ。

課題

  1. 「倒産−倒産金額」のワークシートに示されたデータに対する 下記の問いに答えよ。

    1. 「倒産−倒産金額」のワークシートに示されたデータに対し、 上記の「倒産−求人の計算(1)」のワークシートのように、 倒産件数と倒産金額との回帰式における定数項、回帰係数を決定せよ。

    2. 「倒産−倒産金額」のワークシートに示されたデータに対し、 Excelを利用して散布図を作成し、回帰式、決定係数を表示させよ。

  2. 下記の、東京駅からの直線距離と地価のデータ(注意:仮想的なデータ)に 関する下記の問いに答えよ。

    No. 地価(万円/m^2) 距[ (km)
    1 220000 39
    2 200000 42
    3 1320000 12
    4 580000 20
    5 2040000 5
    6 430000 25
    7 820000 22
    8 120000 50
    9 250000 47
    10 1480000 15
    1. 上記の距離を説明変数、地価を目的変数として、 上記の「倒産−求人の計算(1)」のワークシートのように、 Excelを利用して回帰係数、定数項、決定係数を決定せよ。

    2. 上記の距離を説明変数、地価を目的変数として、 Excelを利用して散布図を作成し、回帰式、決定係数を表示させよ。


[地理情報システム ArcMapの使い方] [地理情報システム論 ホームページへ]
須崎純一 京都大学大学 工学研究科都市環境工学専攻 環境情報学講座