千葉県の統計データ(公示地価)の処理

緯度・経度データの処理済みデータの表示は こちら

ここでは、住所が記載されている統計データに対して、GIS上で空間上の位置も 明示させるための処理について説明しています。公示地価データを対象に していますが、住所を持つ他のデータについてもあてはまる処理です。

公示地価の属性テーブルの中に住所のフィールドがあり、各地点の住所データ があっても、そのままGIS上で表記するのは難しいのが現状です。 住所から緯度・経度のような空間データに変換する必要があります。 そのような変換のことを アドレスマッチング といいます。

上記のアドレスマッチングが実現して、例えば緯度・経度のデータを 属性テーブルに付与できれば、GIS上で公示地価の空間上の位置を明示させる ことができます。しかしながら、この状態では単に明示させるだけで、 GISが得意とする空間解析などができません。そのため、 フォーマットの変換という作業が必要になりま す。

前置きが長くなりましたが、ここでの作業の流れを下記に示します。

(1) 公示地価データ:kouji_2000.xls

まずは、演習で必要する統計データを用意します。本来はインターネット経由で ダウンロードしてきますが、時間短縮のため予め保存したファイルを使用するも のとします。 ちなみに、演習で使用するデータは 平成12年地価公示(千葉県分)という Webページからダウンロードしてきました。

(2) 公示地価データの作成:kouji_2000.csv

Excelファイルに対して、下記のような細かい処理を行った後に、 CSVという形式でファイルを保存します。

(3) 住所修正済み公示地価データの作成:kouji_2000_city.csv

これまでに保存したデータは、3列目の住所が例えば 「千葉市若葉区谷当町1200-2」ではなく「谷当町1200-2」 のようになっているので、1列目のデータ(この場合、「若葉」)を利用して、 正式な住所へ変更する必要があります。

Excel上での置換処理でも不可能ではありませんが、この場合約1500行もあるため、 perlのスクリプトで一括処理していきます。

(4) 緯度・経度データ付き公示地価データ:kouji_2000_admatch.csv

ここまでで準備が整いました。これからアドレスマッチングを行い、公示地価が 示されている各点に対して、緯度・経度のデータを取得してきます。

(5) 不要な行を削除した公示地価データ:kouji_2000_update.csv

上記のアドレスマッチングの結果、緯度・経度データが返されなかった点に対し ては、0が入っています。後の統計解析の際に不要となります。 手動でいちいち削除していくと大変ですので、 perlのスクリプトで、一括して削除するように処理していきます。

(6) 最終版公示地価データ:kouji_2000_final.csvの作成

ここでは、ArcMapでの処理を考えて、データの1行目に フィールドを追加していきます。

(7) 最終版公示地価データの作成:dbfファイル(kouji_2000_final.dbf)

最後に、dbfファイルに変換します。そのために、ArcCatalogを起動させます。

上記の作業の結果、dfbファイル「kouji_2000_final.dbf」が完成しているはず です。このファイルを用いて特定地点(例えば東京駅)からの距離を計算し、 他の解析(例えば相関分析)で使用するものとします。

緯度・経度データの処理済みデータの表示

上記の処理の結果、作成されたdbfファイルを表示させます。まずは、ArcMapを 起動させて、千葉県のデータの一つ「pm_aza.shp」と、先ほど作成した 「kouji_2000_final.dbf」を表示させます。ArcMapのメニューバーの

ファイル → データの追加

から両者を指定してください。

ですが、本来表示されるべき公示地価のポイントデータが表示されません。 それは、「kouji_2000_final.dbf」に座標系が指定されていないからです。 以下では、その指定方法を説明しています。

まずは、下記の図のように、「kouji_2000_final.dbf」の表示の上で右クリック します。そして「XYデータの表示」を指定しま す。

「XYデータの表示」の指定

現れたボックスの「編集」をクリックします。 ここで、「kouji_2000_final.dbf」に対して、「pm_aza.shp」と同じ座標系を 指定することになります。「選択」ボタンをク リックして、下記の座標系を指定してください。

座標系 → Geographic Coordinate Systems → North America → North America Datum 1927.prj

座標系を指定したところ

上記のボックスの「OK」ボタンをクリックして、下記のボックスのように Xフィールドに「経度」Yフィールドに「緯度」を指定します。

「XYデータの表示」の指定

この結果、下記の画像のように、公示地価のポイントデータが表示されます。 各ポイントデータに値が入っているかどうか、属性テーブルを開いたりして 確認してみましょう。

「XYデータの表示」の指定

以上で、緯度・経度データを持った統計データをArcMap上で表示させることがで きました。次に、このデータを使用して、東京駅や最寄り駅までの距離を計算 する手順をこのページで説明します。

課題:統計データの処理・表示

  1. テキストエディタで(何でもいい:例えば「秀丸」)で、下記のcsvファイルを 作成し、「tokyo_latlon.csv」というファイル名で保存せよ。
    地名,緯度,経度
    東京駅,35.67799,139.76898
  2. ArcCatalogを使用して、「tokyo_latlon.csv」をフォーマット変換して、 「tokyo_latlon.dbf」というファイル名で保存せよ。
  3. ArcMap上で、「pm_aza.shp」「kouji_2000_final.dbf」を開いた状態で(つまり、 上の画像のような状態で)、「tokyo_latlon.dbf」を追加せよ。さらに、座標系 を指定して、東京駅のポイントデータを表示させよ。
    (指定通り実行しても表示されない場合には、地球のマークの「全体表示」を クリックすると再描画されて正しく表示されるようになる)

[地理情報システム ArcMapの使い方] [地理情報システム論 ホームページへ]
須崎純一 京都大学大学 工学研究科都市環境工学専攻 環境情報学講座