選挙管理委員会のデジタル・トランスフォーメーション(DX)は難しいのか?(データアナリスト・渡邉秀成)

第49回衆議院選挙が終了しました。
選挙結果についての分析が選挙関係者等で行われています。

この選挙結果の分析に重要な役割を果たす情報の一つが、各選挙管理委員会が公表する投開票結果に関するデータです。

これら重要なデータですが都道府県選挙管理委員会ごとに独自の形式で公表されているため、選挙データの利活用という点から見ると改善点が多くあるような気がします。

総務省は行政機関が公開する統計データ作成の方法について公表しています。それが統計表における機械判読可能なデータ作成に関する表記方法案です*1。
*1 [https://www.soumu.go.jp/main_content/000723626.pdf](https://www.soumu.go.jp/main_content/000723626.pdf)

ここで公開されている基準を利用して、各都道府県選挙管理委員会が選挙結果を公開すると、行政担当者、国民もデータが利用しやすくなり、新たな産業の創出に役立つのではないでしょうか。

今回は47都道府県選挙管理委員会が公開する各種データがこの総務省基準にどの程度従っているのか?について
大きく3つだけ

1: Excel、CSV形式でデータを作成しているか?
2: セル結合を利用していないか?
3: スペースで体裁を整えていないか

について観察したいと思います。

総務省が公表している「統計表における機械判読可能なデータ 作成に関する表記方法案」の目次は下記のとおりです。

図1
*1 [https://www.soumu.go.jp/main_content/000723626.pdf](https://www.soumu.go.jp/main_content/000723626.pdf)

この目次を見ると一番最初に【チェック項目1-1 ファイル形式は Excel か CSV となっているか】とあります。
行政機関が公開する統計数値が入った資料でもPDFで公開されているものが非常に多いです。
PDF形式は紙にプリントアウトした状態と同じものが出力されるので便利です。その一方、ウェブ上に掲載されていると開くまでに時間がかかる、データを再利用しにくいといった不便な点があります。

その点を総務省は意識をしてこの項目を一番最初に持ってきたのではないかと自分は推測します。都道府県選挙管理委員会を見るとPDF形式での選挙結果公開をしているところが、まだまだ多い印象があります。

また、最高裁判所裁判所裁判官国民審査のデータがPDF形式で公開されている選挙管理委員会が多い傾向があります。選挙管理委員会によっては国民審査データが公開されていない、国民審査のデータは公開しているが、県全体数値のみが掲載されており、市区町村別データの掲載がないところもありました。

来年執行予定の参議院選挙では、47都道府県選挙管理委員会のすべてが選挙結果をPDF形式での公開からExcel、csv形式への公開へ変更できないものでしょうか。それだけでも随分とデータの利活用がしやすくなります。

次に見ていきたいのが【チェック項目1-4 セルの結合をしていないか】です。

選挙結果データでセル結合が使われていない都道府県選挙管理委員会を見つけることのほうが難しいくらいです。
そのくらいセル結合が利用されているので、データの利活用がしにくいのが実際です。

例えば、熊本県選挙管理委員会が公表する衆議院比例代表選挙 投票結果(国内+在外)*2を見てみましょう。
*2 [https://www.pref.kumamoto.jp/soshiki/147/115001.html](https://www.pref.kumamoto.jp/soshiki/147/115001.html)

図2

一見普通のエクセルシートによるデータで見栄えも良くなんの問題もないように見えます。

ただ、このシートの列部分に目を移すと列がAからBPまで非常に多くあることに気づきます。これは列の項目にある当日有権者数、性別等の各項目についてセル結合を利用して見栄えを良くしているためです。

このまま機械的にデータ処理をしようとすると、ひと手間、ふた手間がかかりますし、このエクセルシートでは投票率が高かった順に市町村を並び替えを行おうと思っても並び替えを行うことができません。見栄えは良いがデータの利活用はしにくい形式となります。

また、都道府県選挙管理委員会で良く利用されているセル結合では郡部をセル結合をしているものです。例えば、岩手県選挙感委員会が公開する衆議院選挙比例代表選挙の投票者数、投票率に関するデータです。

図3

こちらの表を見ると郡部に目を向けると、岩手郡、紫波郡等が縦にセル結合がなされています。
たしかに郡ごとに町村が並び見栄えが良いのですが、こちらの形式でも投票者数が多い順に並び替えを行おうとしても、このままではデータの並び替えを行うことができないことが多いです。

この郡部についても総務省が公表している「統計表における機械判読可能なデータ 作成に関する表記方法案」に基づき、データ形式が改善されないものでしょうか?

最後に見ていきたいのが【チェック項目1-5 スペースで体裁を整えていないか】です。

例えば神奈川県選挙管理委員会が公開する衆議院比例代表選出選挙 開票調*3です。
*3 [https://www.pref.kanagawa.jp/docs/em7/cnt/f5/p744566.html](https://www.pref.kanagawa.jp/docs/em7/cnt/f5/p744566.html)

図4 

この表の開票区名を見ると、県 計、指 定 市 計、横 浜 市 等 見栄えを良くするために、スペースを利用して区名の長さを調整していることがわかります。

このような自治体表記をすると検索するときに検索対象にならない場合や、他のデータとデータを紐付けしようとする際にミスが生じやすくなります。このようなことから半角、全角スペースを利用することを避ける方向に改善できないものでしょうか?

今回は選挙管理委員会が公開する選挙データに限定して改善点について見てきました。
総務省が中心となり自治体DX推進4の意義には「データの様式の統一化等を図りつつ、多様な主体によるデータの円滑な流通を促進すること」と記載されておりますので、都道府県選挙管理委員会で選挙の投開票結果データの統一が図られれば、担当する職員の業務負担も軽減され、データ利用者の利便性も向上しますので、ぜひ対応していただきたいと思います。
*4 [https://www.soumu.go.jp/denshijiti/index_00001.html](https://www.soumu.go.jp/denshijiti/index_00001.html)

今回は選挙管理委員会が公開するデータ形式について見てきました。 

© 選挙ドットコム株式会社