HOME > U+(ユープラス) > 電子自治体の行政情報化ニュース > 自治体IT革命の今日、明日 第151回 番号法、その1 『中間サーバと文字コード』

U+(ユープラス)

U+のTOPへ

電子自治体の行政情報化ニュース

コラムニストの一覧に戻る

自治体IT革命の今日、明日
第151回 番号法、その1 『中間サーバと文字コード』

2013/05/27

 「番号法」が衆議院を通過、参議院へ回りました。5月23日に内閣委員会・総務委員会にて可決しました。24日の参議院本会議にて可決するのでしょう。
 今回は、情報提供ネットワークシステムを利用した情報連携時のかなめとなる「中間サーバ」の文字コードについてです。

◎19条7項、別表2の115事務の情報連携を支える中間サーバ

 番号法施行3年後には、民間利活用が視野に入っています。ネットワーク社会において「文字コード」の統一は大きな意味がありそうです。
 住基統一文字は行政の世界の文字コードです。21,170文字は一般国民及び民間企業では使われていない現状があります。

○日本国内における「行政における文字コード」について。
1.戸籍統一文字(2004年) ・・・ 法務省
 戸籍事務のシステム化に併せ、55,266漢字が制定される。
 以外の外字(?)がある場合は、“紙戸籍”にて別管理される。
2.住基ネット統一文字(2002年) ・・・ 総務省
 住基ネット開始に併せ、21,039文字(内、19,432漢字)が制定、その後入管漢字131漢字が追加され、21,170文字が統一文字となる。
 外字はイメージ処理。
3.文字情報基盤漢字(MJ漢字)(2011年) ・・・ 経産省(IPA)
 http://ossipedia.ipa.go.jp/ipamjfont/
 戸籍統一文字と住基統一文字を整理する。約6万字(内、58,712漢字)を制定する。

○「番号法」で考えられる文字コードに関わる課題
1.番号法19条7項では、115の事務が「情報提供ネットワークシステム」を介して情報連携を可能とする。市町村は、中間サーバに提供データを定期的に書き込み更新する必要がある。住民票データ・住民税データなどには、氏名や住所などが含まれる。市町村固有のユーザー外字(残存外字)をどう統一するか?は大きな課題として残る ・・・
 住基ネット統一文字ないしはipaMJ漢字で中間サーバに書き込み更新しても、他団体のユーザー外字は取り扱えない。
2.「マイポータル」の利用者は一般国民であり、デバイスはPCないしはスマホである。全てのデバイスに対応可能な文字コードに統一することが求められる。
3.住基ネットにおける“住民票の広域交付サービス”は、「紙の公文書」サービスであり、住基法の影響を受ける。住基ネット統一文字の意味がある。
 しかし、番号法における情報連携は、当該本人が確認できれば、関わる情報を正当なものとみなせる。氏名漢字の法的影響を受ける必要が無い。

○番号法で考えられる文字コード対策は
 1.行政間のユーザー外字、2.利用者である一般国民、3.当該本人確認などに対応することが必要である。

利用者利用不可能文字コード
情報提供ネットワークシステムを介した情報連携他団体他団体のユーザ外字
マイポータル一般国民行政統一文字

ー>  文字コード<注1>は、
 ・JISX 208がベスト
 ・JISX 213、またはUnicodeがベター
と思われる。

<注1>
○文字コード
(1)文字集合
1.ASCIIとJIS X 0201
・ASCII(アスキー)
・JIS X 0201
2.JIS X 0208、X 0212、X 0213
・JIS X 0208(1978年、以降1983年、1990年、1997年、2012年に改正)
 ・・・ JIS第1水準・第2水準
・JIS X 0212(補助漢字)(1990年)
・JIS X 0213(2000年、以降2004年、2012年に改正)
 ・・・ JIS第3水準・第4水準
3.マイクロソフト標準キャラクタセット
・X 0208 がベース
4.Unicode(1993年)
 Apple社、IBM社、Microsoft社など米国の情報関連企業が中心となって提唱し、1993年に国際標準化機構(ISO)でISO/IEC 10646の一部(UCS-2)として標準化された文字コード体系。
 すべての文字を16ビット(2バイト)で表現し、1つの文字コード体系で多国語処理を可能にしようとするもの。世界の主要な言語のほとんどの文字を収録している。
 2バイト表記では最大65536文字しか収録できないため、中国語・日本語・韓国語(CJK)で同じ意味や同じルーツの漢字はすべて同じ文字とみなし、同じコードを割り当てる統合作業が行われ、文化の違いを無視したものだとの反発を招いている。
 Unicodeは、最初の規格が策定された後にハングル文字の追加や異体字表現方式の策定が行われ、部分的に3バイト以上を使用する体系に変化している。
このため、現在はUnicode全体は4バイトで定義(UCS-4)されている。
 その後いくたの改正が行われる。
 2009年、Unicode 5.2.0 CJK統合漢字の拡張Cで漢字4149字を追加。他にヒエログリフや日本の地図記号の追加など。
 2010年、Unicode 6.0.0 日本の携帯電話で使用されている絵文字を追加。他にCJK統合漢字の拡張Dで漢字222字の追加など。

(2)エンコード
1.シフトJIS(主にパソコンで使われている。)
2.ISO-2022-JP(JIS)(インターネットで標準的に使われている。)
3.日本語EUC(UNIXマシンで一般的に使われている。)
4.Unicode
5.UTF-8、16、32(Unicode Transformation Format)

<以上>

平成25年05月23日

上記のコラム購読のご希望の方は、右記の登録ボタンよりお申込みください。

登録はこちらから