ついにコンピュータで日本語の漢字すべてを使用可能に　１５年かけてコード化、国際規格に登録

**名無しさん＠涙目です。**(宮城県) **[US]** · NG

コンピューターで全漢字使用可に６万字コード化

日本語の漢字は、戸籍などに使われているものも含めると６万字あるのに対し、コンピューターは、実は１万字しか
扱うことができません。これに対し、このほど１５年越しの作業の末、６万字すべてが統一の規格にまとめられて、
コンピューターがすべての漢字を扱えるようになり、ビッグデータの活用をはじめさまざまな効果が期待されています。

コンピューターで文字を扱うには、１つ１つの文字に、「コード」と呼ばれる世界共通の番号を割りふる必要がありますが、
日本語の漢字で、コードが割りふられているのは１万字だけで、コードが無く、コンピューターが扱えない「外字」は、
戸籍で使われているものをはじめおよそ５万字に上っています。

中には、メーカーなどが独自に対応した外字もありますが、コードが無いために、メーカーごとの互換性が無く、
データを受け渡してもコンピューターが認識できずに「文字化け」してしまったり、ある人の名前に本名の外字を
充てたものと略字を充てたものの２つのデータがあった場合、コンピューター上では、別の人と認識されてしまったり
するなどの問題が起きていました。

このためＩＰＡ＝情報処理推進機構は平成１４年から、経済産業省とともに外字を含めたおよそ６万字の漢字１つ１つに、
コードを割りつける作業を進めた結果、このほど１５年越しでようやく完了し、国際規格として登録されました。

この結果「日本語の壁」の１つが取り払われ、外字が使われた名前を正確に表示できたり、地名を含むビッグデータを
正確に分析できたりするなどの効果が期待されています。

ＩＰＡの田代秀一参与は「日本人にとって、名前は大事なアイデンティティーで、戸籍では尊重されているがコンピューターが
追いついていなかった。文字を正確に扱えるようにすることは、今後ますます重要になる」と話しています。

■漢字とコンピューターのこれまで

戸籍で使われている文字のうち例えば「渡辺」の「ベ」は「辺」「邊」「邉」など１１種類、「斉藤」や「斎藤」の「サイ」は
「斉」「斎」「齊」「齋」などおよそ６０種類ありますが、このうちコンピューターが扱えるのは「べ」は３文字、「サイ」は
１５文字ほどです。

また「吉田」の「ヨシ」のつくりが「土」になっている漢字も外字です。日本で初めて漢字のコードが作られたのは
昭和５３年のことで、当時はコンピューターの能力が低く大量のデータを扱えないことなどから登録された漢字は、
およそ６０００字でした。

その後、昭和５４年に世界初の日本語ワープロが発売されるなど家庭や企業でパソコンが普及して、さまざまな
漢字を扱う必要が出てきましたが、コードの整備は進まず、コードのない漢字は、それぞれのメーカーがばらばらに
作っていました。

現在は、およそ１万字の漢字にコードが付いていますが、いまだに特定のソフトでなければ表示できない漢字もあり、
対応が急がれていました。

■企業や自治体も一苦労

（略）

■ＩＴ企業でも…

（略）

https://www3.nhk.or.jp/news/html/20171224/k10011270111000.html

**名無しさん＠涙目です。**(兵庫県) **[JP]** · 2017/12/24(日) 20:27:03.83

Googleに頼めば半月でできたのに

2017/12/24(日) 20:28:47.31

>>14
それコピペして書き込もうとしたら空白だってエラーが出たわ

**名無しさん＠涙目です。**(西日本) **[US]** · 2017/12/24(日) 20:32:10.27

>>80
過去に遡る、データベース化した史料を出してくるときの一致性とかね
「ネ司」とかは、戸籍統一文字、住民基本台帳、入管管理あたりでは使えるけど、一般標準の環境にはない

こないだは「ユ藤」ってのを見た、まぁ「工藤」なんだけど
公文書や資料レベルでは安易に置き換えてしまうと、見えなくなってしまう情報が含まれてる
該当文字に変更があったら、それがいつ変わったのか？　つーのも、大事な情報なの

江戸や明治の過去帳に目を通してたら、「絶対こんな文字ねーだろｗ」ってのが出てくるよ
まぁこっちは活字じゃなくて筆で描くから、まだ字画トレースできるけどさ

**名無しさん＠涙目です。**(宮城県) **[FR]** · 2017/12/24(日) 20:34:31.00

フォントがねぇから結局使えないだろ

2017/12/24(日) 20:34:32.52

これはIPAの岡ちゃんグッジョブだね

**名無しさん＠涙目です。**(宮城県) **[FR]** · 2017/12/24(日) 20:36:34.23

「俺はこんな字じゃねぇ！」とかって郵便物を受け取らないアホのせいで
数千万かけて外字を使えるようにするんだぜ？アホくさい

**名無しさん＠涙目です。**(京都府) **[US]** · 2017/12/24(日) 20:36:43.80

**名無しさん＠涙目です。**(京都府) **[US]** · 2017/12/24(日) 20:37:25.82

>>107
むう、出ないな。
たたずむ　チョなんだけど。

2017/12/24(日) 20:37:35.86

>>78
おまえは現場を知らなすぎる

2017/12/24(日) 20:38:16.84

>>1
>「斉藤」や「斎藤」の「サイ」は
>「斉」「斎」「齊」「齋」などおよそ６０種類
きちがいすぎる・・・

2017/12/24(日) 20:38:57.95

フォント買い替え&変更作業とか嫌すぎる

**名無しさん＠涙目です。**(東京都) **[CN]** · 2017/12/24(日) 20:39:14.31

旧字もちゃんと全部あるの
「月」の旧字とかレアだよ

2017/12/24(日) 20:39:40.93

こんなあほな作業AIにやらせとけ

**名無しさん＠涙目です。**(兵庫県) **[US]** · 2017/12/24(日) 20:42:43.53

>>25
富田と冨田がこの前テレビでやってた

2017/12/24(日) 20:43:48.99

斉は種類多いなとは思ってたけど60種類もあるんかよ…

**名無しさん＠涙目です。**(茸) **[CH]** · 2017/12/24(日) 20:44:09.90

虋饠戇齽钁㠨䤙鸚虌饡欞龞钂䭩鸛驨欟钄麢豔
驩㿜䖅爧䯬黸躨鱹䖆飌䶨䯀雧鼺

**名無しさん＠涙目です。**(東京都) **[US]** · 2017/12/24(日) 20:44:41.75

>>112
横棒が、になってる奴？

**名無しさん＠涙目です。**(福岡県) **[US]** · 2017/12/24(日) 20:44:48.42

Microsoft IMEが対応しないと意味がない

2017/12/24(日) 20:44:55.55

ヒラギノ対応版が出たら久しぶりにフォント弄るか
ベースはヒラギノ角ゴ、英数にFutura、AA対応パッチで幅調整して携帯絵文字の追加･･･
懐かしすぎる隔離スレ息してんのか┌(_Д_┌ )┐

**名無しさん＠涙目です。**(大阪府) **[CN]** · 2017/12/24(日) 20:45:55.47

15年www

**名無しさん＠涙目です。**(catv?) **[US]** · 2017/12/24(日) 20:47:14.55

肝心の文字コードはなんなのさｗ

**名無しさん＠涙目です。**(西日本) **[US]** · 2017/12/24(日) 20:48:36.28

こうだな

2017/12/24(日) 20:49:13.55

「門がまえ」に「火」もお願いします

**名無しさん＠涙目です。**(大阪府) **[US]** · 2017/12/24(日) 20:49:35.62

超漢字「・・・」

**名無しさん＠涙目です。**(福岡県) **[US]** · 2017/12/24(日) 20:49:59.18

何のためにマイナンバーがあるのか
数字でええやん
被る問題とか解消する

**名無しさん＠涙目です。**(東京都) **[IE]** · 2017/12/24(日) 20:50:29.68

ビャンビャン麺とかいうのは入力できるのかな

2017/12/24(日) 20:55:19.51

葉書ソフトなんかのフォントも対応出来るのかね？

2017/12/24(日) 20:55:35.63

utf-8使っていいのか(´・ω・`)？

**名無しさん＠涙目です。**(千葉県) **[US]** · 2017/12/24(日) 20:56:14.78

斎藤さんのサイの字だけで100種類くらいあるけどできたのか
明治期の戸籍掛吏員のせいだけどさ

**名無しさん＠涙目です。**(東日本) **[CN]** · 2017/12/24(日) 20:56:32.11

>>37
各駅停車どころか、スイッチバックで下って行く一方

**名無しさん＠涙目です。**(山口県) **[US]** · 2017/12/24(日) 20:57:10.55

大漢和の電子化がはかどるな

**名無しさん＠涙目です。**(千葉県) **[US]** · 2017/12/24(日) 20:57:26.24

>>20
それ人権侵害だから　無理
朝鮮人から名前を奪われたのは史実って材料にされるから

**名無しさん＠涙目です。**(西日本) **[QA]** · 2017/12/24(日) 20:57:39.76

さすが役人。
仕事遅すぎ。

2017/12/24(日) 20:58:22.74

それよりも「ユーロ記号」を早く表示できるようにしろよ

**名無しさん＠涙目です。**(千葉県) **[IT]** · 2017/12/24(日) 21:00:08.70

>>47
超漢字だな
http://www.chokanji.com/

**名無しさん＠涙目です。**(滋賀県) **[US]** · 2017/12/24(日) 21:00:12.72

こんなアホなことに労力をかけてどうする
それより意味もなく増やした人名漢字を常用漢字まで減らせば済む話だろ

**名無しさん＠涙目です。**(catv?) **[US]** · 2017/12/24(日) 21:00:29.17

DQNネームがはかどるなw

**名無しさん＠涙目です。**(大阪府) **[BR]** · 2017/12/24(日) 21:00:30.70

>>17
>>98
向こうの漢字は全部使えるのかな。
しかしこれって凄く地味な作業なんやろうね

**名無しさん＠涙目です。**(茸) **[CH]** · 2017/12/24(日) 21:01:35.82

>>14
wiki見たらちゃんとunicodeで今後出る予定になってて、超漢字だとすでに登録済みってのに驚いた

**名無しさん＠涙目です。**(東日本) **[CN]** · 2017/12/24(日) 21:02:13.59

JIS漢字があまりにも糞すぎた。
勝手に字体を変更しやがった事。　醤油の「醤」とか（この「醤」はいんちき字体）

2017/12/24(日) 21:04:08.68

ばかじゃねぇのIPA、こんなつかわねー漢字は数減らしてまとめろよ。

**名無しさん＠涙目です。**(福島県) **[CA]** · 2017/12/24(日) 21:07:36.62

島と嶋まちがえると切れるやつおるで

2017/12/24(日) 21:08:33.90

全部の公的機関は不動産登記みたいに使用できる漢字を制限すりゃいいのに

**名無しさん＠涙目です。**(群馬県) **[US]** · 2017/12/24(日) 21:17:44.35

>>142
おれ岡島なんだけど電話とかで簡単なほうの島ですか？って聞かれるといらっとする

**名無しさん＠涙目です。**(西日本) **[US]** · 2017/12/24(日) 21:20:56.89

>>144
横シマですか、下シマですか

**名無しさん＠涙目です。**(福岡県) **[US]** · 2017/12/24(日) 21:21:57.41

>>30
無駄な配慮だね。だから隣のバ韓国にもITで抜かれる。

**名無しさん＠涙目です。**(dion軍) **[CN]** · 2017/12/24(日) 21:28:07.37

>>36
峠はくねくね道という意味ではないよ

2017/12/24(日) 21:28:19.83

フォント作成者殺す気かよ

2017/12/24(日) 21:29:19.24

確かUTF8じゃ足りないんだっけ
文字コードどれになるの？

2017/12/24(日) 21:30:23.67

>>14
「雲龍形（くさん）」って読むのか

**名無しさん＠涙目です。**(東京都) **[US]** · 2017/12/24(日) 21:31:52.86

http://www.akatsukinishisu.net/kanji/teki3kyaku3haku.gif

2017/12/24(日) 21:35:57.27

>>61
中国も元素増えるたびに創字してるぞ
元素番号118の漢字は未登録
https://zh.wikipedia.org/wiki/Og

2017/12/24(日) 21:38:21.32

>>149　字数に制限が有るんじゃutf-8の存在価値が無く為るだろ

2017/12/24(日) 21:39:49.91

アルファベット1,2文字で元素を表記するという同音異義語だらけ(アルファベットの紛らわしい表現用いるのと、
元素の数だけの漢字を独自に作って同音異義語が無い表現を作るのとどっちがいいのかねぇ
前者だとアルファベットが元素を示すというのをわからせるための前置き等が必要だけど、
後者だとその漢字は特定の元素を表しているから文中でそのまま使用できるからね

2017/12/24(日) 21:40:44.23

そんなに使わねえよ
宋の時代だって漢字すげえ増やしたけど殆ど使わなかっただろ

**名無しさん＠涙目です。**(奈良県) **[US]** · 2017/12/24(日) 21:40:47.87

それで、吉田問題は解決したのか？

2017/12/24(日) 21:41:46.38

渡辺はもう統一しろ

**名無しさん＠涙目です。**(大阪府) **[US]** · 2017/12/24(日) 21:43:29.28

IPAや経済産業省のプレスリリース見てきたけどどういうことなのかわからんな
写ってるコード表に　U　とあるからUNICODEの新しい規格に
6万字の登録が完了した、ということなんだろうが

2017/12/24(日) 21:44:43.68

CJKV漢字ていうけど、KとかVはもうやる気ねーだろ

2017/12/24(日) 21:48:35.88

>>29
それが別売だと知ったときの絶望感

2017/12/24(日) 21:49:29.80

>>132
半分はキムで通名まであるのに贅沢だな

**名無しさん＠涙目です。**(東京都) **[US]** · 2017/12/24(日) 21:50:54.57

>>149
utf8は「1文字」だけで最大20億文字以上入るから余裕。
( U+7FFFFFFF - U+4000000)

2017/12/24(日) 21:50:58.06

>>47
今でもあるぞ
Windows上で動くものにされちまったらしいけど
（Windows10でも動くのかな…）

2017/12/24(日) 21:52:40.03

>>64
当用漢字復活か

**名無しさん＠涙目です。**(香川県) **[US]** · 2017/12/24(日) 21:52:52.72

SJIS廃止してUTF8に統一してほしい

2017/12/24(日) 21:54:33.38

>>108
「佇」か

2017/12/24(日) 21:55:21.30

>>122
そういうことだったのか

**名無しさん＠涙目です。**(大阪府) **[US]** · 2017/12/24(日) 21:55:46.98

>>158
自己レス
IPAや経産省にはこの件に関するプレスリリースが見つからなかったのでよくわからない　と書いた

**名無しさん＠涙目です。**(福岡県) **[US]** · 2017/12/24(日) 21:56:08.32

ええい写研は何をやっておる

**名無しさん＠涙目です。**(庭) **[CN]** · 2017/12/24(日) 21:57:07.43

とうとうぴゅう太にも漢字でプログラムする時代が来たか！

**名無しさん＠涙目です。**(茸) **[ZA]** · 2017/12/24(日) 21:58:33.18

>>16
じゃあ名前捨てて世界総背番号でいいじゃん、てのはやっぱ違うっしょ

2017/12/24(日) 21:59:02.95

>>146
韓国のIT界では、漢字の扱いってどうなってるのかな
「漢字使わなくなったからいらない」で放置なのかな
それならハングルだけになるから楽なんだろうけど

**名無しさん＠涙目です。**(dion軍) **[SE]** · 2017/12/24(日) 21:59:39.65

SJISは殺せ
誰も得してないだろ

**名無しさん＠涙目です。**(庭) **[US]** · 2017/12/24(日) 22:02:52.16

中国語は済んでるの？

**名無しさん＠涙目です。**(空) **[US]** · 2017/12/24(日) 22:03:17.47

>>99
ギャラガじゃない？

**名無しさん＠涙目です。**(空) **[KR]** · 2017/12/24(日) 22:05:45.96

漢字なんかでプログラミングしたら宮崎と宮﨑の違いみたいので簡単にバグの原因になるよね

2017/12/24(日) 22:05:48.84

そこまで拘らなくても簡単な字体でいいじゃんって思うけど
なんかあるんだろうなぁ

**名無しさん＠涙目です。**(北海道) **[US]** · 2017/12/24(日) 22:07:47.88

文字入力で変感時に強制的な負荷かけるだけだな。

**名無しさん＠涙目です。**(北海道) **[US]** · 2017/12/24(日) 22:09:10.33

>>16
基地外のわたなべ
いかれたさいとう

昔から悩まされた字だな

**名無しさん＠涙目です。**(長野県) **[IT]** · 2017/12/24(日) 22:09:30.96

例えば「龍」を2×2、「興」を2×2に積んだ恐ろしく画数が多い漢字が存在するが、それもちゃんと表示でけるんか？

2017/12/24(日) 22:11:32.82

>>1

外字をなくすチャンスだったのに
IPAとか技術馬鹿しかいねえ
本当無能
制度を変えて効率化するべきなのに
こんな外字こだわってるやつなんてごくごく少数だろうに

**名無しさん＠涙目です。**(兵庫県) **[DE]** · 2017/12/24(日) 22:11:42.82

この新たに登録完了した6万字コードっていつから確認できて
winにも実装されるのだろうか？
俺の名字も外字だから入ってるか確認したいわ

**名無しさん＠涙目です。**(東京都) **[NP]** · 2017/12/24(日) 22:11:58.32

ところで、店舗の「舗」のWin⇔Mac（鋪）問題は解決したの？

**名無しさん＠涙目です。**(大阪府) **[US]** · 2017/12/24(日) 22:13:09.06

unicode 10.0がこの6月に公開されたけど、wikipediaによると変体仮名の追加となってるから
次のunicode 11.0あたりに追加されるという話なのかな

技術ニュースでソースにリンク張らないからよくわからんな

2017/12/24(日) 22:14:49.25

>>132

無理で終わらすから馬鹿なんだよ

**名無しさん＠涙目です。**(大阪府) **[US]** · 2017/12/24(日) 22:15:13.79

>>182
winでの最新のOSであるwindows 10ならばサポートされるんじゃないの
unicodeのバージョンアップに合わせて更新されているわけだし

**名無しさん＠涙目です。**(東京都) **[CN]** · 2017/12/24(日) 22:15:38.29

15年って時間かけすぎじゃね？

**名無しさん＠涙目です。**(東京都) **[US]** · 2017/12/24(日) 22:20:24.15

いらない漢字はもう廃止でいいだろ

**名無しさん＠涙目です。**(長屋) **[US]** · 2017/12/24(日) 22:24:02.50

台湾と調整できてるのかな？

**名無しさん＠涙目です。**(千葉県) **[GR]** · 2017/12/24(日) 22:25:52.45

2バイト文字やめろよ文字化けするんだよ

**名無しさん＠涙目です。**(大阪府) **[DE]** · 2017/12/24(日) 22:39:12.47

同音異義語が大量発生

**名無しさん＠涙目です。**(滋賀県) **[KR]** · 2017/12/24(日) 22:42:52.36

名字でも昔は吉の上が短いやつだったけど
役所で登録できないから仕方なしに上が長いのに変えたみたいなこと聞いたな

**名無しさん＠涙目です。**(北海道) **[US]** · 2017/12/24(日) 22:43:03.22

木崎ゆりあのさきもな

**名無しさん＠涙目です。**(東京都) **[US]** · 2017/12/24(日) 22:45:04.75

マンション名にⅢが入ってる。
通販の住所入力で入らない事が有る。

**名無しさん＠涙目です。**(東京都) **[CN]** · 2017/12/24(日) 22:45:43.55

こんなんやるんだったら、戸籍登録のとき元の異体字を簡便な表記に変えちゃったのを元に戻させてくれよ

2017/12/24(日) 22:46:33.96

マイクロソフトのOSで標準装備されたフォントに採用されるのいつ？

2017/12/24(日) 22:46:43.58

超漢字を今頃復活？

2017/12/24(日) 22:47:15.94

無駄なことしやがって
国民の半分が読めない漢字は廃止にしろよ
国民の半分が書けない漢字は常用するな

2017/12/24(日) 22:51:49.49

濟←こんなの？

2017/12/24(日) 22:52:16.21

漢字廃止って、本末転倒だから。