ついにコンピュータで日本語の漢字すべてを使用可能に　１５年かけてコード化、国際規格に登録

**名無しさん＠涙目です。**(宮城県) **[US]** · NG

コンピューターで全漢字使用可に６万字コード化

日本語の漢字は、戸籍などに使われているものも含めると６万字あるのに対し、コンピューターは、実は１万字しか
扱うことができません。これに対し、このほど１５年越しの作業の末、６万字すべてが統一の規格にまとめられて、
コンピューターがすべての漢字を扱えるようになり、ビッグデータの活用をはじめさまざまな効果が期待されています。

コンピューターで文字を扱うには、１つ１つの文字に、「コード」と呼ばれる世界共通の番号を割りふる必要がありますが、
日本語の漢字で、コードが割りふられているのは１万字だけで、コードが無く、コンピューターが扱えない「外字」は、
戸籍で使われているものをはじめおよそ５万字に上っています。

中には、メーカーなどが独自に対応した外字もありますが、コードが無いために、メーカーごとの互換性が無く、
データを受け渡してもコンピューターが認識できずに「文字化け」してしまったり、ある人の名前に本名の外字を
充てたものと略字を充てたものの２つのデータがあった場合、コンピューター上では、別の人と認識されてしまったり
するなどの問題が起きていました。

このためＩＰＡ＝情報処理推進機構は平成１４年から、経済産業省とともに外字を含めたおよそ６万字の漢字１つ１つに、
コードを割りつける作業を進めた結果、このほど１５年越しでようやく完了し、国際規格として登録されました。

この結果「日本語の壁」の１つが取り払われ、外字が使われた名前を正確に表示できたり、地名を含むビッグデータを
正確に分析できたりするなどの効果が期待されています。

ＩＰＡの田代秀一参与は「日本人にとって、名前は大事なアイデンティティーで、戸籍では尊重されているがコンピューターが
追いついていなかった。文字を正確に扱えるようにすることは、今後ますます重要になる」と話しています。

■漢字とコンピューターのこれまで

戸籍で使われている文字のうち例えば「渡辺」の「ベ」は「辺」「邊」「邉」など１１種類、「斉藤」や「斎藤」の「サイ」は
「斉」「斎」「齊」「齋」などおよそ６０種類ありますが、このうちコンピューターが扱えるのは「べ」は３文字、「サイ」は
１５文字ほどです。

また「吉田」の「ヨシ」のつくりが「土」になっている漢字も外字です。日本で初めて漢字のコードが作られたのは
昭和５３年のことで、当時はコンピューターの能力が低く大量のデータを扱えないことなどから登録された漢字は、
およそ６０００字でした。

その後、昭和５４年に世界初の日本語ワープロが発売されるなど家庭や企業でパソコンが普及して、さまざまな
漢字を扱う必要が出てきましたが、コードの整備は進まず、コードのない漢字は、それぞれのメーカーがばらばらに
作っていました。

現在は、およそ１万字の漢字にコードが付いていますが、いまだに特定のソフトでなければ表示できない漢字もあり、
対応が急がれていました。

■企業や自治体も一苦労

（略）

■ＩＴ企業でも…

（略）

https://www3.nhk.or.jp/news/html/20171224/k10011270111000.html

2017/12/24(日) 19:33:10.63

さすがアップルやな、これからも一生アップル使うわ

**名無しさん＠涙目です。**(catv?) **[US]** · 2017/12/24(日) 19:33:16.98

吉野家はちゃんと書けるの？

**名無しさん＠涙目です。**(茸) **[ﾆﾀﾞ]** · 2017/12/24(日) 19:34:06.87

その前にsjisとeucとutfを何とかして

2017/12/24(日) 19:34:34.39

さいとうさんとわたなべさんだけに朗報

**名無しさん＠涙目です。**(東京都) **[CN]** · 2017/12/24(日) 19:34:40.93

(　｀ハ´)<丶｀∀´>　搭載もインストールもさせないｱﾙﾆﾀﾞｗ

**名無しさん＠涙目です。**(庭) **[US]** · 2017/12/24(日) 19:35:11.20

フォントは誰が用意するんだ？

**名無しさん＠涙目です。**(空) **[GR]** · 2017/12/24(日) 19:35:17.23

もうUTF8だけで良くね？

**名無しさん＠涙目です。**(埼玉県) **[US]** · 2017/12/24(日) 19:35:26.21

UTF-8じゃなくて独自キャラクタセット？

**名無しさん＠涙目です。**(大阪府) **[BR]** · 2017/12/24(日) 19:35:33.26

中国の漢字は何文字あるの？

**名無しさん＠涙目です。**(dion軍) **[JP]** · 2017/12/24(日) 19:35:46.70

苗字旧字体だから助かるわ

2017/12/24(日) 19:35:48.31

それ以前に常用漢字とかいう糞制度を根本的に考えなおせ

**名無しさん＠涙目です。**(庭) **[US]** · 2017/12/24(日) 19:35:49.56

なべの辺じゃなかったんか

**名無しさん＠涙目です。**(東日本) **[CN]** · 2017/12/24(日) 19:36:08.47

84画のこれもコード化したんか？
https://i.imgur.com/XS5WDy0.jpg

**名無しさん＠涙目です。**(青森県) **[CH]** · 2017/12/24(日) 19:36:39.73

Unicode埋め終わったんだ

2017/12/24(日) 19:37:09.59

＞渡辺」の「ベ」は「辺」「邊」「邉」など１１種類、「斉藤」や「斎藤」の「サイ」は
「斉」「斎」「齊」「齋」などおよそ６０種類

これ漢字を簡単なやつに統一したらいいじゃん
無駄なことを
漢字も時代とともに変遷してきて多様性ができてしまったのに
そのうちの一つにこだわるようなクソみたいなアイデンティティなんかステさせろ

2017/12/24(日) 19:37:12.49

>>10
当然といえば当然だけど総数自体はたいして変わらん

**名無しさん＠涙目です。**(家) **[US]** · 2017/12/24(日) 19:37:24.37

Unicodeのユの字も出てないけどバカが書いた記事かな？

**名無しさん＠涙目です。**(catv?) **[CN]** · 2017/12/24(日) 19:37:27.36

>>7
なんか大変そうだよな

**名無しさん＠涙目です。**(茸) **[CA]** · 2017/12/24(日) 19:37:51.25

>>1
戸籍を簡単な漢字に直せば良いだろwww
サイトーとかワタナベとか面倒臭すぎ
コイツラが変な拘り捨てりゃ良いんだよ

2017/12/24(日) 19:37:53.04

漢検一級に出てくるような漢字は廃止しろよ
変換したくても読めねーから面倒くせーよ

**名無しさん＠涙目です。**(埼玉県) **[US]** · 2017/12/24(日) 19:38:16.42

>>19
フォントはIPAフォントってのがすでに作成済みだったはず。

2017/12/24(日) 19:38:29.39

どうせデータ連携で化けるんだから余計な事しなくても
なきゃないで終わりなのに

**名無しさん＠涙目です。**(東京都) **[CN]** · 2017/12/24(日) 19:39:38.03

>>14
シューティングのキャラでしょ
これが３つずつヒューって落ちて攻めてくるんだよね？

2017/12/24(日) 19:39:48.21

>>16
おいおい言ってることがメチャメチャだな
変遷してきた多様性の結果がそういう表記違いだろ
統一しろってのは多様性の否定だけどお前の主張はどっちだよ

2017/12/24(日) 19:39:59.94

しょうもない事に予算使うな

2017/12/24(日) 19:40:02.47

あれ、、1日15文字くらいのお仕事？

2017/12/24(日) 19:40:21.49

こんなバカげた文字に付き合わされる欧米人も大変だな

2017/12/24(日) 19:40:48.37

>>1
マジか漢字ROM増設だな！

**名無しさん＠涙目です。**(庭) **[US]** · 2017/12/24(日) 19:41:21.53

>>18
NHKの一般人向けニュースだぞ

**名無しさん＠涙目です。**(家) **[US]** · 2017/12/24(日) 19:41:35.96

草なぎも変換できるな

2017/12/24(日) 19:41:59.10

こんなもんに１５年もかかる未開の土人国

**名無しさん＠涙目です。**(東京都) **[US]** · 2017/12/24(日) 19:42:04.85

コンピュータおばあちゃん～

2017/12/24(日) 19:43:13.95

最近認印で正しい苗字のものが見当たらなくなってきた

2017/12/24(日) 19:44:05.42

フォントデザイナーの災厄

2017/12/24(日) 19:44:17.80

山のくねくね道って意味で峠があるので、山へんの代わりに金にして、金上下の漢字を作って欲しい。
当然読みはギャンブル。って意味で

2017/12/24(日) 19:44:38.33

>>32
貴重な天下り先だからな。
半年で終わらせたら儲けられない。

これからも日本のITは各駅停車だぜ！

**名無しさん＠涙目です。**(茸) **[ﾆﾀﾞ]** · 2017/12/24(日) 19:44:45.24

2バイトに収まって良かったね

**名無しさん＠涙目です。**(カナダ) **[JP]** · 2017/12/24(日) 19:45:08.03

よし、次はプログラムが認識してくれる1バイトの半角漢字を搭載してくれ
なおかつ見た目は細長くなくて、全角と同じように表示される奴な！

**名無しさん＠涙目です。**(宮城県) **[KR]** · 2017/12/24(日) 19:45:09.32

山形にいたころ、「玉」の上の棒を取って「つち」と読む
苗字があったんだが、そんなのにも対応してんのかね。

2017/12/24(日) 19:45:48.77

え？
これ既存データどうすんの？
やるの？
ヤダよヤダヤダヤダ

2017/12/24(日) 19:46:51.44

これは良くやった！と褒めてあげたい

2017/12/24(日) 19:46:59.66

無駄な事に幾らかけたんだろうか

2017/12/24(日) 19:47:20.23

>>7
用意してるだろ。
じゃなきゃ、さすがにコード割り振りだけで６万語に１５年もかからん。

**名無しさん＠涙目です。**(埼玉県) **[US]** · 2017/12/24(日) 19:48:56.15

それでいつから使えるようになるんだ？

**名無しさん＠涙目です。**(埼玉県) **[US]** · 2017/12/24(日) 19:49:35.83

>>41
問題はそれだよな
SJIS外字領域で作った外字全部を
コード割り当てしなきゃいけないの気が遠くなるわ

**名無しさん＠涙目です。**(栃木県) **[NL]** · 2017/12/24(日) 19:49:56.51

昔TRONというのがあってだな…

2017/12/24(日) 19:50:02.29

それより半角カナとかいう人類悪を早く根絶して欲しい。
あんなものは人道に反する罪で裁かれるレベルだ

2017/12/24(日) 19:51:07.69

>>46
もちろん、コンバートライブラリも作っただろ。１５年も税金使ったんだぜ？

**名無しさん＠涙目です。**(茸) **[US]** · 2017/12/24(日) 19:51:19.20

馬鹿じゃねえの

2017/12/24(日) 19:51:21.03

>>25
漢字の多様性なんて使用者が間違って書いたりわざと変えて書いたものが
元は同じものなんだから統一しろって話
エントロピーは増大するんだから仕事によって元に戻す必要がある

**名無しさん＠涙目です。**(空) **[US]** · 2017/12/24(日) 19:51:53.60

Windowsではいつから使えるの？

2017/12/24(日) 19:52:18.97

>>48
全角英数字はいいの？

**名無しさん＠涙目です。**(茸) **[DE]** · 2017/12/24(日) 19:52:47.18

>>20
コンピュータに人間が合わせろというのは昭和５０年代の思想だぞw

**名無しさん＠涙目です。**(千葉県) **[US]** · 2017/12/24(日) 19:53:00.66

超漢字がないとは

2017/12/24(日) 19:54:12.36

ｿﾉﾏｴﾆﾊﾝｶｸｶﾅｦﾊｲｼｼﾛ

**名無しさん＠涙目です。**(catv?) **[DE]** · 2017/12/24(日) 19:55:22.90

やったぜ！名前も常用漢字以外も付けられるようにして

2017/12/24(日) 19:56:21.42

4万文字格納している第4水準に+2万字？
第5水準になるの？

**名無しさん＠涙目です。**(茸) **[CN]** · 2017/12/24(日) 19:56:37.49

>>24
www

**名無しさん＠涙目です。**(pc?) **[US]** · 2017/12/24(日) 19:56:53.20

その点26文字で済むアルファベットは優秀だな

2017/12/24(日) 19:57:01.51

中国は漢字を簡略化する方向に進んでいるのに日本は逆行するのか？
姓は全部旧字で書く動きになって余計ややこしくなりそう。
元号と一緒、害悪でしかない。

**名無しさん＠涙目です。**(埼玉県) **[US]** · 2017/12/24(日) 19:58:26.32

>>49
だ、騙されないぞ！！
それにどうせコンバーター使ったって検証作業で泣くんだから…

2017/12/24(日) 19:58:54.63

はしご高登録されるのか

**名無しさん＠涙目です。**(禿) **[KR]** · 2017/12/24(日) 19:59:29.85

常用漢字とか人名漢字とかの制限の方をきつくしてくれればそんな大事業は要らなかったんじゃないのか

**名無しさん＠涙目です。**(埼玉県) **[US]** · 2017/12/24(日) 19:59:51.23

ついに三国志ヲタの苦労が報われる日が来たか

2017/12/24(日) 20:01:09.85

草なぎは？

**名無しさん＠涙目です。**(空) **[KR]** · 2017/12/24(日) 20:01:18.58

そもそもIMEが対応していないと変換できないに一票
コードの中にあっても候補として呼び出されないよね

**名無しさん＠涙目です。**(catv?) **[US]** · 2017/12/24(日) 20:02:04.38

>>48
ﾎﾟｯｷｰ

2017/12/24(日) 20:02:20.97

>>44
６万人のデザイナー雇えば数ヶ月で終わったんじゃ？

**名無しさん＠涙目です。**(茸) **[US]** · 2017/12/24(日) 20:02:25.40

外字登録いらないの？
ぃまさらかよ

**名無しさん＠涙目です。**(catv?) **[US]** · 2017/12/24(日) 20:03:23.93

結局JIS第一、第二以外を使うと読めないので迷惑でしかない

**名無しさん＠涙目です。**(静岡県) **[AU]** · 2017/12/24(日) 20:03:30.78

普通の人が使えるようになるのは何時だろう？

**名無しさん＠涙目です。**(愛知県) **[BR]** · 2017/12/24(日) 20:04:10.22

http://i.imgur.com/3jhNr7M.jpg

2017/12/24(日) 20:04:49.78

こゎぃょ～

**名無しさん＠涙目です。**(静岡県) **[AU]** · 2017/12/24(日) 20:05:12.06

これで厨二臭い文章が捗るねｗ

**名無しさん＠涙目です。**(dion軍) **[KR]** · 2017/12/24(日) 20:06:02.99

努力だけ評価する

**名無しさん＠涙目です。**(西日本) **[US]** · 2017/12/24(日) 20:06:59.24

>>63
現状の標準環境でも使えるだろ

2017/12/24(日) 20:08:22.58

>>71
それは第4水準までを使えないフォントを使ってるバカが悪い
MSゴシック、游ゴシック、メイリオ、ヒラギノはJIS X 0213に対応してんだよバカ

**名無しさん＠涙目です。**(大阪府) **[FR]** · 2017/12/24(日) 20:08:25.10

ついに大漢和辞典オンライン版が発行可能になるのか

**名無しさん＠涙目です。**(空) **[US]** · 2017/12/24(日) 20:09:33.99

これは簡単な方に統一すべきでは？
高と梯子高、浜と濱と賓と眉浜とか斉藤とか種類がありすぎて困るから簡単なのにしろよ
でなきゃ手間が掛かりすぎて困る

2017/12/24(日) 20:10:12.28

サイトウとワタナベいい加減にせえよ

**名無しさん＠涙目です。**(catv?) **[NG]** · 2017/12/24(日) 20:11:27.15

クソＩＭＥに入ってないと使えないけどな

**名無しさん＠涙目です。**(catv?) **[US]** · 2017/12/24(日) 20:11:38.86

そういや漢字って新しい奴増えないの？
略字とかじゃなくて

**名無しさん＠涙目です。**(大阪府) **[NL]** · 2017/12/24(日) 20:12:15.64

やったやん

2017/12/24(日) 20:12:32.58

さすが岡ちゃんや

**名無しさん＠涙目です。**(東京都) **[GB]** · 2017/12/24(日) 20:12:35.56

マイナンバーとか推進する前にこれ終わらせとけよ無能

2017/12/24(日) 20:14:07.91

>>14
いつ使うんだよコレｗｗｗ

2017/12/24(日) 20:14:54.52

>>81
渡辺は漢字の組み合わせも多いうえ、わたなべ、わたべ、わたのべ、わたりべとか読み方も数種類あって本当に迷惑

**名無しさん＠涙目です。**(茸) **[ﾆﾀﾞ]** · 2017/12/24(日) 20:15:06.57

超漢字OSとは何だったのか

**名無しさん＠涙目です。**(catv?) **[CA]** · 2017/12/24(日) 20:16:13.39

一方ユニコードコンソーシアムはどうでもいい絵文字を増やしていた

**名無しさん＠涙目です。**(東京都) **[CN]** · 2017/12/24(日) 20:16:35.68

>>69
出来がバラバラになるぞ
デザイナーに免許とかないから

2017/12/24(日) 20:16:45.48

役員仕事しろ

2017/12/24(日) 20:16:56.97

トロンコード？

2017/12/24(日) 20:20:31.45

>>83
江戸時代でもアクロバットな読み方は続々考え出されたけど新しい漢字は数えるほどだな
必要に応じて作られてきたもんだから外来語をそのまま表記するようになった今
新しい熟語はできても字は滅多なことじゃできないだろ

**名無しさん＠涙目です。**(庭) **[BB]** · 2017/12/24(日) 20:22:02.65

>>25
戸籍を登録する際に記述人が適当に書いて増えちまったものがある
年金記録と逆のパターンだな

**名無しさん＠涙目です。**(大阪府) **[US]** · 2017/12/24(日) 20:22:11.25

漢字は94x94=8836文字で全てと思って生活すれば問題なし

**名無しさん＠涙目です。**(大阪府) **[US]** · 2017/12/24(日) 20:23:06.56

役場の役人の手癖のせいで新しい文字が増えたりした

**名無しさん＠涙目です。**(兵庫県) **[US]** · 2017/12/24(日) 20:23:19.50

>>10
86000字ほど

**名無しさん＠涙目です。**(空) **[US]** · 2017/12/24(日) 20:25:15.45

>>24
ギャラクシアンかよ

**名無しさん＠涙目です。**(大阪府) **[US]** · 2017/12/24(日) 20:26:54.93

>>73
気体は一目瞭然