X



ついにコンピュータで日本語の漢字すべてを使用可能に 15年かけてコード化、国際規格に登録
■ このスレッドは過去ログ倉庫に格納されています
0001名無しさん@涙目です。(宮城県) [US]
垢版 |
NGNG?PLT(13121)

コンピューターで全漢字使用可に 6万字コード化

日本語の漢字は、戸籍などに使われているものも含めると6万字あるのに対し、コンピューターは、実は1万字しか
扱うことができません。これに対し、このほど15年越しの作業の末、6万字すべてが統一の規格にまとめられて、
コンピューターがすべての漢字を扱えるようになり、ビッグデータの活用をはじめさまざまな効果が期待されています。

コンピューターで文字を扱うには、1つ1つの文字に、「コード」と呼ばれる世界共通の番号を割りふる必要がありますが、
日本語の漢字で、コードが割りふられているのは1万字だけで、コードが無く、コンピューターが扱えない「外字」は、
戸籍で使われているものをはじめおよそ5万字に上っています。

中には、メーカーなどが独自に対応した外字もありますが、コードが無いために、メーカーごとの互換性が無く、
データを受け渡してもコンピューターが認識できずに「文字化け」してしまったり、ある人の名前に本名の外字を
充てたものと略字を充てたものの2つのデータがあった場合、コンピューター上では、別の人と認識されてしまったり
するなどの問題が起きていました。

このためIPA=情報処理推進機構は平成14年から、経済産業省とともに外字を含めたおよそ6万字の漢字1つ1つに、
コードを割りつける作業を進めた結果、このほど15年越しでようやく完了し、国際規格として登録されました。

この結果「日本語の壁」の1つが取り払われ、外字が使われた名前を正確に表示できたり、地名を含むビッグデータを
正確に分析できたりするなどの効果が期待されています。

IPAの田代秀一参与は「日本人にとって、名前は大事なアイデンティティーで、戸籍では尊重されているがコンピューターが
追いついていなかった。文字を正確に扱えるようにすることは、今後ますます重要になる」と話しています。

■漢字とコンピューターのこれまで

戸籍で使われている文字のうち例えば「渡辺」の「ベ」は「辺」「邊」「邉」など11種類、「斉藤」や「斎藤」の「サイ」は
「斉」「斎」「齊」「齋」などおよそ60種類ありますが、このうちコンピューターが扱えるのは「べ」は3文字、「サイ」は
15文字ほどです。

また「吉田」の「ヨシ」のつくりが「土」になっている漢字も外字です。日本で初めて漢字のコードが作られたのは
昭和53年のことで、当時はコンピューターの能力が低く大量のデータを扱えないことなどから登録された漢字は、
およそ6000字でした。

その後、昭和54年に世界初の日本語ワープロが発売されるなど家庭や企業でパソコンが普及して、さまざまな
漢字を扱う必要が出てきましたが、コードの整備は進まず、コードのない漢字は、それぞれのメーカーがばらばらに
作っていました。

現在は、およそ1万字の漢字にコードが付いていますが、いまだに特定のソフトでなければ表示できない漢字もあり、
対応が急がれていました。

■企業や自治体も一苦労

(略)

■IT企業でも…

(略)

https://www3.nhk.or.jp/news/html/20171224/k10011270111000.html
0002名無しさん@涙目です。(チベット自治区) [ニダ]
垢版 |
2017/12/24(日) 19:33:10.63ID:1B4bynNX0
さすがアップルやな、これからも一生アップル使うわ
0005名無しさん@涙目です。(関東・甲信越) [US]
垢版 |
2017/12/24(日) 19:34:34.39ID:dDxGM9hKO
さいとうさんとわたなべさんだけに朗報
0006名無しさん@涙目です。(東京都) [CN]
垢版 |
2017/12/24(日) 19:34:40.93ID:zI17Wdf70
( `ハ´)<丶`∀´> 搭載もインストールもさせないアルニダw
0007名無しさん@涙目です。(庭) [US]
垢版 |
2017/12/24(日) 19:35:11.20ID:eG4oDqE90
フォントは誰が用意するんだ?
0011名無しさん@涙目です。(dion軍) [JP]
垢版 |
2017/12/24(日) 19:35:46.70ID:iPWlb7CZ0
苗字旧字体だから助かるわ
0012名無しさん@涙目です。(チベット自治区) [US]
垢版 |
2017/12/24(日) 19:35:48.31ID:M5EhgwlT0
それ以前に常用漢字とかいう糞制度を根本的に考えなおせ
0016名無しさん@涙目です。(チベット自治区) [EU]
垢版 |
2017/12/24(日) 19:37:09.59ID:AFeSba2S0
>渡辺」の「ベ」は「辺」「邊」「邉」など11種類、「斉藤」や「斎藤」の「サイ」は
「斉」「斎」「齊」「齋」などおよそ60種類

これ漢字を簡単なやつに統一したらいいじゃん
無駄なことを
漢字も時代とともに変遷してきて多様性ができてしまったのに
そのうちの一つにこだわるようなクソみたいなアイデンティティなんかステさせろ
0017名無しさん@涙目です。(チベット自治区) [US]
垢版 |
2017/12/24(日) 19:37:12.49ID:M5EhgwlT0
>>10
当然といえば当然だけど総数自体はたいして変わらん
0020名無しさん@涙目です。(茸) [CA]
垢版 |
2017/12/24(日) 19:37:51.25ID:aBrzcYD90
>>1
戸籍を簡単な漢字に直せば良いだろwww
サイトーとかワタナベとか面倒臭すぎ
コイツラが変な拘り捨てりゃ良いんだよ
0025名無しさん@涙目です。(チベット自治区) [US]
垢版 |
2017/12/24(日) 19:39:48.21ID:M5EhgwlT0
>>16
おいおい言ってることがメチャメチャだな
変遷してきた多様性の結果がそういう表記違いだろ
統一しろってのは多様性の否定だけどお前の主張はどっちだよ
0028名無しさん@涙目です。(やわらか銀行) [US]
垢版 |
2017/12/24(日) 19:40:21.49ID:Jp6EfYB50
こんなバカげた文字に付き合わされる欧米人も大変だな
0029名無しさん@涙目です。(広西チワン族自治区) [US]
垢版 |
2017/12/24(日) 19:40:48.37ID:7lk4EkvqO
>>1
マジか漢字ROM増設だな!
0030名無しさん@涙目です。(庭) [US]
垢版 |
2017/12/24(日) 19:41:21.53ID:eG4oDqE90
>>18
NHKの一般人向けニュースだぞ
0032名無しさん@涙目です。(チベット自治区) [US]
垢版 |
2017/12/24(日) 19:41:59.10ID:0A0zdG1s0
こんなもんに15年もかかる未開の土人国
0034名無しさん@涙目です。(やわらか銀行) [CN]
垢版 |
2017/12/24(日) 19:43:13.95ID:BvKtoIHE0
最近認印で正しい苗字のものが見当たらなくなってきた
0036名無しさん@涙目です。(dion軍) [ニダ]
垢版 |
2017/12/24(日) 19:44:17.80ID:luU06Ppq0
山のくねくね道って意味で峠があるので、山へんの代わりに金にして、金上下の漢字を作って欲しい。
当然読みはギャンブル。って意味で
0038名無しさん@涙目です。(茸) [ニダ]
垢版 |
2017/12/24(日) 19:44:45.24ID:d8yYWPJq0
2バイトに収まって良かったね
0039名無しさん@涙目です。(カナダ) [JP]
垢版 |
2017/12/24(日) 19:45:08.03ID:AAVKFMki0
よし、次はプログラムが認識してくれる1バイトの半角漢字を搭載してくれ
なおかつ見た目は細長くなくて、全角と同じように表示される奴な!
0040名無しさん@涙目です。(宮城県) [KR]
垢版 |
2017/12/24(日) 19:45:09.32ID:GAJRAkF30
山形にいたころ、「玉」の上の棒を取って「つち」と読む
苗字があったんだが、そんなのにも対応してんのかね。
0042名無しさん@涙目です。(チベット自治区) [US]
垢版 |
2017/12/24(日) 19:46:51.44ID:KGHpsw+70
これは良くやった!と褒めてあげたい
0044名無しさん@涙目です。(チベット自治区) [US]
垢版 |
2017/12/24(日) 19:47:20.23ID:KGHpsw+70
>>7
用意してるだろ。
じゃなきゃ、さすがにコード割り振りだけで6万語に15年もかからん。
0045名無しさん@涙目です。(埼玉県) [US]
垢版 |
2017/12/24(日) 19:48:56.15ID:oeIk+ncu0
それでいつから使えるようになるんだ?
0049名無しさん@涙目です。(チベット自治区) [US]
垢版 |
2017/12/24(日) 19:51:07.69ID:KGHpsw+70
>>46
もちろん、コンバートライブラリも作っただろ。15年も税金使ったんだぜ?
0050名無しさん@涙目です。(茸) [US]
垢版 |
2017/12/24(日) 19:51:19.20ID:kKWrYEwV0
馬鹿じゃねえの
0051名無しさん@涙目です。(チベット自治区) [EU]
垢版 |
2017/12/24(日) 19:51:21.03ID:AFeSba2S0
>>25
漢字の多様性なんて使用者が間違って書いたりわざと変えて書いたものが
元は同じものなんだから統一しろって話
エントロピーは増大するんだから仕事によって元に戻す必要がある
0053名無しさん@涙目です。(群馬県) [ニダ]
垢版 |
2017/12/24(日) 19:52:18.97ID:ira+X7J/0
>>48
全角英数字はいいの?
0055名無しさん@涙目です。(千葉県) [US]
垢版 |
2017/12/24(日) 19:53:00.66ID:4KD4IWXw0
超漢字がないとは
0056名無しさん@涙目です。(神奈川県) [JP]
垢版 |
2017/12/24(日) 19:54:12.36ID:gP6gnIa10
ソノマエニハンカクカナヲハイシシロ
0057名無しさん@涙目です。(catv?) [DE]
垢版 |
2017/12/24(日) 19:55:22.90ID:53TLoaEA0
やったぜ!名前も常用漢字以外も付けられるようにして
0058名無しさん@涙目です。(やわらか銀行) [JP]
垢版 |
2017/12/24(日) 19:56:21.42ID:awSHZnB80
4万文字格納している第4水準に+2万字?
第5水準になるの?
0060名無しさん@涙目です。(pc?) [US]
垢版 |
2017/12/24(日) 19:56:53.20ID:5gE6HO8y0
その点26文字で済むアルファベットは優秀だな
0061名無しさん@涙目です。(dion軍) [ニダ]
垢版 |
2017/12/24(日) 19:57:01.51ID:5YvbZiqz0
中国は漢字を簡略化する方向に進んでいるのに日本は逆行するのか?
姓は全部旧字で書く動きになって余計ややこしくなりそう。
元号と一緒、害悪でしかない。
0067名無しさん@涙目です。(空) [KR]
垢版 |
2017/12/24(日) 20:01:18.58ID:ypgukzXC0
そもそもIMEが対応していないと変換できないに一票
コードの中にあっても候補として呼び出されないよね
0068名無しさん@涙目です。(catv?) [US]
垢版 |
2017/12/24(日) 20:02:04.38ID:cWuljro80
>>48
ポッキー
0077名無しさん@涙目です。(西日本) [US]
垢版 |
2017/12/24(日) 20:06:59.24ID:TEJGrfiL0
>>63
現状の標準環境でも使えるだろ
0078名無しさん@涙目です。(やわらか銀行) [JP]
垢版 |
2017/12/24(日) 20:08:22.58ID:awSHZnB80
>>71
それは第4水準までを使えないフォントを使ってるバカが悪い
MSゴシック、游ゴシック、メイリオ、ヒラギノはJIS X 0213に対応してんだよバカ
0079名無しさん@涙目です。(大阪府) [FR]
垢版 |
2017/12/24(日) 20:08:25.10ID:g5M9KQDZ0
ついに大漢和辞典オンライン版が発行可能になるのか
0080名無しさん@涙目です。(空) [US]
垢版 |
2017/12/24(日) 20:09:33.99ID:PTc95fiA0
これは簡単な方に統一すべきでは?
高と梯子高、浜と濱と賓と眉浜とか斉藤とか種類がありすぎて困るから簡単なのにしろよ
でなきゃ手間が掛かりすぎて困る
0081名無しさん@涙目です。(catv?) [ニダ]
垢版 |
2017/12/24(日) 20:10:12.28ID:hZTBNa4k0
サイトウとワタナベいい加減にせえよ
0082名無しさん@涙目です。(catv?) [NG]
垢版 |
2017/12/24(日) 20:11:27.15ID:UGdYqCKX0
クソIMEに入ってないと使えないけどな
0084名無しさん@涙目です。(大阪府) [NL]
垢版 |
2017/12/24(日) 20:12:15.64ID:8UNaW86M0
やったやん
0085名無しさん@涙目です。(チベット自治区) [US]
垢版 |
2017/12/24(日) 20:12:32.58ID:fhcZniOO0
さすが岡ちゃんや
0086名無しさん@涙目です。(東京都) [GB]
垢版 |
2017/12/24(日) 20:12:35.56ID:21sZGhhe0
マイナンバーとか推進する前にこれ終わらせとけよ無能
0087名無しさん@涙目です。(チベット自治区) [BR]
垢版 |
2017/12/24(日) 20:14:07.91ID:OUrTXgjD0
>>14
いつ使うんだよコレwww
0089名無しさん@涙目です。(茸) [ニダ]
垢版 |
2017/12/24(日) 20:15:06.57ID:d8yYWPJq0
超漢字OSとは何だったのか
0090名無しさん@涙目です。(catv?) [CA]
垢版 |
2017/12/24(日) 20:16:13.39ID:G2OT0vrN0
一方ユニコードコンソーシアムはどうでもいい絵文字を増やしていた
0093名無しさん@涙目です。(神奈川県) [TR]
垢版 |
2017/12/24(日) 20:16:56.97ID:L/bdTRyD0
トロンコード?
0094名無しさん@涙目です。(チベット自治区) [US]
垢版 |
2017/12/24(日) 20:20:31.45ID:M5EhgwlT0
>>83
江戸時代でもアクロバットな読み方は続々考え出されたけど新しい漢字は数えるほどだな
必要に応じて作られてきたもんだから外来語をそのまま表記するようになった今
新しい熟語はできても字は滅多なことじゃできないだろ
0095名無しさん@涙目です。(庭) [BB]
垢版 |
2017/12/24(日) 20:22:02.65ID:DB9qbott0
>>25
戸籍を登録する際に記述人が適当に書いて増えちまったものがある
年金記録と逆のパターンだな
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況