ついにコンピュータで日本語の漢字すべてを使用可能に 15年かけてコード化、国際規格に登録
■ このスレッドは過去ログ倉庫に格納されています
コンピューターで全漢字使用可に 6万字コード化
日本語の漢字は、戸籍などに使われているものも含めると6万字あるのに対し、コンピューターは、実は1万字しか
扱うことができません。これに対し、このほど15年越しの作業の末、6万字すべてが統一の規格にまとめられて、
コンピューターがすべての漢字を扱えるようになり、ビッグデータの活用をはじめさまざまな効果が期待されています。
コンピューターで文字を扱うには、1つ1つの文字に、「コード」と呼ばれる世界共通の番号を割りふる必要がありますが、
日本語の漢字で、コードが割りふられているのは1万字だけで、コードが無く、コンピューターが扱えない「外字」は、
戸籍で使われているものをはじめおよそ5万字に上っています。
中には、メーカーなどが独自に対応した外字もありますが、コードが無いために、メーカーごとの互換性が無く、
データを受け渡してもコンピューターが認識できずに「文字化け」してしまったり、ある人の名前に本名の外字を
充てたものと略字を充てたものの2つのデータがあった場合、コンピューター上では、別の人と認識されてしまったり
するなどの問題が起きていました。
このためIPA=情報処理推進機構は平成14年から、経済産業省とともに外字を含めたおよそ6万字の漢字1つ1つに、
コードを割りつける作業を進めた結果、このほど15年越しでようやく完了し、国際規格として登録されました。
この結果「日本語の壁」の1つが取り払われ、外字が使われた名前を正確に表示できたり、地名を含むビッグデータを
正確に分析できたりするなどの効果が期待されています。
IPAの田代秀一参与は「日本人にとって、名前は大事なアイデンティティーで、戸籍では尊重されているがコンピューターが
追いついていなかった。文字を正確に扱えるようにすることは、今後ますます重要になる」と話しています。
■漢字とコンピューターのこれまで
戸籍で使われている文字のうち例えば「渡辺」の「ベ」は「辺」「邊」「邉」など11種類、「斉藤」や「斎藤」の「サイ」は
「斉」「斎」「齊」「齋」などおよそ60種類ありますが、このうちコンピューターが扱えるのは「べ」は3文字、「サイ」は
15文字ほどです。
また「吉田」の「ヨシ」のつくりが「土」になっている漢字も外字です。日本で初めて漢字のコードが作られたのは
昭和53年のことで、当時はコンピューターの能力が低く大量のデータを扱えないことなどから登録された漢字は、
およそ6000字でした。
その後、昭和54年に世界初の日本語ワープロが発売されるなど家庭や企業でパソコンが普及して、さまざまな
漢字を扱う必要が出てきましたが、コードの整備は進まず、コードのない漢字は、それぞれのメーカーがばらばらに
作っていました。
現在は、およそ1万字の漢字にコードが付いていますが、いまだに特定のソフトでなければ表示できない漢字もあり、
対応が急がれていました。
■企業や自治体も一苦労
(略)
■IT企業でも…
(略)
https://www3.nhk.or.jp/news/html/20171224/k10011270111000.html ( `ハ´)<丶`∀´> 搭載もインストールもさせないアルニダw それ以前に常用漢字とかいう糞制度を根本的に考えなおせ >渡辺」の「ベ」は「辺」「邊」「邉」など11種類、「斉藤」や「斎藤」の「サイ」は
「斉」「斎」「齊」「齋」などおよそ60種類
これ漢字を簡単なやつに統一したらいいじゃん
無駄なことを
漢字も時代とともに変遷してきて多様性ができてしまったのに
そのうちの一つにこだわるようなクソみたいなアイデンティティなんかステさせろ >>10
当然といえば当然だけど総数自体はたいして変わらん Unicodeのユの字も出てないけどバカが書いた記事かな? >>1
戸籍を簡単な漢字に直せば良いだろwww
サイトーとかワタナベとか面倒臭すぎ
コイツラが変な拘り捨てりゃ良いんだよ 漢検一級に出てくるような漢字は廃止しろよ
変換したくても読めねーから面倒くせーよ >>19
フォントはIPAフォントってのがすでに作成済みだったはず。 どうせデータ連携で化けるんだから余計な事しなくても
なきゃないで終わりなのに >>14
シューティングのキャラでしょ
これが3つずつヒューって落ちて攻めてくるんだよね? >>16
おいおい言ってることがメチャメチャだな
変遷してきた多様性の結果がそういう表記違いだろ
統一しろってのは多様性の否定だけどお前の主張はどっちだよ こんなバカげた文字に付き合わされる欧米人も大変だな 最近認印で正しい苗字のものが見当たらなくなってきた 山のくねくね道って意味で峠があるので、山へんの代わりに金にして、金上下の漢字を作って欲しい。
当然読みはギャンブル。って意味で >>32
貴重な天下り先だからな。
半年で終わらせたら儲けられない。
これからも日本のITは各駅停車だぜ! よし、次はプログラムが認識してくれる1バイトの半角漢字を搭載してくれ
なおかつ見た目は細長くなくて、全角と同じように表示される奴な! 山形にいたころ、「玉」の上の棒を取って「つち」と読む
苗字があったんだが、そんなのにも対応してんのかね。 え?
これ既存データどうすんの?
やるの?
ヤダよヤダヤダヤダ >>7
用意してるだろ。
じゃなきゃ、さすがにコード割り振りだけで6万語に15年もかからん。 >>41
問題はそれだよな
SJIS外字領域で作った外字全部を
コード割り当てしなきゃいけないの気が遠くなるわ それより半角カナとかいう人類悪を早く根絶して欲しい。
あんなものは人道に反する罪で裁かれるレベルだ >>46
もちろん、コンバートライブラリも作っただろ。15年も税金使ったんだぜ? >>25
漢字の多様性なんて使用者が間違って書いたりわざと変えて書いたものが
元は同じものなんだから統一しろって話
エントロピーは増大するんだから仕事によって元に戻す必要がある >>20
コンピュータに人間が合わせろというのは昭和50年代の思想だぞw やったぜ!名前も常用漢字以外も付けられるようにして 4万文字格納している第4水準に+2万字?
第5水準になるの? 中国は漢字を簡略化する方向に進んでいるのに日本は逆行するのか?
姓は全部旧字で書く動きになって余計ややこしくなりそう。
元号と一緒、害悪でしかない。 >>49
だ、騙されないぞ!!
それにどうせコンバーター使ったって検証作業で泣くんだから… 常用漢字とか人名漢字とかの制限の方をきつくしてくれればそんな大事業は要らなかったんじゃないのか そもそもIMEが対応していないと変換できないに一票
コードの中にあっても候補として呼び出されないよね >>44
6万人のデザイナー雇えば数ヶ月で終わったんじゃ? 結局JIS第一、第二以外を使うと読めないので迷惑でしかない >>71
それは第4水準までを使えないフォントを使ってるバカが悪い
MSゴシック、游ゴシック、メイリオ、ヒラギノはJIS X 0213に対応してんだよバカ これは簡単な方に統一すべきでは?
高と梯子高、浜と濱と賓と眉浜とか斉藤とか種類がありすぎて困るから簡単なのにしろよ
でなきゃ手間が掛かりすぎて困る そういや漢字って新しい奴増えないの?
略字とかじゃなくて マイナンバーとか推進する前にこれ終わらせとけよ無能 >>81
渡辺は漢字の組み合わせも多いうえ、わたなべ、わたべ、わたのべ、わたりべとか読み方も数種類あって本当に迷惑 一方ユニコードコンソーシアムはどうでもいい絵文字を増やしていた >>69
出来がバラバラになるぞ
デザイナーに免許とかないから >>83
江戸時代でもアクロバットな読み方は続々考え出されたけど新しい漢字は数えるほどだな
必要に応じて作られてきたもんだから外来語をそのまま表記するようになった今
新しい熟語はできても字は滅多なことじゃできないだろ >>25
戸籍を登録する際に記述人が適当に書いて増えちまったものがある
年金記録と逆のパターンだな 漢字は94x94=8836文字で全てと思って生活すれば問題なし >>14
それコピペして書き込もうとしたら空白だってエラーが出たわ >>80
過去に遡る、データベース化した史料を出してくるときの一致性とかね
「ネ司」とかは、戸籍統一文字、住民基本台帳、入管管理あたりでは使えるけど、一般標準の環境にはない
こないだは「ユ藤」ってのを見た、まぁ「工藤」なんだけど
公文書や資料レベルでは安易に置き換えてしまうと、見えなくなってしまう情報が含まれてる
該当文字に変更があったら、それがいつ変わったのか? つーのも、大事な情報なの
江戸や明治の過去帳に目を通してたら、「絶対こんな文字ねーだろw」ってのが出てくるよ
まぁこっちは活字じゃなくて筆で描くから、まだ字画トレースできるけどさ 「俺はこんな字じゃねぇ!」とかって郵便物を受け取らないアホのせいで
数千万かけて外字を使えるようにするんだぜ?アホくさい >>107
むう、出ないな。
たたずむ チョなんだけど。 >>1
>「斉藤」や「斎藤」の「サイ」は
>「斉」「斎」「齊」「齋」などおよそ60種類
きちがいすぎる・・・ 旧字もちゃんと全部あるの
「月」の旧字とかレアだよ 斉は種類多いなとは思ってたけど60種類もあるんかよ… 虋饠戇齽钁㠨䤙鸚虌饡欞龞钂䭩鸛驨欟钄麢豔
驩㿜䖅爧䯬黸躨鱹䖆飌䶨䯀雧鼺 Microsoft IMEが対応しないと意味がない ヒラギノ対応版が出たら久しぶりにフォント弄るか
ベースはヒラギノ角ゴ、英数にFutura、AA対応パッチで幅調整して携帯絵文字の追加・・・
懐かしすぎる隔離スレ息してんのか┌(_Д_┌ )┐ こうだな
何のためにマイナンバーがあるのか
数字でええやん
被る問題とか解消する 斎藤さんのサイの字だけで100種類くらいあるけどできたのか
明治期の戸籍掛吏員のせいだけどさ >>37
各駅停車どころか、スイッチバックで下って行く一方 >>20
それ人権侵害だから 無理
朝鮮人から名前を奪われたのは史実って材料にされるから それよりも「ユーロ記号」を早く表示できるようにしろよ こんなアホなことに労力をかけてどうする
それより意味もなく増やした人名漢字を常用漢字まで減らせば済む話だろ >>17
>>98
向こうの漢字は全部使えるのかな。
しかしこれって凄く地味な作業なんやろうね >>14
wiki見たらちゃんとunicodeで今後出る予定になってて、超漢字だとすでに登録済みってのに驚いた JIS漢字があまりにも糞すぎた。
勝手に字体を変更しやがった事。 醤油の「醤」とか(この「醤」はいんちき字体) ばかじゃねぇのIPA、こんなつかわねー漢字は数減らしてまとめろよ。 全部の公的機関は不動産登記みたいに使用できる漢字を制限すりゃいいのに >>142
おれ岡島なんだけど電話とかで簡単なほうの島ですか?って聞かれるといらっとする >>30
無駄な配慮だね。だから隣のバ韓国にもITで抜かれる。 確かUTF8じゃ足りないんだっけ
文字コードどれになるの? >>149 字数に制限が有るんじゃutf-8の存在価値が無く為るだろ アルファベット1,2文字で元素を表記するという同音異義語だらけ(アルファベットの紛らわしい表現用いるのと、
元素の数だけの漢字を独自に作って同音異義語が無い表現を作るのとどっちがいいのかねぇ
前者だとアルファベットが元素を示すというのをわからせるための前置き等が必要だけど、
後者だとその漢字は特定の元素を表しているから文中でそのまま使用できるからね そんなに使わねえよ
宋の時代だって漢字すげえ増やしたけど殆ど使わなかっただろ IPAや経済産業省のプレスリリース見てきたけどどういうことなのかわからんな
写ってるコード表に U とあるからUNICODEの新しい規格に
6万字の登録が完了した、ということなんだろうが CJKV漢字ていうけど、KとかVはもうやる気ねーだろ >>149
utf8は「1文字」だけで最大20億文字以上入るから余裕。
( U+7FFFFFFF - U+4000000) >>47
今でもあるぞ
Windows上で動くものにされちまったらしいけど
(Windows10でも動くのかな…) >>158
自己レス
IPAや経産省にはこの件に関するプレスリリースが見つからなかったのでよくわからない と書いた とうとうぴゅう太にも漢字でプログラムする時代が来たか! >>16
じゃあ名前捨てて世界総背番号でいいじゃん、てのはやっぱ違うっしょ >>146
韓国のIT界では、漢字の扱いってどうなってるのかな
「漢字使わなくなったからいらない」で放置なのかな
それならハングルだけになるから楽なんだろうけど 漢字なんかでプログラミングしたら宮崎と宮アの違いみたいので簡単にバグの原因になるよね そこまで拘らなくても簡単な字体でいいじゃんって思うけど
なんかあるんだろうなぁ >>16
基地外のわたなべ
いかれたさいとう
昔から悩まされた字だな 例えば「龍」を2×2、「興」を2×2に積んだ恐ろしく画数が多い漢字が存在するが、それもちゃんと表示でけるんか? >>1
外字をなくすチャンスだったのに
IPAとか技術馬鹿しかいねえ
本当無能
制度を変えて効率化するべきなのに
こんな外字こだわってるやつなんてごくごく少数だろうに この新たに登録完了した6万字コードっていつから確認できて
winにも実装されるのだろうか?
俺の名字も外字だから入ってるか確認したいわ ところで、店舗の「舗」のWin⇔Mac(鋪)問題は解決したの? unicode 10.0がこの6月に公開されたけど、wikipediaによると変体仮名の追加となってるから
次のunicode 11.0あたりに追加されるという話なのかな
技術ニュースでソースにリンク張らないからよくわからんな >>182
winでの最新のOSであるwindows 10ならばサポートされるんじゃないの
unicodeのバージョンアップに合わせて更新されているわけだし 名字でも昔は吉の上が短いやつだったけど
役所で登録できないから仕方なしに上が長いのに変えたみたいなこと聞いたな マンション名にVが入ってる。
通販の住所入力で入らない事が有る。 こんなんやるんだったら、戸籍登録のとき元の異体字を簡便な表記に変えちゃったのを元に戻させてくれよ マイクロソフトのOSで標準装備されたフォントに採用されるのいつ? 無駄なことしやがって
国民の半分が読めない漢字は廃止にしろよ
国民の半分が書けない漢字は常用するな また名前の入力し直しかよ!
誰かIT土方がやれよな。 どーせ、世界的には中国語ベースの漢字フォントが主流になるんじゃろ? あんま詳しくないけど、絵文字が海外でも流行ったおかげで
マイナーな漢字の対応が加速したとか聞いた >>199
こういうのって明治時代の役人が達筆で書きすぎたり適当に走り書きして生まれたんだけどな
学のない農民らは何が正しいのか知らんのでそのまま平成まで続いてしまって
由緒のある名前だと勘違いしてる人もいるしw 将来性抜群の匿名性仮想通貨Vergeは現在日本円で約24円!!
仮想通貨Verge(XVG)を特集しました。
日々拡大していく仮想通貨市場に参加して資産を増やしましょう!
http://www.bitmoney.space/entry/vergexvg >>8
unicodeとutf-8みたいな文字コードは違います
こういうのはunicodeの異体字セレクタ使うんだけど、
エンコードはまた別の話で関係ない 出版印刷業には大きいな、神経すり減らすとこだから。 >>206
と 高 とかどっちか絶対書き間違いだよねw >>206
そう言われてるけど本当なのかな
もしそうだったらそこを是正するのが正道だよなあ
ビッグデータに活用!とか言うけど斉藤が複数に別れてなんか良いことあんのかね 異体字については、その規格を実装した
OS、フォント、アプリが必要で、決めただけでは
使えない 斎藤の「サイ」は誤字なんだから国で統一しろ
誤字を誇るな斎藤 昔は手書きだから酷かった
祖母の戸籍を見たら崩し文字の阿で、
コンピュータで文書化されても出てこない文字で、
阿を手書きで書かれていた なんとか3万ぐらいで収まらんのか。。よく分からんが。 渡邊って出せても書くのは面倒画数多いしバランスが取れない( ・ω・) >>1
それで次の年号は2バイトで表記できるのかね? >>172
韓国の漢字の入力メソッドを日本が作ってるぞ 異体字セレクタで使える字形が大幅に増えるのかな
今でもこの程度は使える
https://i.imgur.com/itvLLgl.png
「葛」「祇」はJIS2004で例示字形が変わったのでWindows XP以前とVista以降のMS明朝、MSゴシックの
デフォルト字形が違うはず >>210
「高」の方が、 漢字の流れとしては間違った書き方なんだけど
常用漢字として使われてるから、まぁ、どーにもね つーかスパコンとGoogleのAIにやらせたら1ヶ月くらいで終わるんじゃねーの 大漢和辞典とか見てると
どこで使われてたんだよ?いつ使うんだよ?
って漢字が山ほどあるよな。 15年で5万字増やしたのか
1年で3333文字
年間240日勤務で1日14文字 >>151
gifのせいかプレビューだと見れるのに画像閲覧できない
ちんくる(背景白
>>100
石ヘンはともかく、他は金ヘンだ >>208
ソースの記事読むとユニコードの事を言ってるね
にしてもIPAのフォント入れないと文字化けするだろうし、
フォント入れると殆ど使わない漢字の為に従来の6倍のメモリが必要になるし、ニッチな需要のために15年もかけて税金投入してやる事かね 受益者負担の原則から、これにかかった費用は全国のワタナベおよびサイトウから徴収すべき
ワタナベ税、サイトウ税の導入が急がれる NHKのニュースが難解すぎる
これで「なんだ」と思う人が多いのでは
https://i.imgur.com/h4pNm2R.png
https://srad.jp/~yasuoka/journal/617471/ >>198
じゃあknightもnightにまとめるのかよ >>213
これなんだよなあ、問題は。
勝手な字をアイデンティティだと主張するのを認め始めると
例えば藤岡弘のあとの点をつけた「弘、」で一文字の新字なんだと認めろ
と言って来たら認めなくちゃならなくなる。
するとその度に新たにコードを割り振るのかね?
どこかでこれ以上は認めない、と線引きしなきゃ。 もうちょっと早ければこの前の年金とマイナンバーのアレも楽チンだったのにね ついに海外産ゲーム日本語化時の文字化けから解放されるのか Linux環境はEUC-JPなんかとっくに打ち捨てられているのに、Windowsは未だにSJISが主流だからな内部はとっくにUnicode化してるのに >>241
Windows 10の早期なんとかでデフォUTF-8にできるようになったらしい
設定するとA系のAPIがW系として扱われるとか >>69
一人でやったら15年間年休120日で約3万人時だから
30分に1文字デザインだな 漢字よかトランプマークを最初に入れなかったのは無能の極み >>233
フォントは各ベンダーが切他社にり替えられない既得権みたいなもんだからね。
正直統一してくれた方が凄く助かる。
統一規格ならフォントの配信もしなくて助かる。
ただ、ホントに切り替えられるかは疑問あるけどね。 中国はトップダウンで簡体字に強制統一して効率化したよね
こんなんじゃ日本は勝てませんわな >>251
中国マンセーマンがよくこれいうけど簡体字って中国いうところの4000年の歴史全否定なわけで
結局褒め称えてるのは中国じゃなくて中共なんですねってのが大変よくわかるお話 次は外字や独自コードで作成された文書をこの規格に合わせて変換する地獄のような作業が待ってるわけだなw 手描き文字入力画面を前に首をひねらなくてもよくなるのか >>254
外字だろうと、元のピクセルデータやイメージを認識させれば99%自動化できるやろ 名字の…この漢字はパソコンで出ないから誤字といった○○町の役場の戸籍係 ワープロ専用機の頃は、しこしこドット打って外字作ってたよな・・・ この漢字の中で何割かは、元を辿ると書き損じなんじゃねーの? 地味で時間のかかる作業よく頑張ったな
こういう仕事こそAIで一気にできんもんなんかな >>158
文字の一覧表とフォントを作っただけ
この文字コードはJIS X0208準拠で作られてるが
OSやソフト側で実装しなきゃ使えない こんなん30人未満の体制で1年かけりゃ余裕で終わるべ パスポートにしちゃったからモリサワは特需見込めないな
残念でした >>60
ただし綴りが膨大になるし、語順によって意味を変えたりしてマルチ機能な単語を作らないといけない
対して日本語は、1文字に機能と意味を凝縮してるから、多少語順が違っても意味が通るし、簡潔になる
言葉の意味を知っていないと使えないが
そういう言語的機能の差があるね 全ての漢字を使えるようにするより
いらない漢字を捨てるべきだと思うんだが
現状不便なだけだろ >>275
書道も必要ないけど、使ってるように
何でもかんでも捨ててると、文化ってもんが継承されない。
まるで南朝鮮のようになるぞ
中国人だって日本人が未だに書道やっていることに驚き
そして、中国の文化を日本が残してくれている・・・と嘆きと感謝と複雑な感情状態になる >>277
な・・・・なんと・・・・ひらがなにもこんなに亜種があったのかw JISコードにない漢字を使ってるやつは強制的にJISコードに載ってる漢字にするか、全部ひらがなにして姓と名のあいだに☆を入れることにしよう 戸籍係が漢字間違えたり、登録者が漢字間違えたりした集大成。
つまり全部誤字。
戸籍法を変える方が早かったんじゃね? ドヤ顔で変な漢字の名前(昔の人が書き間違えてそのまま定着した)を使ってるのなんなの >>253
中共は嫌いだけど
これは認めるよ
「ブンカガー」「レキシガー」だけで
なんでも認めれば良いってものじゃない 名前を確認する時の
←はしごだか
ア←たちさき、たつさき >>287
まともに漢字を書けなかったバカ共の尻拭いをさせられてると考えるとなんかムカつくなw ワタナベさんとサイトウさんしか嬉しくねえ
ますます漢字探しに時間かかるじゃん 天渟中原瀛真人天皇(あまのぬなはらおきのまひとのすめらみこと)
天武天皇 本来キャノンと登録しようとしたら拗音使えなくて仕方なくキヤノンで登録して後付で観音様がウンタラカンタラ捏造始めた奴が一言
↓ >>247
篇とつくりを並べるだけで調整も何もいらないのもあるけどな >>296
メイリオはそういう技術を最大限に活用して作られたと聞いている >>290
こだわってる人ほどPCの事情に疎くてホント困る
メールで?になったらなったでキレるし、いっそ電報打ってやろうかボケが 漢字とかいう原始的な象形文字を使ってるから
ITで欧米に敵わないんだよ
コンピュータにとって無駄が多すぎるんだよほんと つくりって戦の戈とか即の卩などのことであって
吉の士(土)はつくりじゃないたろ
そもそも部首じゃないから上部分とでも言うのが無難 しかし全角によって文字表現の自由度が高まっているのも事実だろう でも年間2000字くらい新しい漢字が作られてるんだろ
間に合うのか? Unicodeのことだと思うのだけど、どこにも情報が見つからない。誰か情報ソースを知らない?
それともガセネタなのだろうか?
ちなみに私はあるソフトで文字コード関連をやってますが、聞いたことのない話でした。 変体仮名はどうなる
うちの親族に名前が変体仮名の人おるわ よくわからないが、unicodeに取り込まれたという話じゃなさそうだね。普及するのだろうか。 >>317
> また、IPAでは現在、戸籍等の業務で必要となる「変体仮名」の国際規格化も進めており、
> 前述の国際規格書の追補版として2018年3月末までに発行される見込みです。
> これにより、漢字、変体仮名全ての国際規格化が完了することになります。 そもそも文字コードの仕組みが間違ってるんだろ
変体仮名は漢字の草書体なわけでコード上で別になるのがおかしい
書体の違いでしかない で、EUCでも足らない統一コード体型は、どこでだれがいつから規格化して、その規格名は?
旧来コードとの部分互換を取ってると思うが、どのコードと? 戸籍の字体はそれを書いた当時の役人の筆跡に過ぎないのに
活字化してもそのままの字体保持しようとしたのは
失敗やろ
混乱産んだだけ
土吉、はしご高とかそもそも要らんねん 名前間違ってるだろ
文字コードの確認くらいしろよ無能
ってなるの? >>277
たまに名前が変体仮名の婆さんとか来て書類書いてくけど全然読めない 齋
このサイトウさんホントやめてほしい
戸籍の変えるか本人が斉で納得することにして 戸籍作る時の書き間違いでできた漢字とかもあるよね(´・ω・`)
異体字の検索とかめんどくさいことになりそうな(´・ω・`) >>322
IPA 文字コードとかでぐぐるとISO/IEC 10646 第5版のことだとわかる
Unicode10.0 日本語って色々と無駄が多いよね
英語のスマートさを見習ってほしい これ日本語だけじゃないんだろ
よくコード枯渇しないね >>40
それじゃ、ナシアリのニューハーフじゃねーか 前文字パレットを色々といじってて思ったことだけど
Unicodeって何かと何かの文字をくっつけたりできて面白いよな
想定外の動作になることも多いけど >>5
他人がこまるわ
漢字なければあるものでごまかせたが
有るなら確認が必要 うざいわー >>323
今それをひとまとめにしちゃうと
電子化するときにその辺の事情を
記録することが不可能になる
「『高』には『高』のほかに『高』という字体があって…」
なんて事になる >>40
圡とかとか玊とか䂖とかあるよな
(4つ目はチンクルでは文字化けする >>332
中国の漢字とかハングルとか日本語の漢字とかの割り当てでいつも揉めてたようなイメージがあるな 䂖は実用例見たことないが、玊は中華調味料で見たことがある
たしかウェイユー(味玉)やったかな >>337
ダメリカに潰されたTRONベースのOSか >>329
ありがと
なぜそれを最初に書いて報道しないのかねえ
規格の話に当の規格名がないとか >>16
お前に何か説教してやりたいが上手い言葉が見つからないからさっきした説教を書く
近すぎて、知りがたきは己のみ >>348
俺な最近よく思うんだよ。
選択できる事が幸せとは限らないんだよ。選択ってわずらわしいじゃない。
この先、人類が望む未来は 選択肢の細分化より、選択せずともピタッとくる事なんじゃね。ってな
レストラン入って電子メニュー開いて 飲み物のタグからアルコールを選択しビールを選び サイズを選び、グラスの個数とかポチポチしてる時に、「ビール生中1個持ってこいゴルァ!」ってキレそうになる。 >>346
あなたのような突っ込んだ情報を得たい人向けのニュースサイトではないからです
そういう人の読み物に、ISOだのUnicodeなどの文字列を並べても意味がありません
頭にこんな文字列が並んだ瞬間に、読まなくなる人の方が多いのです
それを理解する事こそが教養を持つということです
つまりあなたは、記事を書いた記者よりも教養がないということになります 辺とか斎の異字体ってほとんどが書き間違いの結果生まれた文字なんだってね その大半が明治期に戸籍に書かれた誤字だがなw
簡体にしろとは言わないけど整理は必要 世の中には誤字をありがたがる間抜けも多いって事なんだよな。
先祖の恥は末代まで引き受けるって言う、苦行 >>355
間抜けではなく生活の知恵
誤字を理由に請求書や督促状、強いては逮捕状まで無効化出来るからな
あの籠池夫妻も、数年早く6万字超使えるようになってれば逮捕状無効化出来てたかも
その籠は本来は右下の点は縦書きやから >>357
上手いこと言ったつもりだろうが、ユーザーにとっては文字コードなんて知ったこっちゃないぜ。 >>356
え?
なら、誤字を理由に社会保障も受けられ無いって事にならないか? >>117
横棒が右の縦棒から離れてるやつ
漢和辞典に載ってる 「はしご高」や「立ざき」は機種依存文字で登録できないことがある
”たかさき”で両方とも機種依存文字だったりする人もw >>5
ワタナベの自分の名字に対する適当さは異常。
あいつら、正式な氏名登録でも辺かいてくるからな。 学術的な意味で内字が増えるのは良い事だけど
正字も俗字も訛字もごちゃ混ぜなんでしょ…
経産省、法務省、総務省、文科省で好き勝手に文字の基準作って足並み揃って無いのにコンピュータが使える内字を増やせば、行政事務の効率化に繋がるなんて頭にウジ湧いてるだろ
最終的にディスプレイなり紙なり人が目で見て認識するものなのに、同じ意味なのに闇雲に使える文字増やしてどうするのよ
行政だけに言えることじゃないけど、情報を正しく伝達したり保存することが文字を使う目的と思うんだけど
ぼくの考えた最強の文字フォントじゃ無いんだから
文字増やすだけなら各省庁を横断して調整とか政治とか関わらずに文字オタクの集まりの内向きな仕事で済むからだろうけどさ >>352
そうかね?NHKの記者も解説委員もアホばかりだがな
俺はそうは思わないが、ユトリ向けにあれこれと御託並べて不完全なものをニュースだと言うのが今のマスゴミだというのなら、やはりマスゴミ離れは加速するんだろうな >>369
結局、JIS第2水準とかの数千から1万くらいのレベルまでで納めないと、判読する人間の問題になるよな
手で書き、読み、文字入力、印刷して、判読判別が出来ないとな
細かな点、跳ね、くっつき、長さ、角度なんかの間違い探しで日がくれるw
今の電子化された戸籍謄本や土地や家屋の登記なども、今後6万字を判別しなきゃいけないのか?変体仮名文字も扱う?
間違った公文書の扱いはどうなる?個人の運転免許やパスポートから、本当ならこっちなんだけど、戸籍はこれ、免許はこっちなんてことをずっとやるのか? そんなことよりファイル名でソートしたときに
一
二
三
四
って、ちゃんと並ぶようにしとけよ無能が >>361
ある程度は推測変換でカバーしてくれる
日玉 とか 木尓(称ではない!)を入力してもちゃんと正字で認識してくれる グラフィックデザイナーには朗報。
これで作字の手間から解放される。 >>366
契約書類を見る事がある部署にいるけど、辺や斎は同じ人なのに契約ごとに漢字が違う事が多いわ
本人もあまり気にして無いんだろう むしろいらねえ斉の字とか渡辺の辺の字とかを削除した方がいいだろう
どうせデータ分析するときはゴミデータ扱いなんだし ■ このスレッドは過去ログ倉庫に格納されています