AI、津軽弁の解読に成功 標準語訳に前進 青森・弘前大
■ このスレッドは過去ログ倉庫に格納されています
津軽弁をAIで自動文字化 弘前大、標準語訳へ前進
https://www.nikkei.com/article/DGXMZO27091550Z10C18A2CR8000/
津軽弁をAIで文字化する研究成果を報告する弘前大の関係者ら(19日午後、青森県弘前市)=共同
https://www.nikkei.com/content/pic/20180219/96958A9F889DE0E5E2EBE3E7E7E2E3EBE2E0E0E2E3EA9180EAE2E2E2-DSXMZO2709397019022018000001-PB1-1.jpg
弘前大は19日、青森県西部の方言で聞き取りが難解なことで知られる津軽弁を
人工知能(AI)に音声認識させ、文字化して表示することに成功したと発表した。
東北電力と共にAIで津軽弁を標準語に自動翻訳する研究を進めており、
担当者は「AIに標準語の対訳を覚えさせれば、実用化に大きく前進する」と話している。
弘前大は東北電が提供したコールセンターの通話記録250件を、
なまりが特に強い青森県鰺ケ沢町の住民に津軽弁で読んでもらい、音声データを採取した。
AIで文字化すると、「へば」(それでは)「だはんで」(だから)といった
津軽弁の単語が「エヴァ」「だ半で」と誤表示されたり、
「わがる」(分かる)など鼻濁音が認識されなかったりしたが、
正確な単語をAIにデータ入力して誤りを補正、認識精度を76%から94%に上昇させた。
弘前大は津軽弁を標準語訳するAIを早期に実用化して、
病院での医師と患者のやりとりなどで活用したい考えだ。〔共同〕 青森の女騎士の言葉を標準語にしても味気ないだろ
AIの奴余計なことしやがって エヴァって書いても発音はエバだもんな
文脈でフィードバックしないと無理だわ これで生放送でも訳テロップがリアルタイムで流せるのか 盛岡だが、津軽弁は理解できん。
あれは日本の言葉なのか?
津軽弁と薩摩弁は外語大学で教えても良い。 あるウインドウで再生している音声を、別のウインドウで音声認識する方法はある?ヘッドホン端子とマイク端子をケーブルで繋いでもうまく行かなかった。 >病院での医師と患者のやりとりなどで活用したい考えだ。
糞岩手の俺でさえ津軽弁は分からなかったから、他県から来た医師は患者の申告した状態もポカーンとなるだろうな(笑) か?。く。け。
とかもわかるのかな
(めしあがりますか?。いただきます。どうぞめしあがれ。) よく津軽弁はフランス語に通じるって言い張る津軽衆いるけど
これは南部衆の俺でも納得した
https://youtu.be/dDVFRg3R0AI >>20
東京から行ったお医者さんだと、逆にさっさと諦めて、看護師に全通訳させてるらしい >>26
そういや、薩摩弁も難しいのに、テレビで難解方言となるのはホトンド津軽弁だな
多分だけど、名詞だけじゃなくて、同誌も変わってるからかな? こんなの開発しなくても
あと何十年かで方言は殆ど無くなる >>30
それはどうかと思うけどね
方言はその地域の文化であり歴史
そして一度滅びてしまった方言は2度ともどらない
津軽弁も今の60歳以上が死に絶えたら、本場のどネイティブな津軽弁が生き残れるかは危ないと思う >>17
普通ではないぞ
同僚がダスケで大笑いされてたわ
気取って標準語言ってるつもりだろうけどイントネーションがおかしい 津軽弁は古語みたいな言い回しをしているような気がする >>33
イントネーションはおかしくても、まだ南部弁の方が通じやすい気がする
有名どころの「あなたの名前はなんですか」も
南部弁の「んがでーだっきゃ」は細かいことはわからなくても「でーだっきゃ」で発音するとなんとなく「誰だ(っきゃ)」と聞こえる気もするから
わからない単語は「んが」と「きゃ」のふたつ
これが津軽弁になると「なだだば」だから分かりにくい
わからない単語が「な」「だ」「だば」の3つになるからより難解なのかな、と思う >>33
「だすけ」は岩手県北から青森南部地方の言葉だ。
盛岡周辺では使わない。 >>38
日本の一地方の方言には見えないな。まるで別の言語みたい >>17
東京弁風のアクセントで「フライパンうるかしといて」って言ったら死ぬほど馬鹿にされた シン・エヴァの公開は2023年ごろだと聞いた
あと5年もサボる気か
もう誰も尻を叩かないからダラダラ作ってるんやな >>39
ひらがなだと「でー」だが、発音だと「だぇー」みたいに聞こえる
文字の限界 >>45
確かに「ご飯があめる」は通じなかったな。
あと「ゴミをなげる」も。 >>47
多文津軽弁の「な」が南部では「んが」なんだと思う しかし、意訳もやり過ぎるとどうかって話で
「なだだば」を「どちらさまでございましょう」
「かーばげままけー」「お母様、お夕食でございます、お召し上がりくださいませ」
と訳した本、おめやりすぎだw 津軽弁も失われつつある言語だからなあ
現地民でも「もごろ」とか「あだらむしがらねで」とかわからない人もいるんじゃないか ATOKを音声認識にしただけなんじゃ・・・
AI言う必要性あるのだろうか ただ>>1を読むと西部って深浦とかそっちだろ?
深浦鰺ヶ沢も漁師言葉で荒いが、一般的に最難関なのは金木以北だとおもうんだからな
ぶったくりも難しいけど、ちょっと違うんだが、そこは大丈夫だろうか >>41
痛みを伝える方言にも若干のニュアンスの違いがあるんだよ
「やむ」んでなぐ「へづねぇ」んだ…
とか言われたらネイティブでも困る 弘前大って深層学習やってたんだ
さすが
グーグルニューラル翻訳の恐ろしい進歩を見て
深層学習AIがどれほど凄いかはわかる 女騎士「わのどんずさでっけぇはどつっこんでけろ!」
AI「なぜなのか」 >>43
冷静に品詞分解すればすごいもんでちゃんと日本語 チラッと見えたけど、超方言のひどいお婆ちゃんを東京?の医師が診るのに
ど田舎出身の年配看護師と市部出身の中堅看護師の二人がついてて
ひどい津軽弁→普通の津軽弁→標準語
とダブル通訳態勢だったのがワロタ 「けねですんだんだど。」
「わいは、いまどきモノけねですぬってあるもんだが。」
「でねふて、ケネディすんだんだど。」
(食い物が)食えなくて死んだんだってさ(誤)
ケネディ(大統領)が死んだんだってさ(正) >>65
適訳かどうかは保証しないけど「あもこ」とか「もっこ」 っつづぅつぁあくんだってつんざにあつくなんざぅさつきあわさでするもびりえだばぁ そんなことより標準語を完璧にしろよ
今日の天気くらいしか聞き取ってくれないぞ >>72
バカじゃねえの?
そういうの、もういいから。 >>6
大昔の日本語が部分的に残ってるくらいのれっきとした日本語 琉球弁は島が違うと通じないことさえあるらしいな
>>26
本格的な薩摩弁は同じ九州人でも他県(他藩)の人間には全然わからないらしい。外様中の外様。 >>37
古典の言葉が濁音混じりになって残ってるね 解読できても聴き取りがうまくできないと訳しようがない気がする >>82
そういうのは九州にもあって、具体例としては、たとえば半ば死語になってる「くど」(かまど)、あとごきぶりを意味する「ごっかぶり」は古語の「御器かぶり」に近い
どうも上方から離れると何かしらまだらに色濃く残存しているようでもあり 煤(スス)
寿司(スス)
獅子(スス)
AI頑張れ 純粋の鹿児島弁を普段話す性格のいい大好きな先輩がいたんだけど
マジで相槌打つのに苦労したw はど、たでる
2通りの解釈ができる。
A)ち◯こ、勃てる
B)鳩を飼育する >>90
文脈から判別できそうだけどそもそも文脈すらわかりそうにない ♪雪は降る〜 あなたは来ない〜
どんだ?あだも歌わねが?
↑
「あだも(あんたも)」と「アダモ」が掛かった津軽弁ジョーク ■ このスレッドは過去ログ倉庫に格納されています