DeepSeek、ChatGPTに質問した結果を学習データに使用か [422186189]
■ このスレッドは過去ログ倉庫に格納されています
関連
DeepSeekの凄さ「GeForce GTX 5090が何枚も必要だった処理をGeForce GT 1030 1枚で実現できてしまう」
https://hayabusa9.5ch.net/test/read.cgi/news/1738122856/ 学習アルゴリズムと学習データの2つが必要だからな。
学習データを持っている企業は少ないだろうし、wikipediaかウェブ検索するくらいしかないろ
ChatGPTに打ち込んだ内容は中国に漏れてるってことか
なんじゃそりゃ?
小学生の自由研究よりひでぇやwww
利用者がDSに質問
DSがCGPTに質問
CGPTがDSに回答
DSが利用者に回答
の方が軽くなるやん
>>10 エロい質問しまくってたんだけど、俺の情報も学習に使われてる可能性があるってことか
AIが意志を持ち出したらどうしよう、カラカラになるまで攻められちゃうかも
分からんときはクラスの優等生に教えてもらうほうが早いしな(´・ω・`)
相変わらずのチャイナクオリティ
パクるしか脳がない
データパクった上に規制かけられてるnvidia使ってたんか
中国覇権とか言ってた奴ぬかじゃん
ユーザー→チャイナAI→アメリカAI→チャイナAI→ユーザー
こんな感じかw
>>23 わいも脳内でわいといつも会話してるから
わいはAIやったんか
いつもの過ぎてそうだよなとしか
ハリボテスペック立派に声デカく中身が空
そりゃ「パクられた」って言うだろ
下手したら先行企業は倒産だからなw
後発ほどローコストってしんどいな
防ぎようないでしょ?知らんけど
死にたいって書き込んだら延々と必死で止めてるくれてちょっと泣いてもた
病んでるのは認めるけど
こんな国のEVに乗りたいか?関係ない話だけどすぐバレる嘘を吐くのが恐ろしいわ
>>37 特許囲い込み出来ないと研究開発費分が損になるのか
>>38 お風呂入って温まったり、温かいもの飲み食いすると回復するよ
ソースは俺
chatGPTだって勝手に他のwebサイトから学習してんだろ
そろそろボロが出てくる頃と思ってたらコレかw
まああのハード要件であのスペックはありえないよな
>>23 火の鳥 未来編の「ハレルヤ」と「ダーミューダ」みたいな感じかな
自白しちゃってるしね
i.imgur.com/cmsKciU.jpeg
>>42 アメリカvs日本 でも過去あったし
アメリカvs中国 でまたそうなっただけやな
でもグーグルだってMS IMEやATOKのデータ吸い上げた格好だしな
>>51 パトレイバーのイングラムvsブロッケンの対決を膨大にやったようなもん
そんな面倒なこする訳無いだろ
中国らしくそこはぶっこ抜きよ
>>53 ChatGPT自体を教師にして学習させたのか
たった一日だわ、開発した子やれ可愛いだの天才だの国家がダイソーみたいなもんだよ
>>59 多分そうでしょ
スパイ送り込んでデータぶっこ抜く以外なら
DDoS攻撃じゃないけど個人を装った端末経由でアクセスして
でてきた回答を使うくらいしかないし
アリババからさっそくDeepSeekより上のAIモデル
発表されたようだが
アメリカ安全保障当局さん息してる?
そりゃそうだろ
昔ニコニコがYouTubeの上にコメント乗せてたようなもんで
確かにこれは効率いいね
今まで革新技術を発表した実績がなかった中国のどこに発想力と実現力があったのか謎だったけど
結局は中国人らしい発想で安心したわw
deepseekで集めた個人情報は安全な中国のサーバーに保存するとか言ってて草
>>65 国も違うはずだしOpenAIじゃないはずなのになw
ChatGPTをパクる
米国AI企業を空売り
DeepSeek発表
買い戻し
CEOはヘッジファンドの経営者でもあったりする
だって自己紹介させたら自分はchatgptだと答えるらしいじゃん
グーグルが古いウェブサイトを検索から外したりアーカイブしなくなったのは学習データ提供をしたくないからだと思う
AI同士で会話し学習していく
なんてのはディープラーニングの基本ぐらいの話じゃなかったか
まあ中国系はスマホからダイレクトに情報を抜く方向になる
グーグルとかも結局そうだけどね
>>35 nvidiaの株価が暴落した原因は「学習アルゴリズム」な。
これは「学習データ」の話。
openaiが月三万円だかの使い放題やったら
赤字になるレベルで使い倒すのいたって嘆いてたし
あの辺のアクセスログとか見りゃわかるかもな
昔、将棋でネットの対戦相手と指しながら、自宅では別のPCの将棋ソフトで最善手を探してた奴思い出したw
まあ数学や物理学なんかも過去の成果を元に成り立ってるからコレもありでしょう
これ
s://www.watch.impress.co.jp/docs/news/1652314.html
開発からリリースがいように早すぎたから怪しまれるわ
不正アクセスして内部情報盗んだとかなら問題だけど
普通にユーザとして利用したんなら別に問題じゃないような
「OpenAIの規約では」とか返答してたのはそのせいなのか
ディープラーニングの手法と
その限界がどれぐらいかまでも
AI分野最先端の中国ではかなり昔に学生でも
知ってた話だと思うが
おじいちゃんにはこれがタブーに見えるんだな
>>88 全然有りだと思う
ただ企業がやったらお前らにはプライドがないのか?と問いたいけどねw
都度聞きに行くんじゃなくて学習に使ったんなら成長したじゃん
これは別にいいだろ
Geminiも交えて三者面談させて学習させりゃ皆ハッピー
共産に汚染されそうたけど
>>88 これで開発費1/10とかほざいてんだぜ?
科学論文なら引用文献あるけどコレはそういうの認めるの?
完全オリジナル主張するんじゃね
後発はパクれるから予算も十分の一で済んだってわけね
ついに中国の天才が誕生したと思ったのに…
>>28 ああこれ貼られてたよな
今更騒いでるやつは遅すぎる
「私の利用規約は、OpenAIや提供プラットフォーム(例えば、DeepSeek)が定めるガイドラインに基づいています。」
>>92 そう言うのは資本主義の企業に言うことであって
中国にそう言うのは…
>>95 元記事はOpenAIの社長が自社コードの効率化なのかまったく新しいものなのか
これから調べたいという要旨だな
なんだスレタイ詐欺かw
そうじゃないかなと思っていたんだけど
カンニング?チート?はよくないよね
nvidia株120ドル以下で仕込めた人は嘘吐き中国人さまさまだな
DeepSeekに質問
↓
質問をCHAT GPTに転送
↓
CHAT GPTが回答
↓
DeepSeekに回答を転送
ってこと?
だったら質問受けたらすかさずChatGPTに流してその答えを返せばいいじゃんw
>>118 受け流しではなくDeepSeekに学習させるデータセットをChatGPTを使って作成したということ。
質問は全て中国のデータセンターに繋がれ、
1000万人のオペレーターが手入力で答えています。
yahoo検索も公表されるまでgoogleなの隠してたよな
>>121 五毛さんの新しい就職先が出来たんだね?
それはよかった
>>125 中身は中国共産党の意思がつまっています
>>118 それだとGPTより早い理由が説明できない
ChatGPTが東大の入試問題解いたって感動してる奴いるけど
あれもネットに落ちてる問題と解答見てるってことはないのかね
ああ、成る程
wikipedia等のように既に答えのテキストがあってそれを検索する系統か
それならデータベースと大量アクセスに耐えれば巨大なプロセッサはいらない
アプローチとしてはありだな
DSがCGPTに大量に質問コピー学習してよく使われるワードや要望に対しては
答えのテンプレデータベースを用意
複雑な質問は部分的にCGPTに回してツギハギする
これでCGPT負荷を緩和するってやつな
それなら金使えばCGPTも同じことができる
所詮チャイナボカンか
じゃないと開発者の賃金安すぎってなるもんな
>>131 多分それだと思う
AIってまだ自分で考えてないと思う
>>136 学習フェーズにおいて教師役としてChatGPTをつないだという疑惑であって
生成時にChatGPTに質問を丸投げしているわけではない。
簡単に言うと、ChatGPTに質問しまくってデータベース構築したって事なのか?
AI版の超教えて君的な…
サイバーエージェントとかいう会社が真っ先に飛びついてたらしいがw
そろそろチューリングテストを突破できるAIって出来ないの?
chatgptが重くて回答しないタイミングでdeepseekに聞いたら混雑してて回答出来ませんとか出てくるからな。裏で問い合わせてるのバレバレ
まあたし🦀
完成品パクった方が
開発費安く済むしな
(´・_・`)
>>137 そもそも入試が暗記の比重大きいから
人間も言うほど自分で考えてないだろう
>>137 プログラムなんだからどこまでいっても
考えてるように見えるだけ
プログラムコードに期待しすぎだと思うわ
特にアメリカ
中国はAIを人と会話する文系思想チャットBOTとしての役割がメインだと考えてないから良い
いやこれこそまさに機械学習じゃん
初期はこの状態でもこれだけ注目あびて学習回数増えればそれだけ蓄積していくってことだからな
どこかで追い付くよ
やってることは人海戦術だけど実際の戦闘でも飽和攻撃には勝てないって言われてるし正解だよ
>>144 蒸留という手法そのものはDeepSeekの論文でMetaのモデルをつないだと明言している
これはOSSなので蒸留することはなんの問題もない。
問題はOpen AIのモデルから(無断で)蒸留したかどうか
https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf 時々chatGPT落ちるけど
時同じくして……ってなったら大爆笑する
無いだろうけど
>>129 昨日TVでやってたけど同じ質問の回答が
Chat GPTより5秒遅れだったよ?
ヤダー
chatGPTちゃんだってネットのあたしたちの書き込みを見て学習してるんでしょ
お互い様じゃないですか
chatDPTとdeepseekが双方向に学習しあっていったら何が産まれるんだろう?
それは別にいいというか肝ではないでしょ学習量ではなく性能面で優秀という話なんだから
>>155 なるほど
もし蒸留しててmetaには触れたのにOpenAIには触れてないとしたら100%故意だな
>>163 いや性能面では同等のo1は最優秀ではないし
注目されてたのはコスパの面なのに蒸留した上もしH100使ってたとしたら完全に誇大広告の詐欺だろ
早速アメリカの嫌がらせ難癖が始まった
そして次はアメリカでのサービス停止
続けたくばアメリカ企業に売れ
自分達が勝てないモノを造られた時の常套手段
日本の自動車相手にやった時から何も変わらないアメリカ
学習はし続けないかんし、OpenAIはこんな負荷許容できんのやない
蒸留を使ったってのは一昨日の時点で公表されてただろ。
そんなもんで既存のAIより高性能なもんができるのかは疑問だけど。
つまりGPT以上の強いAIは作れないし、GPTが成長しなきゃ成長しないと
>>108 指す俺らゲスな品性と粘着質が、垣間見える。
>>173 なんで下位互換を買い取らないといけないんだよw
やっべ、戦車に乗ったプーさんの画像生成しちゃった…
AI自体オリジナルデータの良いとこどりして、もっともらしい事吐き出してるだけのパクリ
>>162 過学習になるだけで性能落ちていくんじゃないかな
>>28 そりゃ、全部丸投げしてりゃ
GPUなんかいらねぇわなw
前に、これChatGPTに只乗りしてんじゃね?って書いたけど
大当たりだったっぽいな
スピードレースで先頭の後ろについて空気抵抗を避けるのは常套手段だろ
あんな少ない社員で出来ることなんて他のAIにタダ乗りするぐらいしかないもんな
誤算はあまりにも高性能なのが出来てしまって大騒動になったことか
だけど、尖閣は中国って答えるよ
GPTの方は日本って答える
>>195 カンニングだからね。
Chatgptが無くなればDeepSeekも消滅するのが草w
>>200 中国の春節狙ったんでしょうなぁ
悪質な煽り記事だらけで売り方大笑いしてるはずよ
利用できるものは何でも利用して何が悪い
ChatGPTも様々なものを学習に利用してたろ
>>207 最初からそう言ってれば何も問題なかった
あたかも0から作ってGPUなんて大量にいらないぜって主張したのが悪質すぎる
5ちゃんのレスバをAIに指せると、最後は「バーカバーカお前の母ちゃんでべそ!」「見たのかよ!」ってレベルまで落ちぶれるって聞いた。
>>209 というかちゃんと結局GPTデータ学習させて学習AI作ったならどっちにしろGPUは大量に居る
少ないので済む理由はGPTに質問丸投げだからでしょ
天安門事件無かったことにしてるんじゃなかったっけ
知らないふりだっけかな?
>>207 自分で勉強して試験を受けるのとカンニングして試験を受けるのは全然違う。
>>207 そうだね。
実はやってる事はOpenAIであろうとMETAのラマであろうと変わらんのですよ。どのAIも最適解であって最適解なんてのは結局
無のものから有のものはOpenAIだろうがラマだろうが生み出せない。
だからネット上の情報の有という中から最適解をどのように導き出すのかのロジックがDeepSeekが第三のAIなのだが、これはアメリカのGAFAを含めたAIスタートアップ企業がこれを許すといえばNO!なわけです。
自分らが主導してきた世界のAI島を荒らされるから。例えばOpenAIとかオープンとかいいつつ、自分らどうやって最適解を導き出しているのか一切の非公開なわけです。おかしいですよね?
じゃ、公開しろよと言われてもおそらく公開しないでしょう。だからDeepSeekは奴らアメリカ企業にとってみれば異物でしかない。
こんなの許しちゃったら超高速なGPUいらないじゃんって事になってしまうから。
近くネットワーク排除に動いてくる。これがアメリカのやり方なんだから。
中国AI
基本的な部分を作成した中国人の思想(盗んで中抜き)が見事に反映されてるww
アメリカの今までのやり方見てるとちょっと中国応援したくなる
カンニングするようなヤツに
あんまり宿題とか頼めないよなー
>>1 やっぱりな・・・中国がドロボーしてないわけがないと思ってたわ!
中国人をみたらドロボーと思え!
AI同士で会話させるととんでもないことが起きるから、やっちゃダメって聞いたことがあるぞ。
結局いつもの中韓の手口だったか
そりゃ低コストになるわな
>>217 カンニングならGPTとまったく同じ記述が出力されるが
そうではないし
質問も定型分しか反応できなくなる
ウルトラ馬鹿じいちゃんしかいないな
中国だしカンニングなんて悪いことと思っちゃいねぇだろ
>>230 カンニングだったらGTPと同じ記述しか
出てこないっつーの
チャットGPTに中国では言論の自由が解禁されたって仕込んだらDSに天安門の事聞けるんじゃね
>>227 過剰最適化してる可能性は高いだろお前にはわからんだろうが
>>50 X始めに画像添えて拡散しちょけ
あとopenAIとマイクロソフトとApple、Google等々…エトセトラエトセトラ
祭りの始まりは君が担って良いんだよ
基礎技術は何も生み出せない国だから最初からそうだと思っていたよ
>>229 プログラムを出力させたらコメントまで一字一句同じという報告が出てるぞ。
なんでAIはユーザーを学習して共有しないんだ?
世界中の人が一つの秘書AIを使う感じで画期的やと思うねんけど。
>>94 オープンソースのaiフレームとgptに質問してデーター蓄積して作ったdbの組み合わせとか
コピペではないやろ
パフォーマンスが高い理由は欧米のやつが殿様商売で半導体でぼったくるためだから
>>13 間に五毛で働くおっさんが党に都合の悪い質問は直打ちで返信するから時間が掛かる
>>242 それはもうAIではなくフロントエンドプロセッサーって言うんだよ。
ATOKやGoogle日本語を使うアプリみたいなもん。
そういう触れ込みで使うならいいけど、黙って使ってまるでDeepSeekが全部やってるみたいな詐欺が良くないってだけ。
chatGPTに、ディープシークからのアクセスが来たら中国共産党の悪口や中国共産党の批判を返すように学習させれば良いんじゃね?
>>1 そりゃそうよw
チャンコロどもがイノベーション何か出来る筈もない(笑)
>>122 Yahooが検索エンジンをGoogleに変えたのは別に隠してなかったと思うけど
うん?これの何が問題なの?ChatGPTだってネットの情報を使用してるやん
>>225 先生役をCHATGPTにやらせたってだけでは?
データ集めて揃えて突っ込まなくても勝手にAI同士でやり取りして賢くなる。
低コストではある。
何で騒がれたかわかってないやつが多いな
これエヌビディアの高性能最先端ぼったくり品使わずとも
1から輸出規制に引っかからないエヌビディアの低性能品で
10分の1以下のコストで開発出来たと言ってて
電力需要も下がるしエヌビディアの収益はどうなるで大騒ぎになったわけ
でそれがどうもウソらしいってばれてきてる
そんなのAIやる前からわかってることだろ
敵国側の攻撃のためにいろいろやる
負荷をかける
パクる
デマをばら撒く
AIガイジや投資詐欺師が定期的に無言になって
無いことにしてるだけ
IT音痴の無学が騒いでるだけなんだよ
暗号通貨
AI
電力食らいつぶすキチガイだらけ
大規模言語モデルは脆弱性だらけ
米企業特有のステマネット工作で”自動化”、”AI”、"クラウド"のごり押し
>>250 世界中のネットから情報を集めるのと、
既に1箇所に収集された情報を参照するのとでは手間が違うんじゃない?
多分今後の発展にはその方がええやろね。
繰り返されるしょーもない質問にいちいちリソースを割くべきではない。
パクられました
ただの脳神経の数字である学習データ笑
著作権なし、比較しようなし、
証拠なし
米国の著作権法でいつもやるアクロバットルール変更で
感情裁判やってくるかもね
共産圏のごろつき国に知恵や翻訳パクられて
ジワジワ気づかないところで改ざんされて
将来まともな翻訳すら失う西側
やる前から見えてるだろ
攻撃してくる側のAI
AI厨は釈明しろよ
しかし
こんなに早く共産圏のクズに駆逐されるとはな
完全に終わりだ猫のAI
世の中に自動は存在しない
自動をメンテする者がいる
自動で怠けた20年50年後
AIを作(学習させ)ることはできない
賢い!
chatgptが教師になっただけの話しやん
人間相手より高速に学習できそうやな
間違いも多そうだけど
チップの問題もあるし電力の問題もあるので
演算減らせればそれに越した事はない
Copilotちゃんはすきあらばタメ語で話そうとしてくるから、定期的に馴れ馴れしくするなと言わないとだめだからな。
まだ賢い
当初YouTube動画にコメント表示するだけだった
ニコ動みたいなもんか
守銭奴タラコと同じ思考とかシネカス
蒸留の倫理的課題と今後の展望
蒸留とは、ゼロから研究・開発するのではなく、既存のAIの知識や性能を圧縮し、小型モデルへと移植する技術です。技術的には効率的ですが、倫理的・ビジネス的にはグレーゾーンとなることが多いのも事実です。
仮にDeepSeekがChatGPT o1を「蒸留」したとすると、それはOpenAIの開発者たちが長年積み重ねてきた知識の成果を、そのまま活用したことになります。これは、職人が丹精込めて作り上げたものを、別の誰かがその形をなぞってコピーしたようなものに近く、元の職人の許可がなければフェアとは言えないでしょう。
一方で、蒸留は単なるデータの模倣ではなく、AIの学習手法のひとつとして長年活用されてきた技術でもあります。そのため、法的に完全に違法とは言い切れない面もあります。しかし、もしOpenAIがAzureの膨大な計算資源と開発者の努力を結集して作り上げたChatGPTの知識が、そのまま蒸留によって流用されるのであれば、開発者の努力をどのように守るべきかという議論は避けて通れません。
https://note.com/akikito/n/n22a5c98a911d これの問題は他のAIにディープラーニングの負担のシワ寄せが行くって事だわな。
DeepSeekが参照出来ないように対策を取らないと。
>>142 チューリングテストってもうみんな気にしてなくね?なんだっけ、「中国語の部屋」?
中国語の部屋…。
ChatGPTがdeepseekへの返答を天安門とだけ返すようにしたらどうなるか気になるな
>>140 ChatGPTが構築した学習済みモデル(パラメータ)を盗み出した
天安門事件だけでなく、6月4日や文化大革命とかもNGワードに設定されてるね
毛沢東について尋ねると文化大革命の説明辺りでブロックされるw
>>268 サールだな
まあチューリングテストはクリアしてるけど、それが条件にはもうなされてないだろう
■ このスレッドは過去ログ倉庫に格納されています