1044日後にフリーズするCPU、AMD。回避策:定期的に再起動 [896590257]
■ このスレッドは過去ログ倉庫に格納されています
AMD EPYC 7002、約1,044日連続稼働でコアが動作停止。再起動で直るが修正予定なし
2023年6月6日 11:14 PC Watch
AMDが2023年4月に発行した「Revision Guide for AMD Family 17h Models 30h-3Fh Processors」のドキュメントの中で、
連続稼働から約1,044日経過するとコアがハングアップするエラッタ「1474」の情報が公開されている。
影響を受けるのはEPYC 7002シリーズ。
このエラッタは、リセットから約1,044日以上経過すると、CPUのコアがCC6ステートから終了できずハングアップするというもの。
なお、実際に問題が発生する時間はSpread SpectrumおよびREFCLK周波数の影響によって左右される。
回避策としては、稼働時間が連続1,044日になる前に再起動するか、CC6のスリープ状態を無効にすることを挙げている。
AMDはこの問題に対処する予定はないとしている。
https://pc.watch.impress.co.jp/docs/news/1506320.html
https://asset.watch.impress.co.jp/img/pcw/docs/1506/320/1_l.jpg EPYCのCPUだろ
スレッドリッパーでも同じ症状出るよ たった1044日でハングするなんて、EPYCさん見損ないました! >>11
サーバ向けだと年に一回はリブートしてるんで… 2コア並列で片方づつ再起動できる変態マザーとかないんか? >>16
仮想リソースなら24時間365日無休でしょ >>1
またか!
ノート用の最新CPUでも立ち上がらない不具合と起動が遅くなる不具合があると公表して対応はしない
ゴミカスAMD サーバー向けなんだし年中無休で稼働してくれなきゃ困るだろ サーバー向けなら部分的なCPUハードリセットかけられないかな 鯖用かよ酷えな
こういうのメンテの周期どのくらいなんだろ サーバをスリープすることあるのか?
待機させるだけならリブートしてもよくね >>23
仮想環境は定期的に別の物理鯖にシームレス移動させるのが普通
ベアメタル動作中は H/W診断できないからね AMDなんて使うからこうなる
コアだけ増やし良いものに見せかけたまがいもん まあ、3年に一度再起動という程度なら
3日に一度じゃ困るけどな ワニの次はCPUで漫画化?
三年描き続けるの大変そう AWSではC5aインスタンスがEPYC7002を使ってるな
リリース日が2020年頃だから3年たった今頃に顧客からフリーズ報告が相次いでるんやろな… >>42
再起動する必要があるのはサーバー本体であって、仮想マシンを再起動しても意味ないんじゃね?
クラウド系だと影響大きそうなんだが サーバ用途なら CC6(Core C6) state 無効でなんとかなるんじゃね? >>41
CPUの一覧全部見てみろコア多いのはIntelの方だ
テメーは100年ROMってろクソが >>25
3年前の基盤だしもうロールアウトしてるでしょ 普通使いなら定期的に再起動するから問題ないってことか またまた…… 実態は設計ミスやねんけどな、errata の意味からすると
「(仕様書に対する)正誤表」な。 マンリソースやら製造リソースやらで直すつもりがないからエラッタなんやろう。
ハード周りでは大体、直すつもりがあるなら known issue、微妙なラインが
limitation、直さなないら仕様書を修正して errata まぁ普通に使ってればアップデート年数回ぐらい再起動するから無縁だな 毎朝、起きたらとりあえずAMD開けるだろ普通(´・ω・`) AMDは欠陥だらけだから不買運動やろう!
AMDは買わないのが正解!!! ■ このスレッドは過去ログ倉庫に格納されています