スパコンのバックアップ機能に不具合 約77TBのデータが消失 いつものギャグ国家 [793583641]

■ このスレッドは過去ログ倉庫に格納されています
0001(東京都) [JP]2021/12/29(水) 05:46:47.89?2BP(2000)

■京都大学(2021年12月28日)

2021年12月14日 17時32分 から 2021年12月16日 12時43分にかけて,スーパーコンピュータシステムのストレージをバックアップするプログラム(日本ヒューレット・パッカード合同会社製)の不具合により,スーパーコンピュータシステムの大容量ストレージ(/LARGE0) の一部データを意図せず削除する事故が発生しました.

皆さまに大変なご迷惑をおかけすることになり,深くお詫び申し上げます.

今後,再びこのような事態の生じることのないよう再発防止に取り組む所存ですので,ご理解をいただきますよう,どうぞよろしくお願いいたします.

★ファイル消失の影響範囲
・対象ファイルシステム:/LARGE0
・ファイル削除期間:2021年12月14日 17時32分 〜 2021年12月16日 12時43分
・消失対象ファイル:2021年12月3日 17時32分以降,更新がなかったファイル
・消失ファイル容量:約 77TB
・消失ファイル数:約 3400万ファイル
・影響グループ数:14グループ (うち,4グループはバックアップによる復元不可)

障害情報:【スパコン】ストレージのデータ消失について
http://www.iimc.kyoto-u.ac.jp/ja/whatsnew/trouble/detail/211216056978.html

★ファイル消失の原因
スーパーコンピュータシステムの納入会社である日本ヒューレット・パッカード合同会社によるバックアッププログラムの機能改修において,不用意なプログラムの修正とその適用手順に問題があったことで,本来は不要になった過去のバックアップログファイルを削除する処理が,/LARGE0 ディレクトリ配下のファイル群を削除してしまう処理として誤動作しました.

日本ヒューレット・パッカード合同会社から提出された報告書を掲載します.
Lustreファイルシステムのファイル消失について (日本ヒューレット・パッカード合同会社)

★今後の取り組み
現在バックアップ処理を停止しておりますが,プログラムの問題を改善し,確実に再発しない対策をした上で1月末までにはバックアップを再開する予定です.

ファイル消失後にバックアップが実行されてしまった領域のファイルの復元ができない状況となったことから,将来的にはこれまでのミラーリングによるバックアップだけでなく,1世代分の増分バックアップを残す等の機能強化を検討いたします.機能面だけでなく,再発防止に向けた運用管理についても改善に取り組みます.

一方で,機器故障や災害等によるファイル消失の可能性も含めて完全な対策は困難であるため,利用者の皆様におかれましても,重要ファイルについては別システムへのバックアップをお願い致します.

※全文は元記事でお願いします
https://www.iimc.kyoto-u.ac.jp/ja/whatsnew/information/detail/211228056999.html

0223金星(沖縄県) [JP]2021/12/29(水) 15:57:04.97ID:KZgzhMd50
どうせ飛沫の飛び方やろ。
かまへんかまへん。

0224ミランダ(神奈川県) [ヌコ]2021/12/29(水) 16:13:22.82ID:xzxNgIxd0
キャロライン洋子は怪人21面相の手先

0225褐色矮星(茨城県) [ZA]2021/12/29(水) 16:25:20.83ID:3rMd+v3g0
計算に使うデータとか計算結果の類だと思うけど
研究の計画的には来年度も影響しそう

0226バーナードループ(宮城県) [CN]2021/12/29(水) 17:05:05.72ID:ROs2cM2f0
マヌケにコードいじらせるな

0227アンタレス(光) [JP]2021/12/29(水) 17:13:31.34ID:dwTVomej0
ファイルコイン使えよ
分散型ストレージにすりゃ安全性もコスパもいいだろ。

0228ソンブレロ銀河(日本のどこかに) [KR]2021/12/29(水) 17:28:43.26ID:Lw7eLNaP0
>>1
俺が数年に一度、フォルダじゃなくファイルでやらかすレベルのミスだと認識したw
なにやってんの、こいつらw

0229ダイモス(茸) [US]2021/12/29(水) 17:50:02.28ID:j5vQL/1i0
HPEが100%弊社の責任でってコメント出してるなー
損賠どうなるんだろ?

0230カロン(ジパング) [ニダ]2021/12/29(水) 18:21:19.24ID:yefYRBFN0
だが待って欲しい。京都大学側に消したい動機が有るとしたら

0231オールトの雲(東京都) [ZA]2021/12/29(水) 18:23:38.99ID:uwVm22l30
>>消失ファイル容量:約 77TB

大したことないな
どうせまた事故は起きるしな

0232グリーゼ581c(千葉県) [US]2021/12/29(水) 18:24:06.50ID:HXCVHHx70
だから手書きのメモをしとけと言ったのに

0233オベロン(SB-Android) [JP]2021/12/29(水) 18:25:37.19ID:UAhjCHKE0
復旧できないとかありえるのか?

0234かみのけ座銀河団(ジパング) [FI]2021/12/29(水) 18:40:39.67ID:s5S9Wh6n0
古いログファイルを削除するスクリプトが
バックアップ実行中に差し替えられたため
不定のコマンドを実行した

rm /tmp/*を
rm /
ってするようなもの

0235褐色矮星(埼玉県) [ニダ]2021/12/29(水) 18:42:44.59ID:pupyeoTW0
2012年に起きたファーストサーバの障害は、同じサーバ内に本番系・待機系・バックアップを稼働させて全部でデータ消失ってのやらかしてる
https://www.nikkei.com/article/DGXNASFK2600L_W2A620C1000000/

0236高輝度青色変光星(ジパング) [JP]2021/12/29(水) 18:53:33.32ID:f859st3o0
どうせエロ画像とかアニメだったんだろ?気にするな

0237熱的死(宮崎県) [US]2021/12/29(水) 18:55:45.67ID:/uvhOxJ90
日本さあ…もう出来るフリすんの疲れたんだろ?いいよ休んで

0238天王星(東京都) [ニダ]2021/12/29(水) 19:05:09.40ID:fVmZCSgR0
>>233
最近は巨大データの世代バックアップなんかはしないのが流行りだから消したデータで同期しちゃったら終了

0239アルゴル(大阪府) [US]2021/12/29(水) 19:06:44.90ID:WZQICMi40
テラワロス

0240青色超巨星(ジパング) [ニダ]2021/12/29(水) 19:16:07.72ID:5/9wtgGv0
テロだろ、これって

0241青色超巨星(ジパング) [ニダ]2021/12/29(水) 19:16:28.91ID:5/9wtgGv0
やられたな、テロだな

0242冥王星(宮城県) [DE]2021/12/29(水) 19:16:33.57ID:7hL/38PY0
GNU find のディレクトリ指定が消えて
デフォルト動作でカレントディレクトリから処理しはじめた結果とか
言ってた人いたけど

0243冥王星(宮城県) [DE]2021/12/29(水) 19:19:00.89ID:7hL/38PY0
bashのスクリプトを動作中に更新したら
ある行から更新済みスクリプトに処理が移って
結果、すべてが虚無に返されたとか分析してた人いたけど……

0244木星(広島県) [US]2021/12/29(水) 19:23:48.95ID:0EcPGzoh0
NECの工場内のunixでdel *.*をやった偉人を知っている

0245アケルナル(佐賀県) [FR]2021/12/29(水) 19:24:11.42ID:uIHk7DQc0
他の国でも同じような事故は起きているんじゃないの?

0246ハッブル・ディープ・フィールド(dion軍) [US]2021/12/29(水) 19:42:56.21ID:y2abVOrE0
>>23
貴重マン……じゃなく几帳面な俺はトリプルバックアップで一生安泰。

0247かみのけ座銀河団(ジパング) [FI]2021/12/29(水) 20:08:59.56ID:s5S9Wh6n0
https://image.itmedia.co.jp/l/im/news/articles/2112/29/l_mt1626333_FTVGYBUHN-02.jpg
要するにバックアップと直接関係ない処理で悪魔のコマンドを実行して
ファイルを削除した

0248ウォルフ・ライエ星(光) [US]2021/12/29(水) 20:15:52.27ID:ki5hx3re0
>>244
この間、間違って引数指定なしでシェルながしたら、
rm -rf /が実行されてマジで青くなった。構築中サーバーだからよかったけど

0249オベロン(北海道) [US]2021/12/29(水) 20:28:39.54ID:VezI4KGP0
日本にやらせるとこうなるよね
いつも情報流出とかしてる国だし

0250ガーネットスター(東京都) [ニダ]2021/12/29(水) 20:32:50.38ID:2QXaBDpl0
スーパーコンピュータの略は
×スパコン
⚪︎スーパーコン
⚪︎スーパー
な。日経では、ちゃんとした記者が書いた記事ではスーパーコンになってる。

0251イオ(茸) [CN]2021/12/29(水) 20:33:13.01ID:HIgmuyk40
機能改修リリース時にやるなよ馬鹿じゃねーの

0252オールトの雲(茸) [IT]2021/12/29(水) 21:00:11.47ID:2zWBL+3X0
>>13
ネトウヨは既に目を捨てたよ
彼らは現実を見ないと誓ったのだろう

0253赤色矮星(光) [BG]2021/12/29(水) 21:04:57.80ID:SI7BTutJ0
アメさんやりおるわ・・・

0254冥王星(宮城県) [DE]2021/12/29(水) 21:05:42.62ID:7hL/38PY0
if [ "x$OLDVAR" != "x" ]; then
find $OLDVAR うんたら
fi


if [ "x$OLDVAR" != "x" ]; then
の行が実行されifに入った瞬間にスクリプトが更新されて
if [ "x$NEWVAR" != "x" ]; then
find $NEWVAL うんたら
fi
になり、
$NEWVALが空なのに
find $NEWVAL うんたら
が実行され、GNU findの既定動作でカレントディレクトリを処理したってこと?

それってすごくね?w

0255赤色矮星(光) [BG]2021/12/29(水) 21:07:01.92ID:SI7BTutJ0
>>215
ソレだな
そんなもん作られたら脱CO2ビジネス終わっちゃうからなw

0256木星(SB-Android) [US]2021/12/29(水) 21:56:29.32ID:rb4CkVfa0
>>9
みずほは数社でシステム開発させたからでしょ
そんなの失敗するって誰でも分かるのに
上層部は分からなかったか、政治優先したかあたりでしょ、問題は

0257木星(SB-Android) [US]2021/12/29(水) 21:58:42.65ID:rb4CkVfa0
>>48
ガンダムが分からん

0258木星(SB-Android) [US]2021/12/29(水) 22:01:41.95ID:rb4CkVfa0
>>250
そら、どこらへんのコンヴェンション
略称なんて分かりゃいいだろ

0259木星(SB-Android) [US]2021/12/29(水) 22:05:27.83ID:rb4CkVfa0
>>255
だとしたら、最低だな
武器商人とか、ヤクザとか詐欺師と変わらん

0260かに星雲(埼玉県) [CN]2021/12/29(水) 22:14:11.54ID:r+PisloG0
>>247
この修正したスクリプトのリリース手順に考慮不足がありました
とあるようにリリース管理上の問題であって変数名云々は傍論だよ
日本人はどういう分野でもマネジメントが抜けてて職人頼みだからすぐコマンドとか機器の話はじめちゃうけどいい加減改めようよ

0261黒体放射(山口県) [US]2021/12/29(水) 23:50:23.17ID:jGmsfaiA0
>>208
次期支援戦闘機はイギリスとの共同開発とか

0262ハービッグ・ハロー天体(光) [JP]2021/12/30(木) 01:49:23.18ID:Rw/bxIiv0
アホ国家だな

0263エイベル2218(栃木県) [JP]2021/12/30(木) 01:50:11.83ID:GwUNBSzW0
アメ公企業の嫌がらせでは?

0264レア(SB-Android) [ニダ]2021/12/30(木) 02:02:31.31ID:dhR8doQk0
【尿路結石予防の四ヶ条】
 
@十分な水分を摂る
食事以外に1日2L以上の水分補給をすることで大幅にリスクを減少できます。
(コーヒー、紅茶等シュウ酸を多く含む飲料及びアルコール類や清涼飲料水は控えめに!)

A動物性脂肪・塩分・糖分の過剰摂取はNO
腸内のシュウ酸濃度や尿中のカルシウム濃度を上げてしまう原因になります。
また、過食そのものによる肥満も結石のリスクを上げるので注意。

B寝る前に食事をしない
食後2-4時間で尿中結石形成促進物質の濃度がピークになるため、可能なら就寝4時間前までに夕食を済ませるのが理想です。
 
C軽い有酸素運動の習慣を
階段の昇降運動やジョギングなど、体が上下に動くような軽めの運動は結石が砕けて自然排石されやすくなります。
適度な運動は結石が小さく症状が出てくる前に排石される効果が期待されるのでおすすめです。

0265かに星雲(長屋) [ニダ]2021/12/30(木) 05:39:30.62ID:EMZ7ZNUt0
東工大に抜かれてしまうわけだ

0266黒体放射(SB-Android) [US]2021/12/30(木) 10:25:57.53ID:mXOdmadY0
>>119
そもそも要求定義がいい加減。運用の知見が少ないから運用実体がわかってないし、そんなヤツらに要求定義なんかできねえ。

0267地球(東京都) [CN]2021/12/30(木) 11:36:22.76ID:BoWxcLNk0
HPE側に残った人らって、9000シリーズとから触ってた人らかね

0268ハービッグ・ハロー天体(東京都) [GB]2021/12/30(木) 11:38:28.85ID:N5Q+jTvb0
やらかしたのは米国企業なんだから国家関係ないんじゃね

0269ハービッグ・ハロー天体(東京都) [GB]2021/12/30(木) 11:46:19.09ID:N5Q+jTvb0
>>254
スクリプトが更新されてもそんなふうにはならないよ
HPEの言い訳見ると親スクリプトと子スクリプトは一緒に変えないといけないのに
親スクリプトだけを先に動作させちゃったら、古い子スクリプトの内容ではマズイことになったらしい

子スクリプトのコマンド名を変えとけばこんなことにはならないのにレベル低いエンジニア使うから
というかスクリプト分けてる時点でセンス悪いが

0270ハービッグ・ハロー天体(茨城県) [ZA]2021/12/30(木) 12:53:49.09ID:4zj6dhhf0
どこにそんな事が

0271プレセペ星団(東京都) [US]2021/12/30(木) 12:54:56.35ID:IqbqQuds0
× 不具合
○ テロ

いい加減備えろよ。

0272プレセペ星団(東京都) [US]2021/12/30(木) 12:58:18.82ID:IqbqQuds0
>>63
またバックアップを拵える手間と時間を考えると頭痛になるぞ。

0273プレセペ星団(東京都) [US]2021/12/30(木) 12:59:32.78ID:IqbqQuds0
>>70
確かに、横河の偉大さを今になって思い知らされるわ。

■ このスレッドは過去ログ倉庫に格納されています