X

【悲報】富士通「メモリーを物理的に破壊する試験を行なっていなかった」

■ このスレッドは過去ログ倉庫に格納されています
1ミーコロン(長野県) [US]
垢版 |
2020/10/05(月) 22:10:35.20ID:rGF5Gktn0●?PLT(13000)

東京証券取引所は5日、1日に起きたシステム障害の原因を公表した。取引システムで基本情報を保存するメモリーが故障した際に、バックアップが有効に機能しない不具合があった。
東証を傘下に持つ日本取引所グループ(JPX)の社外取締役でつくる調査委員会を立ち上げ、原因をさらに追求して再発防止策を取りまとめる。
システムを担当する富士通の時田隆仁社長も同日の記者会見で陳謝した。

問題が生じたのは、高速取引システム「アローヘッド」で銘柄名や基準値段などの基礎的な情報を格納しているディスク。
その中にあるメモリーが故障し、ディスクの1号機が機能不全となった。
予備の2号機に自動で切り替わるはずができず、株価などの情報を送る情報配信システムがストップした。

東証によると、1号機が何らかの理由でダウンした場合に2号機に自動で切り替わることは、システム稼働前のテストで設計・開発した富士通とともに確認していた。
しかし今回、障害の原因を調べたところ、メモリー故障を理由として1号機が機能不全となった場合に、2号機に自動で切り替わらないことが分かったという。

テストは富士通が主体となって実施しており、メモリーそのものを物理的に破壊するような実験はせず、
「疑似的に1号機の機能を喪失させるテストを実施し、2号機に切り替わることは確認していた」(東証の田村康彦・IT開発部トレーディングシステム部長)。
なぜメモリー故障の際に2号機に切り替わらなかったのか、今後検証を進める。

東証障害、システム設定に不備 調査委を設置
https://www.nikkei.com/article/DGXMZO64626220V01C20A0I00000/
2星ベソママ(静岡県) [US]
垢版 |
2020/10/05(月) 22:12:02.36ID:bw8f4Mn10
はい
2020/10/05(月) 22:12:30.82ID:MkDhBxE00
はいじゃないが
2020/10/05(月) 22:12:58.48ID:mZFOwMzZ0
実質テストせずに納入したんじゃねぇか
5にゅーすけ(光) [DE]
垢版 |
2020/10/05(月) 22:13:25.51ID:/cTvq0pY0
100人乗っても大丈夫
6ユメニくん(大阪府) [KW]
垢版 |
2020/10/05(月) 22:13:35.37ID:3pX7840r0
掃除のオバサンが引っ掛けたときのこと考えてないの?
2020/10/05(月) 22:13:38.17ID:SnuDkD4s0
無茶苦茶
2020/10/05(月) 22:13:46.67ID:+OfV5jh+0
壊すなんて勿体ない事するかよ
2020/10/05(月) 22:13:47.82ID:UhHZuSNh0
爆破弁ならぬ爆破メモリか
2020/10/05(月) 22:14:26.39ID:/KAMgod+0
システム的に対応できていない
2020/10/05(月) 22:14:29.01ID:xoBplqU80
そんな試験必要ねーよ
バカなの?
2020/10/05(月) 22:14:41.31ID:L7EYgTQQ0
FMタウンズからやり直せ
2020/10/05(月) 22:14:42.41ID:tLs+eQUV0
メモリ故障なんて再現させることが困難
14DJサニー(東京都) [US]
垢版 |
2020/10/05(月) 22:15:11.08ID:KzsUZx4L0
メモリミラーしてなかったのかな。。。
15MILMOくん(東京都) [KR]
垢版 |
2020/10/05(月) 22:15:15.18ID:UkGi09/G0
電圧だろうな、多分ここに気付くまであと2週間はかかる
2020/10/05(月) 22:15:35.07ID:OpfU30b10
>>11
だから検知できなくてフェールオーバーできなかったんでしょ
2020/10/05(月) 22:15:46.54ID:mTj/xHXJ0
>>8
メモリはずして切り替わるかテストするんじゃないの よく知らんけど
2020/10/05(月) 22:15:50.31ID:kCPSzFYj0
宇宙線がメモリに振りかかった時の試験をやっていなかった!

とはレベルが違うけど、メモリエラー時の対応か。
2020/10/05(月) 22:15:59.07ID:dnsMudl50
ハードウエアの故障のほうが報告書を書きやすいからね
2020/10/05(月) 22:16:00.59ID:xoBplqU80
典型的な日本企業のやり方だな
無意味な解決策を提示して問題解決したかのように装う
21しまクリーズ(ジパング) [DK]
垢版 |
2020/10/05(月) 22:16:37.18ID:EwbjNajE0
というか、そろそろアローヘッド自体がリプレース時期来てんじゃないの?
今回はメモリだけど、それ以外も故障頻発するぞ
2020/10/05(月) 22:16:40.94ID:kCPSzFYj0
>>20
おう、再発防止策としてチェックリスト作るんだぜ★
23Dr.ブラッド(大阪府) [ニダ]
垢版 |
2020/10/05(月) 22:17:46.33ID:klopMFZy0
>>20
アメリカはどうしてるんや?
2020/10/05(月) 22:18:09.02ID:eW+9GatH0
テストパターンに物理破壊とかスゲーな
2020/10/05(月) 22:18:31.82ID:NISxjCO20
>>22
ダブルチェックをした上で上長に確認いただきます!
2020/10/05(月) 22:18:36.36ID:pU/vagKS0
なまってのらりくらり動いたんだよ
これは難しかったかもな
たまに優しいDV夫みたいな感じの挙動をして離婚できない感じでずるずるいったと思われる
27よむよむくん(福島県) [ニダ]
垢版 |
2020/10/05(月) 22:18:54.18ID:KR6WXmD90
>>15
毎日壊れてるならともかく1年近く以上正常稼働してたんならメモリが壊れた理由なんてどうでもいいわけ
どうせまたそのうち壊れるんだから
正常に切り替わらなかったことが問題
28パーシちゃん(ジパング) [CN]
垢版 |
2020/10/05(月) 22:19:12.89ID:/559iIzd0
>>17
通電中にメモリ外そうとしたら死人が出るぞ
2020/10/05(月) 22:19:24.48ID:40B/lVL40
物理的破壊のテストとか言い出したらもうキリないよね
2020/10/05(月) 22:19:29.92ID:xMgsZgwZ0
CPU-Zいれておけば
2020/10/05(月) 22:20:07.58ID:D+RD7vYO0
やったことはないな
32こぶた(ジパング) [FR]
垢版 |
2020/10/05(月) 22:20:18.95ID:nSLrTv0L0
当時の設計担当者とか転職してて居なさそうだな
というか日本の心臓部が動いているだけでプレッシャーだわ
俺なら間違いなくアトヨロ転職してる
33ドコモン(神奈川県) [US]
垢版 |
2020/10/05(月) 22:20:37.70ID:c3WDU1T20
メモリ故障検出機能に漏れがあったって事か?
2020/10/05(月) 22:20:42.28ID:PvuLoRj/0
1号機が機能しなくなった状態はどうやって作り出したんだ?
2020/10/05(月) 22:20:42.77ID:kCPSzFYj0
>>25
おう、押印欄もちゃんと作るんだぜ★
あと念の為部長にも見てもらうんだぜ★
2020/10/05(月) 22:21:49.76ID:ZKuj24Cp0
物理障害の試験なんて怖くてできない
前にRAID構成のディスクをオンラインで抜く試験を行なって、本当にディスクが壊れた時は始末書レベルでは済まなかった
2020/10/05(月) 22:21:59.28ID:3/NVLoWP0
♪水割りをくださーーーい 涙の数だーーーけ
2020/10/05(月) 22:22:09.45ID:eVBpPecX0
とりあえず手動フェイルオーバーで乗り切らなかったんはなぜだ
39スッピー(鳥取県) [PL]
垢版 |
2020/10/05(月) 22:22:13.02ID:YqM0UCLB0
予備に切り替わらなかったのか
2020/10/05(月) 22:22:19.94ID:8m5ASG7c0
適切なテストしてないのも問題だが

そもそも適切な設計してない問題
2020/10/05(月) 22:22:33.45ID:HzCgx3Mv0
だから日系メーカーは避けて外資のストレージにしておけと
42カーくん(埼玉県) [GB]
垢版 |
2020/10/05(月) 22:23:18.66ID:cIEWo0//0
メモリー抜いて試験すればよかったんじゃね?
43都くん(ジパング) [US]
垢版 |
2020/10/05(月) 22:23:23.87ID:4COnLe7h0
>>41
外資なんて任せたらもっと酷いぞ
バグがあっても全く認めようとしない
2020/10/05(月) 22:23:35.22ID:ezg5Bl2Y0
>>37
それはメモリークラッシュじゃなくてメモリーグラス
2020/10/05(月) 22:23:36.48ID:lIg7LMkx0
>>22
トリプルチェックヨシ!
2020/10/05(月) 22:23:36.75ID:xoBplqU80
>>23
システムエラーなら改善点を示す
ヒューマンエラーなら担当者のクビが飛ぶ
47よむよむくん(福島県) [ニダ]
垢版 |
2020/10/05(月) 22:24:30.15ID:KR6WXmD90
>>38
手動で一部システムを再起動して切り替えたけど、そういう状態での稼働はテストしてなくて怖くて動かせなかったんだよ
そのへんは記者会見で説明してた気がする
48じゅうじゅう(ジパング) [FR]
垢版 |
2020/10/05(月) 22:24:49.15ID:xm3Su+ay0
仕様書に故障モードの想定がなければテストが行われるはずもなくそのまま納品される
あたりまえ体操
2020/10/05(月) 22:25:28.73ID:YKbuGcFz0
富士通に頼ったのが間違い
50セイチャン(東京都) [US]
垢版 |
2020/10/05(月) 22:25:36.05ID:bKtqshhy0
>>28
ゴム手袋着けりゃ安全やろ
51ティグ(神奈川県) [AU]
垢版 |
2020/10/05(月) 22:25:36.41ID:CpL5JL6J0
チキンを解凍してください
2020/10/05(月) 22:25:41.31ID:3SZFBnpw0
>>28
なんで死人が?
2020/10/05(月) 22:25:43.09ID:OpfU30b10
>>43
AWSも結構ひどいからな
強制的にアップデートさせといて今まで動いてたのクラッシュしまくってても調査してまーすで放置だし
2020/10/05(月) 22:25:45.74ID:MIX+v2F50
実際そこまで試験するものなのか?
俺はしたことない
2020/10/05(月) 22:25:53.54ID:e12JVfaO0
ここって本当に原因探るの下手だな
56はやはや君(東京都) [ES]
垢版 |
2020/10/05(月) 22:26:03.16ID:THOpD8fA0
>>25
A「ヨシ!」(確認)
B「よかった?」
A「ヨシ!」
B「ヨシ!」
A○B○
現場責任者「よかった?」
AB「「ヨシ!」」
現場責任者「ヨシ!」
工場責任者「これ本当によかったの?」
現場責任者「ダブルチェックを徹底した上で双方から確認とりました!」
工場責任者「ヨシ!」

偉い人「弊社のチェック体制は完璧です!」
2020/10/05(月) 22:26:04.59ID:6nj1Gmva0
>>47
「全電源喪失は起こらないからマニュアルは必要ない」みたいなアレか……
ほんまなんで日本はこうなんだろ
58バザールでござーる(神奈川県) [JP]
垢版 |
2020/10/05(月) 22:26:12.91ID:bg8MEsrt0
物理破壊テストは考えたことなかった。
59ピアッキー(東京都) [DE]
垢版 |
2020/10/05(月) 22:26:23.01ID:s1dlHyas0
事が事だけに品質管理部長の首だけでは済まんな。
事業本部長や役員レベルの責任問題だわ。
2020/10/05(月) 22:26:41.27ID:HI3TVj4/0
>>22
ヨシ!
61バザールでござーる(神奈川県) [JP]
垢版 |
2020/10/05(月) 22:26:42.66ID:bg8MEsrt0
>>36
そりゃ壊れるだろ
62キタッピー(千葉県) [US]
垢版 |
2020/10/05(月) 22:27:18.94ID:Mc+KNwH70
物理的に死んでるけど、エラー吐いてないからヨシ!
2020/10/05(月) 22:28:54.55ID:5LfxzXok0
これ結局パソコン本体のバックアップがなかっただけ?
パソコンAのディスク1からディスク2に切り替えたけど
パソコンAのメモリー自体が壊れてたから動かなかっただけと?
64BEATくん(岩手県) [GB]
垢版 |
2020/10/05(月) 22:29:05.02ID:50cN3kOg0
物理的に破壊して・・・
そんなテストはしないわな
2020/10/05(月) 22:29:07.25ID:eVBpPecX0
>>47
standby系で動かすことためらったってこと?
切替後の稼働テストすらしとらんのか
66セイチャン(東京都) [US]
垢版 |
2020/10/05(月) 22:29:17.66ID:bKtqshhy0
>>36
始末書以上ってことは切腹とか?
2020/10/05(月) 22:29:43.21ID:YKbuGcFz0
どうやって自分達の責任を軽くするか話し合ってるよ
2020/10/05(月) 22:30:29.95ID:MF2KJ7JD0
これは許してやれよ
2020/10/05(月) 22:30:39.24ID:3eCyoWfl0
適当な言い訳してれば一週間後には追及されない作戦
企業はもうそう言うの学んじゃってる
2020/10/05(月) 22:31:00.21ID:goaCbQ+t0
10月1日だった事に意味は無かったのか
71かほピョン(埼玉県) [CZ]
垢版 |
2020/10/05(月) 22:31:11.12ID:86R3mBAd0
>>21
2019年に刷新したばっかなんですが
2020/10/05(月) 22:31:13.45ID:FMy/rk+k0
>>1
もしかして富士山が大爆発して火山だんが直撃したときのテストもしてなさそう
73らじっと(山口県) [ニダ]
垢版 |
2020/10/05(月) 22:31:31.41ID:538N/SXD0
くだらない再発防止策を考える時間って無駄だよね
74いたやどかりちゃん(東京都) [CN]
垢版 |
2020/10/05(月) 22:31:32.44ID:xGDEZI5k0
そんなテスト普通やらんやろ…
75ヤン坊(東京都) [US]
垢版 |
2020/10/05(月) 22:32:08.84ID:bQeumjrw0
テポドンが直撃したときのテストはしていますか?
2020/10/05(月) 22:32:12.51ID:MM1DwA8U0
システム設計の経験不足だな
きっと他にも想定外のモードが山積みなんだろう
恥ずかしいことだ
2020/10/05(月) 22:32:29.84ID:5LfxzXok0
ディスク以外が物理的に壊れる事を想定してなかったとしか読めないなこれ
78よむよむくん(福島県) [ニダ]
垢版 |
2020/10/05(月) 22:32:46.53ID:KR6WXmD90
>>65
システムの一部分だけ再起動してディスクシステムを手動で切り替えた状態での稼働だよ
2020/10/05(月) 22:33:01.69ID:rQFFlt7Z0
普通のシステムなら要らんけど東証レベルなら必要なんじゃないか?
80じゅうじゅう(ジパング) [FR]
垢版 |
2020/10/05(月) 22:33:43.70ID:xm3Su+ay0
>>43
マジでこれ、台湾からあるライブラリ買ったらなぜか客先デモ中に繰り返しクラッシュ
社内に帰って1ヶ月くらいいろんな条件与えて、クラッシュする条件の傾向を商社に送ったが1ヶ月以上なしのつぶて
最終的に自分で100%クラッシュする条件を見つけて、再現条件をまとめて送りつけたら一週間で修正してきた
くそが
2020/10/05(月) 22:34:10.17ID:uW1+giAV0
ハンマーで叩いて壊れないか試験するのか?
2020/10/05(月) 22:34:30.17ID:ex8oqNb/0
メモリの故障かどうかなんてどうでも良い事で
バックアップに切り替わらなかったのが問題だろ
2020/10/05(月) 22:34:38.41ID:NCOMD5QJ0
どうなんだろう、証券システムレベルなら当然やるべきなのかな
2020/10/05(月) 22:36:17.00ID:3eCyoWfl0
>>43
でもこのままじゃ日本企業は何も成長しない
85ホスピー(京都府) [US]
垢版 |
2020/10/05(月) 22:37:55.12ID:j6mvzP860
Googleのサービス全般、Microsoft Azureにも障害が起こってたから強めの宇宙放射線でも来てて、メモリエラーが発生したのかな?
2020/10/05(月) 22:38:05.34ID:DSTslwOS0
難しいねえ
2020/10/05(月) 22:38:30.62ID:W6vyMbsf0
>>4
実機でやってるだろ
2020/10/05(月) 22:38:33.11ID:Q72r+xpq0
>>47
テストしてなくてというか担当者にやった経験がなくて自信がなかったんじゃないかな。
自動切り替えを代わりに手動でやるだけだから理屈では大丈夫なはずだが、このシステムの場合こことここを注意、
とかそういうことを古くからシステムに携わってきた生き字引みたいな人が言ってくれてたらできた、みたいな。
2020/10/05(月) 22:39:27.79ID:BsUB2zDp0
こんなチョークポイントを作らない設計の方が必要なんじゃないの?
2020/10/05(月) 22:39:42.43ID:i36CiBXK0
昔の日本はハードウェアが強かったのに
今はソフトウェアにこだわってハードウェアがダメになった典型
91パワーキッズ(やわらか銀行) [US]
垢版 |
2020/10/05(月) 22:39:59.47ID:Gn1nc4LA0
急に隕石が落ちてくる場合も想定してテスト項目作れよ
2020/10/05(月) 22:40:00.27ID:nixUKRlP0
物理的にって
だれがハンマーでメモリ壊したんよ(´・ω・`)
2020/10/05(月) 22:41:05.67ID:W6vyMbsf0
>>57
当たり前だろ
94ホスピー(京都府) [US]
垢版 |
2020/10/05(月) 22:41:30.68ID:j6mvzP860
>>88
インシデント発生が10月1日だからベテランが異動してて、経験浅い人らばかりになってたのかな?
2020/10/05(月) 22:41:32.47ID:sOFSGZrz0
富士通は、能無しでした。
2020/10/05(月) 22:41:35.68ID:9kURJoG80
1号機の電源OFF! 2号機に切り替わったぜテスト成功!
だったのかな。メモリだけ微妙に壊れたけど電源入ってるから1号機が事実上死んだことが分からず、何が壊れたかも分からずみたいな
2020/10/05(月) 22:41:38.20ID:Bz8kOOO30
>>34
電源落とすなりケーブル引っこ抜くなりしたんだろう
メモリの物理故障とかって話になるとハード側の問題だろうからシステム構築時の試験としてはなかなかできんわ
2020/10/05(月) 22:42:20.59ID:W6vyMbsf0
>>76
当たり前だろ
いくらテストしようが100%なんてならない。
テストにはコストも時間もかかる
99ぴぴっとかちまい(東京都) [US]
垢版 |
2020/10/05(月) 22:42:27.22ID:xRnTpaZl0
>>87
オンゲーじゃあるまいし、ユーザーにデバッグさせんじゃねーよw
100コジ坊(東京都) [JP]
垢版 |
2020/10/05(月) 22:42:36.92ID:L4BcBpMM0
メモリ上にしか存在しない情報があるってことだろ
その情報が無いとバックアップへの切り替えも、再起動後の情報の保証もできないってことでは
そうでなければメモリ破壊テストが必要な理由にならない
101よむよむくん(福島県) [ニダ]
垢版 |
2020/10/05(月) 22:42:42.25ID:KR6WXmD90
>>88
>担当者にやった経験がなくて
そのためのテストだろうが
102女の子(沖縄県) [GB]
垢版 |
2020/10/05(月) 22:42:45.90ID:gLdv1bTP0
>>81
秘書にドリル渡す
2020/10/05(月) 22:44:04.65ID:bNJzTooX0
メモリって、壊れても完全に動作停止するとは限らないからなぁ

おそらく、メモリに異常が出ても中途半端にエラー吐きながら動き続けて、
切り替えシステム側も故障とは判定しなかった、
てな感じかな

でも、日本の中枢部なんだから、そんな場合に対処できるようにシステムくんどけよ
てか、手動で切り替えれるシステムは組み込まれてなかったんかい
2020/10/05(月) 22:44:26.78ID:PzJYB1vP0
昔ならサーバー用ならECC 1ビットエラーで検出で 2ビットエラーで使い物にならんとかあったけど今どうなんかな。NAND なら Wear leveling で bad block 定量的にわかるけどメモリ不良って地味に面倒い気がしたんだけど
2020/10/05(月) 22:44:28.17ID:Bz8kOOO30
>>96
と言うかシステム屋にできる試験はそこまででしょ
ハード内部の故障での切り替えとかはハード側の問題である可能性のほうが高い

まあ今回はそのハードもETERNUSらしいから富士通のせいではあるんだろうけど東証のシステム担当よりもハード側の担当が責任
取らされるんじゃないかね
2020/10/05(月) 22:44:54.58ID:sX1HMoDE0
そんな試験あるのか
今まで聞いたことないな
2020/10/05(月) 22:45:00.86ID:PvuLoRj/0
物理的な故障に関する試験の問題じゃないでしょ
物理的に壊れた時にどのような動作をするか想定していない設計の問題だよ
設計が間違えているから必要な試験が出来ていなかっただけで、そもそも設計が間違えてるんでしょ
108さかサイくん(東京都) [CZ]
垢版 |
2020/10/05(月) 22:45:03.63ID:THISHU2Z0
バックアップのシステム分は契約不履行でええやろ
109総武ちゃん(SB-Android) [NL]
垢版 |
2020/10/05(月) 22:46:36.55ID:WFc+dyoU0
>>103
でもそれってむずくないか
手動で切り替えられる様にしとけは確かに
2020/10/05(月) 22:46:36.92ID:jC6zJXqG0
これからは構築したらハンマーでぶち壊して冗長系に切り替わるかどうかテストせなあかんのかなあ。
勿体ないなあ。
「この部分を斜め45度から叩き潰すと切り替わりましたが、それより鋭角だとどうなるかは試験してませんでした。」
2020/10/05(月) 22:46:43.25ID:EDhJJMxp0
「擬似的」ってのがショボいか、ホントに壊れた時と違う作動をして「擬似的が擬似的じゃない」んじゃない?
2020/10/05(月) 22:46:43.77ID:Bz8kOOO30
>>103
手動で切り替えられるようにはしてるだろうよ
ただ手動で切り替えて本当に問題がないトラブルなのかとか色々あるわけで
共有ストレージの障害で無理やり切り替えた結果障害発生したストレージ上のデータに欠損が発生したりみたいなケースを考えたら
何らかの形でストレージ自体を復旧させたほうがトータルのダメージは少ない、みたいな話もあるし
2020/10/05(月) 22:47:28.37ID:WJc+eDGyO
ぶぶぶ 物理的に破壊?!
2020/10/05(月) 22:48:08.68ID:sX1HMoDE0
>>104
1ビットのエラーを特定回数検出したら故障してなくてもそろそろ交換しろってアラートが出るんじゃないか?
115パム、パル(東京都) [US]
垢版 |
2020/10/05(月) 22:48:19.78ID:uDB49RN60
フェイルオーバーできることのテストはどうやったんだろうね?メモリー破壊とかするはずもないから擬似的にフェイルオーバーさせたんだろうけどさ
2020/10/05(月) 22:48:46.59ID:Bz8kOOO30
>>107
多分「物理的に壊れたらこういう形でアラートがあがります」みたいな仕様をベースにその前提での試験はしてるんだと思うよ
メモリ故障時にストレージ側でそれをシステム側に通知できてなかったりって話なんじゃないかね
ハード監視で異常発生したら切り替える仕組みがあってもハード自体が異常あげなきゃ切り替わるはずがないわけで
2020/10/05(月) 22:48:49.02ID:fBLbvP0I0
東証くらいなので同じ側のシステムでの多重化やそれを踏まえてのフェールオーバーなんて当然用意していたと思うし
そのどれも機能しなかった状況というのはどこにあるのかな
2020/10/05(月) 22:48:54.01ID:Is0H2hOP0
相当なお金が動いてると思うんだが、こんなざるで許されるんやねえ
2020/10/05(月) 22:49:06.38ID:PzJYB1vP0
あとは redis とか使って部分的に Exception 出まくっただけでメモリ故障が分かったらなかったとか。
2020/10/05(月) 22:49:09.20ID:xa0eV2JF0
ドリル姫「呼びましたか?」
2020/10/05(月) 22:49:21.25ID:fBLbvP0I0
壊れ加減が中途半端でフェールオーバーしなかったとかなのかな
2020/10/05(月) 22:50:14.68ID:40B/lVL40
切り替えのテストって主系の電源切るとか線を引っこ抜くとかで完全に機能停止前提でやってるんだろうから
主系が生存してるように見えてるけどメモリ故障で機能不全って状態だとちょっと酷だな
2020/10/05(月) 22:50:16.34ID:nixUKRlP0
テロ対策してないということだよな(´・ω・`)
124しまクリーズ(光) [EU]
垢版 |
2020/10/05(月) 22:51:00.27ID:FPzow7gW0
これじゃあ海外メーカーに勝てるわけねーな
2020/10/05(月) 22:51:15.82ID:TE6jeoHY0
富士通、無能
日立に切り替えよう
2020/10/05(月) 22:51:32.19ID:b16AENqi0
クラスタソフトで切り替えできない原因は何だったんだ?

>>112
手動切り替えできなくてこの事態だからな
127俺痴漢です(東京都) [JP]
垢版 |
2020/10/05(月) 22:51:55.06ID:el5OdtP/0
アナログって大切だね
2020/10/05(月) 22:52:07.42ID:Bz8kOOO30
>>122
ストレージ側の問題なんじゃないかって気がするよなあ
あるいはストレージの監視ソフトか
どちらにしてもシステム担当よりもストレージの方に問題ありそう
129かほピョン(埼玉県) [CZ]
垢版 |
2020/10/05(月) 22:52:14.46ID:86R3mBAd0
>>96
普通そこまででしょ
2020/10/05(月) 22:52:18.11ID:vSKCrLKe0
手動で切り替えてたら誰かが大金持ちになってたな
131ソーセージータ(庭) [GB]
垢版 |
2020/10/05(月) 22:52:23.29ID:3cQaSIj60
まあ普通はメモリ壊れたときの障害試験なんかせんよ
パーツレベルの障害試験なんてやったらいくら金と時間がきるのかと。
ここで騒いでるバカ共には悪いけどこれは富士通が正論
2020/10/05(月) 22:52:33.81ID:VJJ82a2i0
そんなテスト聞いた事ねぇ。

・・・メインフレームとかだとやるの?
2020/10/05(月) 22:52:39.33ID:djUe90cF0
よし、マザーボード叩き壊す実験もやろう
掃除のおばちゃん切れて、たたき壊すかもしれんし
2020/10/05(月) 22:52:40.13ID:X3Hm/Ng/0
落ちたな
135たぬぷ?店長(東京都) [JP]
垢版 |
2020/10/05(月) 22:52:40.53ID:2Ov0iQhG0
半死でうまく切り替わってくれないのはごく稀に発生するが基本的にそこまで考慮するとコストがかかりすぎるしそもそも網羅なんてしようがない
メガバンクとかでも発生し得るけど東証レベルの影響力ならならコスト度外視でテストやるべきなのかね
2020/10/05(月) 22:53:00.54ID:Q09D6knt0
なお、このメモリは自動的に消滅する
健闘を祈る
2020/10/05(月) 22:53:24.42ID:xHjA1NtN0
テストしてないってことですよね
物理的に壊すなんて、現場では無理
138ホスピー(京都府) [US]
垢版 |
2020/10/05(月) 22:53:33.59ID:j6mvzP860
>>124
東証の障害のちょい前にGoogleやMicrosoftも大規模障害やらかしてるんで…
2020/10/05(月) 22:53:38.29ID:HTxCOpFu0
>>131
通電しないときの対応だとしたらバーチャルでできそうですよ。
2020/10/05(月) 22:53:55.30ID:rqgJF19k0
しかし高い授業料になっちまったな
冗長化の初歩的な部分でミスったのだから担当したSEは完全に馬鹿にされるだろ
141アイちゃん(茸) [US]
垢版 |
2020/10/05(月) 22:54:10.03ID:MsTRyI3P0
メモリエラーシグナル送ればシステムが切り替わるってのは確認したけど、
実際にメモリが壊れたときにメモリエラーを吐くのかを確認してなかったって感じなんかな
2020/10/05(月) 22:54:22.17ID:BcM3dUbs0
>>52
ビリビリするから
2020/10/05(月) 22:54:33.43ID:IDfwaTML0
てへぺろ
2020/10/05(月) 22:55:00.84ID:Bz8kOOO30
>>131>>141
というかその辺はストレージ側で担保する話だからな

そのストレージ自体も富士通製なんじゃないかとは思うが
製品トラブルかどうかって公開されてたっけ?
2020/10/05(月) 22:55:17.01ID:kRoXjRKh0
あーこれやらねーよな
ソフト屋もハード屋もお互いのせいにして何もしない
2020/10/05(月) 22:55:24.05ID:b16AENqi0
>>131
クラスタソフトの開発だとやる試験
147コアラのワルツちゃん(茸) [CH]
垢版 |
2020/10/05(月) 22:55:42.53ID:LcXjvem00
僕のFM Towns も心配です(´・ω・`)
2020/10/05(月) 22:56:10.71ID:tArZFd/q0
テストのやり方としては妥当だけどね。
2020/10/05(月) 22:56:32.72ID:HTxCOpFu0
例えばさ、東証は要求してなくても、
動かないと困るからこっちでこっそり試験するとかそういう文化はないの?
2020/10/05(月) 22:56:40.26ID:nixUKRlP0
USB killerみたいなもんがあったらスグ破壊できるだろうに
なんの対策もしてないんか?(´・ω・`)
2020/10/05(月) 22:56:41.86ID:V73ezCo30
物理破壊はねーよw
152ムーミン(神奈川県) [ヌコ]
垢版 |
2020/10/05(月) 22:56:50.72ID:S4UtA7DG0
さすがArrowsを生み出した会社だぜ!
2020/10/05(月) 22:56:53.64ID:4xlHNQH40
>>57
あらゆる不具合に備えてたらコストも期間も無限
2020/10/05(月) 22:57:00.89ID:JnbbU/bk0
ディスクなのかメモリなのか
155あゆむくん(東京都) [FR]
垢版 |
2020/10/05(月) 22:57:01.72ID:UL0pzUqt0
物理的に壊した人がいたってこと?
2020/10/05(月) 22:57:28.20ID:VJJ82a2i0
>>146
メモリ剥き出しで稼働させといてペンチでメモリ割るとか?
2020/10/05(月) 22:58:02.65ID:8m5ASG7c0
このコメントは富士通は何も作ってない何も設計してないって分かるエビデンスだな

ベンダーに設計も設計検証も丸投げ

富士通は受入試験のみw
2020/10/05(月) 22:58:04.51ID:7rD3k+fZ0
昔レジ作ってた時、ターンテーブルにレジ乗っけてなんか電波当てるテストしてるのはみた事あるけどな
2020/10/05(月) 22:58:20.92ID:bis7qpCE0
>>101
生き字引みたいな人がいないとやるべきテストをやってないことなんかも多々発生したりするんよ
2020/10/05(月) 22:58:22.05ID:FA0zmWUn0
富士通に同情するわ
こんなん無理ゲーだよね
161あゆむくん(東京都) [FR]
垢版 |
2020/10/05(月) 22:58:35.28ID:UL0pzUqt0
>>149
F社さんに「あーあ、なんで壊しちゃったんですか?w」とか言われるから、恥ずかしいじゃん
2020/10/05(月) 22:58:52.58ID:Bz8kOOO30
>>146
そりゃあそうかもしれんがこの手のシステムだとクラスタソフトを開発するのではなく開発済みのクラスタソフトを使用して
システムを構築するわけだからな
ある程度の動作検証はしてもクラスタソフトでの検知に関しては基本は仕様を信用することになるからそこまでの試験はしないよ
2020/10/05(月) 22:59:40.60ID:gqUvYNWk0
スレタイを見てびっくりして飛んできました
2020/10/05(月) 23:00:42.92ID:CX5rkb5u0
つーか、アドレス線とかデータ線をショートさせりゃテストできそうやけどな。
165あゆむくん(東京都) [FR]
垢版 |
2020/10/05(月) 23:00:50.02ID:UL0pzUqt0
何社か共同で開発させて、各社に互いの粗探しさせりゃよかった
2020/10/05(月) 23:00:54.29ID:Bz8kOOO30
>>160
でも共有ストレージ自体がF製の可能性が高いからそうだとするとシステム担当には同情するけど富士通が悪いことは変わらんのよな
2020/10/05(月) 23:01:16.90ID:BazNUGuC0
壊れ方が〜とかにならんの
2020/10/05(月) 23:01:18.01ID:HTxCOpFu0
>>161
原発もそうやって屋根が飛んだw
2020/10/05(月) 23:01:32.62ID:3SCEpmQC0
メモリは壊れるから壊れる前提で予備用意してんだろ。
切り替わらなかったのはシステムウェアなのか、ハードウェア側に予期せぬ要因が入った(サージ、スパイク、振動、ゴミ)なのか。
誰か腹立ってて電源辺り蹴っ飛ばしたりしてねー?
2020/10/05(月) 23:02:20.93ID:b16AENqi0
>>156
メモリスロットの回路にスイッチつけるだけでできるよ

>>162
クラスタソフト富士通製でしょ・・・
2020/10/05(月) 23:02:31.83ID:OfCyQoMv0
そら不可能やろ
172TONちゃん(東京都) [RO]
垢版 |
2020/10/05(月) 23:02:35.19ID:aD3RmuXU0
そのメモリつかってバックアップに
切り替えようとしたのか?
2020/10/05(月) 23:03:00.83ID:FoKb2wmh0
富士通が不実
2020/10/05(月) 23:03:12.92ID:Bz8kOOO30
>>165
それやっても結局別会社が担当した部分は中身まで詳細に分からなくて突っ込んだ試験をしきれなくて意味がないよ
「作った奴とは別のやつが試験しろ」と言われるものの結局そんな第三者に詳細な仕様や作りを把握するまでのコストはかけられなくて
期待したほどの結果は得られない
2020/10/05(月) 23:03:27.42ID:cUikHU/40
電車で富士通のスマホの広告を見た時は
こいつらマジかと思ったわ
2020/10/05(月) 23:03:27.97ID:LDwpbjE80
東証の社長が、責任はすべて我々にあり訴えるつもりはないと言っていたけど、
あれは契約上そうなってるから言ったんだろうな

ただ実際は納入されたハードが想定通り切り替わらなかった
東証側も納品されたものを全通りテストするわけにもいかんだろうし
契約上どうであれ、恨み節は聞こえてくるよな
2020/10/05(月) 23:03:29.45ID:1zNLvuia0
え?物理破壊してもどうにかできるの?
178みらいちゃん(東京都) [FR]
垢版 |
2020/10/05(月) 23:04:27.85ID:KTHhUSDl0
愛だね
2020/10/05(月) 23:05:17.27ID:OSIMkuup0
どこ製のメモリーつんでたの?
180フジ丸(岩手県) [US]
垢版 |
2020/10/05(月) 23:05:19.07ID:wZcJ48ZI0
切り替えのトリガーを拾えなかった原因がなんなんだよ
2020/10/05(月) 23:05:35.59ID:AXLVlGVg0
ETERNUSはよく触ってたけど、
メモリの擬似障害試験なんて発想すらしなかったわね
2020/10/05(月) 23:05:44.40ID:Bz8kOOO30
>>170
だからクラスタソフトやストレージ側の問題ならそれはハードやら作る部署の問題であって今回のシステム構築とは別の話であって
システム構築に付随する試験とは全く別のレイヤーの問題なんじゃないの?
社として富士通が悪いことと東証システムの試験としてどこまでやるかって話は別でしょ
2020/10/05(月) 23:06:38.49ID:BQQwIHt+0
ストレステストしないのか
2020/10/05(月) 23:06:52.60ID:+vBHiL//0
ときどきメモリ壊れる
略してときメモ for ever fuji tsu
2020/10/05(月) 23:07:15.53ID:AXLVlGVg0
ミドル事本あたりが大騒ぎしてんのかね
2020/10/05(月) 23:08:04.62ID:Bz8kOOO30
>>181
こう言っちゃ悪いが「ハードが仕様どおりに動作しないことでトラブル発生したらそれはハード納入した奴らがケツ持てよ」
ってなるものだからね
ハードもシステムも富士通でもシステム構築担当するような部署とハード担当の部署とでは実質別会社みたいな認識だもの
システム構築時にハードの動作仕様まで疑って検証するのはオーバースペックだし普通はやらんよ
187レンザブロー(東京都) [US]
垢版 |
2020/10/05(月) 23:08:09.66ID:ZWR5ESeu0
>>183
その程度で壊れるメモリなら、メーカーの耐久試験クリアできないよ
2020/10/05(月) 23:08:16.03ID:kgJvXcff0
冗長化されてても切替時に上手く行きませんでした系は実はしょっちゅう起こってるんだろうな。
どうでも良い様な企業のならなんとかなるけど、金融系だと隠蔽も限界。
2020/10/05(月) 23:08:27.93ID:LE65zfRg0
日本の情報系ってレベル低いのか?
俺は情報学んで、就職は情報系避けたから事情がわからん
190あかでんジャー(東京都) [CN]
垢版 |
2020/10/05(月) 23:08:27.98ID:bsPnWk2r0
監視ソフトはなんだろう?
2020/10/05(月) 23:08:28.37ID:xHjA1NtN0
どうせ下請け丸投げちゃうの?
2020/10/05(月) 23:08:57.10ID:8m5ASG7c0
1号機が「やべー、今から壊れるよー、2号機さん、あとはよろしくねー」

って信号を2号機出す仕様だったんじゃないか

ところが突然死んじゃったw
193イチゴロー(大阪府) [RU]
垢版 |
2020/10/05(月) 23:08:57.25ID:daWtI7GW0
>>43
ほんこれ
194アイちゃん(茸) [US]
垢版 |
2020/10/05(月) 23:09:08.93ID:MsTRyI3P0
>>103
パソコンのメモリが壊れたこと今までで一度だけあったけど
ある程度正常に動いたりするからな
たまにブルースクリーンになったり

0x〜の命令が0x〜のメモリを参照しました。メモリがreadになることができませんでした。

みたいなよく分からないメッセージが出たりする。メモリチェックする奴使ったら熱暴走しやすくなってた。
2020/10/05(月) 23:09:36.16ID:Bz8kOOO30
>>188
トラブルが発生しなければ顕在化しないだけで障害発生しても無事に切り替わって従系で動き続けてるシステムも山程あるけどな
最終的にエンドユーザに見える形のトラブルにならなけりゃニュースにはならんわけで
2020/10/05(月) 23:10:29.66ID:awUVpLoJ0
これ富士通の担当者、更迭とかされてるのかな
メモリの物理的故障は稀だし可愛そうではある。
2020/10/05(月) 23:11:59.02ID:xoBplqU80
>>192
1号機、2号機の他に監視用のサーバーを置いてそれがチェックする
1号機が動いてないのに感知できないなんておかしいし、ソフトウェア的な不具合がある
198星ベソくん(千葉県) [US]
垢版 |
2020/10/05(月) 23:12:37.08ID:pLnyeqgU0
きれいにフェールオーバー出来ないなんて結構ある事だと思うけどな

障害検知してから強制的にFOする決断が出来なかった人間がいるんじゃないの?

原因特定に拘っていつまでも障害状態を維持させる客って結構多いんだよね...
2020/10/05(月) 23:13:17.56ID:bAg7cPEU0
ハード故障は起きるときは起きるから仕方ないんよ
問題は上手く切り替わらなかったこと
200アイちゃん(茸) [US]
垢版 |
2020/10/05(月) 23:14:03.79ID:MsTRyI3P0
>>138
マイクロソフトがやらかした前日にアップルもやってる
全部メモリに関係してるのかまでは確認してないけどソフトエラー引き起こす強烈な宇宙線でも飛んできたのかな?
2020/10/05(月) 23:14:36.94ID:n8mzzKnv0
納品時に松崎しげる 愛のメモリーのまじないをかければよかったのに
202金ちゃん(福岡県) [US]
垢版 |
2020/10/05(月) 23:15:17.28ID:WnHzgW6T0
物理的に破壊されないと切り替わらないの?
2020/10/05(月) 23:15:42.59ID:u/RpcKH+0
>>11
同意
全ての可能性で試験するなら、電気がUPSも非常電源も全て止まるまで想定する必要がある
2020/10/05(月) 23:16:20.33ID:b16AENqi0
>>182
メモリやストレージ障害発生しても止まらずに稼し
続けるってのが
arrowheadの謳い文句だろうに

>>196
サーバーだとメモリの物理故障はメインボードの故障より多いような
205あかでんジャー(東京都) [CN]
垢版 |
2020/10/05(月) 23:16:32.53ID:bsPnWk2r0
>>196
前代未聞の重大事故だからな。富士通の威信というか、国の威信に関わるし、普通に更迭かクビだろ。。
206ひょこたん(東京都) [FR]
垢版 |
2020/10/05(月) 23:17:00.43ID:JTVml3j10
稼働中にスロットからメモリーを引っこ抜く試験くらい、簡単なような気がする。
2020/10/05(月) 23:17:03.95ID:Bz8kOOO30
>>202
逆逆
物理的にぶっ壊れた場合に切り替わらないトラブル
ぶっ壊れたことを検知するのがハード側だったのかハード監視のソフトだったのかシステム側だったのかもまだ公表されてないみたいだけどな
2020/10/05(月) 23:18:02.28ID:Xa+GwkRL0
HDDに付いてる方のメモリってわかってるやつ少なさそうだなあ
2020/10/05(月) 23:18:36.45ID:MDWkiiWk0
こういう絶対止まってはいけないシステムのバックアップは切り替えテスト普通やるよな?
病院でも停電しても電気が止まらないように定期的に自家発電の切り替えテストやってるのに
2020/10/05(月) 23:18:52.06ID:OhrBisxl0
まあサーバー構築した後のテストでは物理的にメモリ障害を起こすテストはやらないな
そういうのはハード開発時にテストしているものだと思ってる
2020/10/05(月) 23:18:52.15ID:TJp+bS3I0
メモリってのはいきなり完全に壊れて止まるなんてことはまずない。
大抵は箱の中でファンが回ってホコリが入り込み、メモリにホコリが付いて接点やICの足などに接触し、
ちょっとおかしな動作になることが多い。そういう状態だと完全に壊れてるわけでもないし、
正常に動いてるわけでもない状態になる。症状はホコリの付き方によって程度が変わる。
だから掃除機で掃除すれば治った可能性もある。
212御堂筋ちゃん(東京都) [US]
垢版 |
2020/10/05(月) 23:19:36.28ID:feUAvgYO0
もちろん責任を取るのはお前らだからな!しっかり働けよ!
213ひょこたん(東京都) [FR]
垢版 |
2020/10/05(月) 23:19:50.05ID:JTVml3j10
HDDなんてsmartのエラーが出たら即バックアップに切り替えでしょ。
2020/10/05(月) 23:19:53.76ID:Bz8kOOO30
>>205
実際更迭もクビもそうそう無いと思うよ
余程の人為的なミスでもありゃ話は別だが
215みらいちゃん(福岡県) [US]
垢版 |
2020/10/05(月) 23:20:15.33ID:kNq18AT30
メモリは富士通製じゃないんじゃ?
SAMSUNGとかSKあたりだと思うけど
216アイちゃん(茸) [US]
垢版 |
2020/10/05(月) 23:20:22.17ID:MsTRyI3P0
>>140
障害で部分停止や一時停止はあったけど、全日取引完全停止なんてたぶん初か数十年ぶりの事態でも、これ起因での株価暴落しなかったから、対応は上々と思われたんじゃないかな。
トランプがコロナって暴落したけど

故障頻発したらたまらんが絶対止まらないシステムなんてあり得ないし、十年に一度ぐらいなら許容範囲なんかも
2020/10/05(月) 23:20:47.78ID:WDTK2rHh0
ハードウェア破壊テストなんてできるかよ
2020/10/05(月) 23:21:49.48ID:1Ldeml8r0
>>200
秋だからな秋は鬼門
2020/10/05(月) 23:22:01.39ID:b16AENqi0
>>216
全銘柄取引停止は3回目
去年システム更新してからは初
2020/10/05(月) 23:22:06.05ID:FA0zmWUn0
壊れ方にも色々あるからね
全てに対応しろっていうのも酷な話
その為の手動切替だとは思うんだけど、まぁ色々あったんだろうな
お察し
221雷神くん(東京都) [PH]
垢版 |
2020/10/05(月) 23:22:18.90ID:bjH89sNZ0
あーあ、うちのシステムは大丈夫なのって聞かれたら、何て答えよう。テストの方法も考えないと。忙しいのにまた増える。
2020/10/05(月) 23:22:28.51ID:Bz8kOOO30
>>215
メモリ故障そのものよりもメモリ故障をストレージとして検知してアラート出せなかったのが問題なんじゃないかな…
でまあ多分ストレージは富士通製品だろうからそこが原因ならハード部隊が悪くてそうでなくてストレージはアラート
あげてたけどそれをシステム側で拾えてなきゃシステム側が悪い
223あかでんジャー(東京都) [CN]
垢版 |
2020/10/05(月) 23:22:28.94ID:bsPnWk2r0
>>214
客から嫌われてクレーム入るだけで担当から外される業界なのに、更迭がないなんてあり得ないわ
2020/10/05(月) 23:22:40.07ID:GeclXb620
>>28
死人が出るレベルってどんなメモリ使ってるのよ
225和歌ちゃん(東京都) [ニダ]
垢版 |
2020/10/05(月) 23:23:03.36ID:K3VXaKvH0
>>11
お前が正しい
富士通の言い訳はゴミ
226あかでんジャー(東京都) [CN]
垢版 |
2020/10/05(月) 23:23:32.07ID:bsPnWk2r0
>>215
メモリの故障が問題じゃないんだよ
2020/10/05(月) 23:24:21.36ID:4J0CZBiT0
つまりはテスト時しか機能しない2号機だったって事かよ
2020/10/05(月) 23:24:48.65ID:Bz8kOOO30
>>223
更迭したところで新しく来るやつに1からシステム学ばせるコストやリスク考えたら失点はあっても長くシステムに関わってる
担当者残した方がマシ、くらいの判断は普通にされるよ
外部から監査的な追加要員は入れるだろうけど
2020/10/05(月) 23:25:11.94ID:HRrMIqmX0
システムに通電してるけどOS突然死を想定してなかったということか
230あかでんジャー(東京都) [CN]
垢版 |
2020/10/05(月) 23:26:06.18ID:bsPnWk2r0
ハードは故障を前提で二重化してるからな。
231アイちゃん(茸) [US]
垢版 |
2020/10/05(月) 23:26:16.74ID:MsTRyI3P0
>>197
生存監視してても見た目生きてて呼びかけには返事はするんじゃない?
ゾンビだけど🧟
232アンクルトリス(日本のどこか) [BR]
垢版 |
2020/10/05(月) 23:26:21.50ID:FzEAHjv/0
ミルスペックかな?
2020/10/05(月) 23:26:53.55ID:NRZEzgdO0
すべての故障パターンを網羅したスーパーマシンは値段もスーパーなので売れない
234はまりん(東京都) [US]
垢版 |
2020/10/05(月) 23:27:03.89ID:S/VPsE4X0
これもしかて物理的に破壊されたとかない?
昔ブラクラで振動おこしてHDぶっ壊すやつとかあったじゃん
それのメモリーのやつとか
2020/10/05(月) 23:27:04.72ID:RS9nzN7x0
コレクタブルエラーとか中途半端に壊れると無駄に頑張って切り替わらないとかありそう
アンコレでキレイに死ねば切り替わったとか
236いたやどかりちゃん(東京都) [CN]
垢版 |
2020/10/05(月) 23:27:12.04ID:xGDEZI5k0
>>213
それがスマートだよな
2020/10/05(月) 23:27:19.50ID:SlVId23v0
メモリはコントローラの上にあるのかな
メモリがダメならコントローラがフォルトして
リダンダントのほうにフェイルオーバするはずだけど
それがうまくいかなかったのか

コントローラのフォルトを検知できなかったのか

あるいは、メモリは実はキャッシュメモリで、
バックアップバッテリーが消耗して
ライトスルーになり速度が低下して
処理が追いつかなくなったのか
2020/10/05(月) 23:27:48.86ID:Bz8kOOO30
>>231
その可能性が一番高いと思うわ
共有ストレージのメモリ障害ならネットワーク不通にもなってないだろうしストレージ自体がアラート上げなけりゃシステム側から
ストレージの障害を判定するのは難しいわけで
239BEATくん(京都府) [EU]
垢版 |
2020/10/05(月) 23:28:56.20ID:Z9bxBaey0
携帯電話を物理的に
ホッカイロにする実験は散々やって来たのに!?
240あかでんジャー(東京都) [CN]
垢版 |
2020/10/05(月) 23:29:02.63ID:bsPnWk2r0
>>228
そういう場合は客にわからないように社内だけで作業する要員にまわすだろ。
今回の場合はもっと上の方の責任者が飛ばされるだろうな
241モッくん(空) [US]
垢版 |
2020/10/05(月) 23:29:30.96ID:Q7HGHEMc0
無能過ぎるやろ
2020/10/05(月) 23:29:34.29ID:QDXMS+Pb0
キャシュらしいけどね
バッファだからやってないか
難しい
2020/10/05(月) 23:29:39.96ID:r9qAyCp10
つまりPCをぶっ壊すとぶっ壊れるって意味か?
2020/10/05(月) 23:29:43.40ID:oKTc+0PC0
つか今まで同様の不具合あったけど全然改善して来なかったんだよ
だから20年も前から富士通評判悪いんだよw
245アイちゃん(茸) [US]
垢版 |
2020/10/05(月) 23:29:54.59ID:MsTRyI3P0
>>219
全銘柄終日停止はたぶん初じゃ?
過去の全銘柄停止は一応取引時間中に復帰しただろ
2020/10/05(月) 23:29:57.71ID:jmWwjqVj0
何もかも想定できるわけじゃないしある程度は仕方ないんじゃないかな
むしろ手動切り替えでもいいから丸一日ストップさせないこと考えた方がいいと思う
2020/10/05(月) 23:30:53.27ID:YyTRzzOH0
半殺し状態とか検知できねえだろ…
2020/10/05(月) 23:32:34.86ID:5o6tLyz/0
しょうもねえな
この体たらくで富士通はDXとか言ってんじゃねーぞ
2020/10/05(月) 23:33:40.39ID:LDwpbjE80
東証みたいな重要なシステムでも末端で働いている人の給料は横並びなんだろ?
検証時に物理破壊も試せるような潤沢な予算や時間が用意されているわけでもないんだろ?
だとしたら結局普通のシステムと同じ確率でこういう問題起きるよね

重要なシステムなら末端で作業する人の年収も2000万円以上にして、
優秀な人材を集結させないとだめだな
2020/10/05(月) 23:34:35.11ID:OhrBisxl0
死んでたら切り替わってただろうけどど疎通確認は出来てたのだろうね
昔昔にsystemwalkerとか設定してたけどメモリ障害で切り替わる設定とかしてたおぼえはないわ
251きょろたん(SB-iPhone) [NL]
垢版 |
2020/10/05(月) 23:34:38.97ID:RHDIapgH0
こんな糞会社が一方で世界一のスパコン作ってるんだから笑える
252アイちゃん(茸) [US]
垢版 |
2020/10/05(月) 23:35:19.70ID:MsTRyI3P0
>>221
メモリがよくわからん壊れ方する、加速器で中性子線浴びせまくる試験でも提案したら?
実際あるみたいだし。

中性子線浴びまくった機器が放射能汚染されてないかは知らないけど
2020/10/05(月) 23:35:36.39ID:eVBpPecX0
>>78
サーバー屋は門外漢だけど丸ごと切り替えとかじゃないんか
勉強なったわさんくす
254やなな(兵庫県) [CN]
垢版 |
2020/10/05(月) 23:36:17.43ID:bP/2JJ8g0
つか当初から日経はなんで富士通を目の敵にしてんだ?
東証のCIOも富士通はベンダーで、責任所在は運営者のワシ等やって散々会見で言ってたのに
これ日経が富士通を潰したがってるよな
255あかでんジャー(東京都) [CN]
垢版 |
2020/10/05(月) 23:37:17.92ID:bsPnWk2r0
東証のBCPはどうなってるんだ?
災害時用のバックアップシステムも無いのか?
2020/10/05(月) 23:37:38.08ID:tl7Jh8nb0
そりゃ故障診断と切り替えの機構を「主 装置側」に組み込んでるからだろwwwww
257そなえちゃん(福島県) [US]
垢版 |
2020/10/05(月) 23:37:57.30ID:sYidCedN0
勘違いしてるやつが散見されるが東証のシステム自体はわりすとぐ復旧したんだよ
アルゴリズム取引が主体になってる現在の東証で本来の想定時間外に取引始めたらどうなるかを
HFTや証券会社と協議したら危ないからやめとくって事になっただけ
1日停止は影響がでかいから今後は後場から開始するのか10時とかの中途半端な時間でも開始するのかの取り決めするだろう
258たぬぷ?店長(埼玉県) [JP]
垢版 |
2020/10/05(月) 23:38:33.18ID:h8uV4DQx0
予備の切り替えを日頃からやってないだろ
2020/10/05(月) 23:39:33.61ID:6nj1Gmva0
>>93 >>153
全電源喪失時のマニュアルは無きゃおかしいだろ
普通に起こり得る話なのに

今回のやつにしたって、システムの手動切り替えくらい、テストして当たり前
260モモちゃん(ジパング) [US]
垢版 |
2020/10/05(月) 23:39:47.28ID:JV0qQ3Mq0
もうダメだ。東証宮原が無能なせいで、完全に売買のタイミングがおかしくなったわ。この仕事のできない無能、はやく辞任しろよ。
2020/10/05(月) 23:40:16.37ID:JHgeQgce0
社会インフラレベルの仕組みだと障害試験もがっつりやらないとな
不治痛はしっかりやれ
262あかでんジャー(東京都) [CN]
垢版 |
2020/10/05(月) 23:41:50.48ID:bsPnWk2r0
>>257
そんなわけあるかよ。すぐ復旧したのなら、普通は後場からでも再開するだろ
2020/10/05(月) 23:41:53.52ID:TwYcT8v20
そんな試験やってるところは他でも無いんだがw
問題はそこじゃないだろw
264カナロコ星人(東京都) [US]
垢版 |
2020/10/05(月) 23:42:11.31ID:qkvZFL5b0
地震とか災害が多い国でこの程度の想定しかできないって…。
銀行とかは大丈夫だろうな?ある日突然預金がゼロとか嫌だよ。
265柿兵衛(東京都) [ヌコ]
垢版 |
2020/10/05(月) 23:42:48.25ID:QFIoqtHw0
>>1
もったいないの精神が生きてるな
2020/10/05(月) 23:43:57.16ID:GGfreisP0
てか受取試験の時に発注した側が試験しろよ
2020/10/05(月) 23:44:35.46ID:LDwpbjE80
>>254
止まったら納入したベンダーが損害額払いますなんて条件にしたら、売った商品価格の100倍ぐらいの
損害賠償もあり得るわけで、そんなハイリスクな仕事どのメーカーもやりたがらないから、
そういう条件にせざるを得ないでしょ

そうは言っても、じゃあ東証が納入されたハードウェアの物理破壊試験まで行わなくちゃ行けないかというと
それもなんか違う気がする
268デンちゃん(大阪府) [US]
垢版 |
2020/10/05(月) 23:46:30.36ID:2Hm7lyCw0
その結論で良いのか?
建前だとしてももうちょっとマシな理由を挙げろよ
269あかでんジャー(東京都) [CN]
垢版 |
2020/10/05(月) 23:46:32.62ID:bsPnWk2r0
システム止まったなら、東証は場立ちで注文取るくらいの誠意を見せろよ
アルゴの分も全部な
2020/10/05(月) 23:47:08.53ID:ESNsDwdL0
エターナスの設定が足りなかっただけじゃないかな
業務用のシステムとかハードって嫌がらせかと思うぐらい売りにしてる機能が設定上デフォルトではオフになってるとかあるあるだろ
271ゾン太(千葉県) [DE]
垢版 |
2020/10/05(月) 23:47:19.14ID:BNny5P3n0
んでその故障はどのくらいあり得るんだよ
まず起こらないことが東証で起きたのなら作為を感じるな
272やなな(兵庫県) [CN]
垢版 |
2020/10/05(月) 23:47:26.47ID:bP/2JJ8g0
>>261みたいな書き込み見ると安全神話がこの国狂わしてる一つなんだな良く分かるな
どれだけ冗長化やフェイルオーバー作り込んで、そのテストもやっても
想定通りに復旧しないことは起こり得るってだけの話
壊れねぇ機械なんてねぇんだよ
273そなえちゃん(福島県) [US]
垢版 |
2020/10/05(月) 23:48:03.29ID:sYidCedN0
>>262
あるかよもなにも後場から始めることで業者と合意が得られなかったから終日停止したって会見で言ってたわけだが?

https://shikiho.jp/news/0/378998
>このような状況であるため、後場からの再開も不可能ではなかったようだ。
>しかし、後場からの取引再開に向け、各証券会社に再起動のプロセスについて説明したところ、スムースな再開は難しいという意見もあり、当日の取引を全て停止して翌日以降、新しい取引として新たに注文を受けることとした。
2020/10/05(月) 23:48:20.99ID:3jf8LYq90
普通精密機器にそんなテストするのか?
275ハミュー(大阪府) [US]
垢版 |
2020/10/05(月) 23:49:07.98ID:PTSQ1l770
普通はしません
2020/10/05(月) 23:50:40.46ID:LgGupFXM0
サーバー爆発した時の試験くらいしないと(´・ω・ `)
2020/10/05(月) 23:51:48.60ID:vj2Vq7Vp0
>>1
サーバー搭載にしろ、DISK装置にしろ
稼働状態でのメモリ故障を任意で発生させてテストすることは出来ないしな( ・∇・)
記載の通りの本体装置停止によるテストしか出来ない( ・∇・)
2020/10/05(月) 23:53:06.17ID:eUaWeWXj0
>>259
自家発電や予備電源の試験はあるが全電源喪失になると出来ることは無いのでマニュアルとしては電源断からの起動マニュアルになるだけの場合が多い。

手動切り替えのマニュアルはあるんだろうが、どういう状況で使うべきなのか、原因が不明で使わなかったなど考えられるかと思う。
2020/10/05(月) 23:54:08.87ID:tArZFd/q0
りょうけい
280おにぎり一家(東京都) [DE]
垢版 |
2020/10/05(月) 23:54:41.53ID:lf0vIkXk0
物理破壊するテストなんかねーわ普通
2020/10/05(月) 23:58:53.00ID:dymlVQ/s0
>>29
この厳しさを求めたら、原発の稼働は不可能だね
2020/10/05(月) 23:59:00.66ID:6nj1Gmva0
>>278
100の被害を50にするための配管操作手順とかは事前にシミュレーションしてマニュアルに残すべき
1号機の緊急冷却装置も、訓練でも一度も起動したことなかったから、本番で起動に失敗した
2020/10/05(月) 23:59:01.67ID:tArZFd/q0
両系統それぞれでお互いを監視していて、片側の監視装置(CPU)が壊れれば、正常な方の監視装置が検知してフェールオーバーする仕組だと思うのだけど。

閾値の設定がよくなかったのだろう

富士通赤っ恥。フォールトトレラント一生言うなよ。
284ケロ太(愛知県) [US]
垢版 |
2020/10/05(月) 23:59:55.51ID:/t6KMg950
メモリの縮退テストなんかするかよ、そんなの。
そんなもんはハードウェアレベルで既に担保されてるべきもんだ。
ってかこれはクラスタソフトの設定ミスだろ?
2020/10/06(火) 00:00:02.96ID:B5p7ueXM0
>>276
原発が爆発した時のテストもしますか?
2020/10/06(火) 00:00:41.95ID:Vnb6ZHXa0
> 疑似的に1号機の機能を喪失させるテスト
どうせLAN線を抜くぐらいのテストしかしなかったんだろねw
2020/10/06(火) 00:01:25.70ID:UyvYzj7M0
>>280
プロジェクトXで見たけどマルスを日立が国鉄に納めたときは受入テストで汎用機の電源を強制断したりしてたみたいだけどね。

止まらないシステムって豪語してたからてっきりそれくらいのことはやってんのかと。
288柿兵衛(愛知県) [US]
垢版 |
2020/10/06(火) 00:01:42.50ID:9QRtxB2T0
>>283
>閾値の設定
まさにそれだわ
2020/10/06(火) 00:02:00.30ID:oA6Pre0y0
>>19
ファームだと思うな。。。
290ナショナル坊や(香川県) [DE]
垢版 |
2020/10/06(火) 00:02:55.65ID:deUERuGH0
メモリが物理的に壊れるってレアケースすぎてテストなんかしないだろ
2020/10/06(火) 00:03:40.98ID:vfHRvymx0
https://www.jpx.co.jp/corporate/news/news-releases/0060/20201005-01.html
292ハッチー(東京都) [CN]
垢版 |
2020/10/06(火) 00:04:49.74ID:ekRMZ3/V0
>>273
それをシステム自体すぐに復旧したと言えるのか?
システム的に再起動出来ても、証券会社に無理言わないと再開出来ませんじゃ電源落ちてるのと一緒じゃん
2020/10/06(火) 00:05:47.53ID:oA6Pre0y0
ETENUSのCMのメモリーエラーなんて日常的。切り離しできなかった理由が何かが問題
2020/10/06(火) 00:06:07.99ID:eXUH053D0
>>282
それについてはそうだと思うよ。

ただ表向き全電源喪失についてマニュアルを用意しないのはある程度理由が推察出来るだろ。
まず全電源喪失なんてのが東証で起きたらマズい訳で、そのマニュアルが存在すること自体が問題なので存在しないのだよ。だったら起きないように対策しろとなる。良し悪しはともかく意味はわかるだろ?
2020/10/06(火) 00:06:32.24ID:CUoi4DD00
ハード故障なんて現場じゃテストしないよ
そんなんメーカーがやることや
2020/10/06(火) 00:06:51.28ID:ij1fWM3a0
異次元と繋がったんだろ
297ウッドくん(茸) [US]
垢版 |
2020/10/06(火) 00:07:09.61ID:sxAtVgWZ0
>>267
試験項目として要求すればメーカーはやるんじゃない?
やらせれば値段に跳ね返ってくるだけで
298タヌキ(福島県) [US]
垢版 |
2020/10/06(火) 00:07:27.05ID:BtC+ydPd0
>>292
東証の取引システムが復旧したから証券会社とこれから取引初めて大丈夫?っていう協議が出来るわけだがお前は何を言ってるの?
2020/10/06(火) 00:07:30.92ID:B1H3dG5+0
電源断のフェールオーバーの想定は簡単

金融機関の場合はね
2020/10/06(火) 00:08:51.81ID:dbtO4q2Q0
>>294
なにが「わかるだろ?」だよ
お前みたいなやつが福島を死の土地にしたんだよ
目をつぶったって目の前のリスクが消えるわけじゃないのに
301しょうこちゃん(兵庫県) [CN]
垢版 |
2020/10/06(火) 00:09:11.96ID:YYjfQQkD0
>>292
それシステム関係ねぇだろw
302ハッチー(東京都) [CN]
垢版 |
2020/10/06(火) 00:09:37.92ID:ekRMZ3/V0
ていうか、セカンダリシステムあるのに切り替えに24時間掛かるって、社会的重要インフラとしてそんなんでいいのかよ
2020/10/06(火) 00:09:46.27ID:Rn6k2QL20
試験していなかったのではなく、異常ケースの設計が漏れていたのでは?
異常ケースの設計漏らして、レビューで突き返されることを何度も経験している私はそう思いました。
2020/10/06(火) 00:09:49.02ID:wDOnFhYA0
ぶっちゃけメモリはむずいよ
あと盲点だろうね
HDDのSMARTみたいにステータス監視とかできないだろうし、
むしろよく1営業日で復旧できたと褒めるべき事案
305ウッドくん(茸) [US]
垢版 |
2020/10/06(火) 00:11:18.92ID:sxAtVgWZ0
>>292
それならシステム障害が復帰したあと午前11時リスタートとか午後からリスタートとか運用方法を決めてなかった証券会社と取引所の間の問題だ

迅速な再開と事前に決めてないよくわからんことをぶっつけ本番でして想定外の取引成立とか障害発生する影響のと天秤かけて今回は終日停止にしたんだろう
306ハッチー(東京都) [CN]
垢版 |
2020/10/06(火) 00:11:52.76ID:ekRMZ3/V0
>>301
関係あるだろ。データも揃ってシステムだろ。
ようするに証券会社の前場の注文を復旧出来なかったんだろ?
2020/10/06(火) 00:12:56.61ID:B1H3dG5+0
>>304
金融の基幹系システムの開発でそれを言ったら出入り禁止
308タヌキ(福島県) [US]
垢版 |
2020/10/06(火) 00:14:52.25ID:BtC+ydPd0
>>306
前場の注文は永遠に失われたのでお前の理屈だと東証は未だに取引システム停止中だな
309フレッシュモンキー(静岡県) [US]
垢版 |
2020/10/06(火) 00:15:16.18ID:lPeMUVm00
なかなかねぇ物理的破壊は実験しないからな
次からは完成したらショットガンで破壊実験してね
310スージー(長屋) [US]
垢版 |
2020/10/06(火) 00:15:29.96ID:RkiMTq+F0
>>1
まるで朝鮮企業だな
2020/10/06(火) 00:15:51.00ID:ybqQz08C0
物理破壊て工作員のテロじゃないの?
2020/10/06(火) 00:16:12.97ID:JjgLhTrN0
パソコンのメモリと同じだと思ってるやつはちゃんと記事読めよな
313ウリボー(埼玉県) [US]
垢版 |
2020/10/06(火) 00:16:40.66ID:9wnrAWLl0
目視でトリプルチェックヨシ!
314ハッチー(東京都) [CN]
垢版 |
2020/10/06(火) 00:17:21.34ID:ekRMZ3/V0
>>305
午前11時リスタートはあり得ないとしても、後場まで潰す理由には到底納得出来ないだろ。
2020/10/06(火) 00:18:42.55ID:uCTrVs2v0
物理破壊テストなんて
普通はしないよな

メモリじゃなくて別の部分も
全て物理破壊テストしないとダメになるな
316ハッチー(東京都) [CN]
垢版 |
2020/10/06(火) 00:19:54.54ID:ekRMZ3/V0
>>308
10/1前場の注文は失われたんだろ。当日中注文って書いてたろ?
317しんちゃん(東京都) [AR]
垢版 |
2020/10/06(火) 00:21:17.20ID:NPBHmde30
NEC「家に発注してたらやってたけどな」
2020/10/06(火) 00:21:21.90ID:wDOnFhYA0
>>307
マジかよ
リアルタイムでメモリモジュールのステータスをモニタリングできるツールとか存在する?
319タヌキ(福島県) [US]
垢版 |
2020/10/06(火) 00:22:20.36ID:BtC+ydPd0
>>316
だからその10/1の前場の注文データは永遠に返ってこないんだが?
320しょうこちゃん(兵庫県) [CN]
垢版 |
2020/10/06(火) 00:23:16.45ID:YYjfQQkD0
>>306
場立ちによる株取引こそが至高とか言い始めそう
321ハッチー(東京都) [CN]
垢版 |
2020/10/06(火) 00:23:17.06ID:ekRMZ3/V0
>>315
監視ソフトがクソか、監視ソフトに適合しないもの使ってたんだろ
322ウッドくん(茸) [US]
垢版 |
2020/10/06(火) 00:23:59.67ID:sxAtVgWZ0
>>307
銀行ってマイクロ秒での超高速取引とかしてなさそうだけど
求めるものが違えばシステムの作り方からして違うんじゃ?

全銀システムってここ50年ぐらい運用して大規模障害発生したことないみたいだが、その代わりに閉鎖的かつ手数料がくそ高いみたい
323ハッチー(東京都) [CN]
垢版 |
2020/10/06(火) 00:24:31.86ID:ekRMZ3/V0
>>320
場立ちでアルゴを全て処理してこそ取引所を名乗れ!って
2020/10/06(火) 00:24:47.17ID:dbtO4q2Q0
>>315
てっきりメモリの抜き差しくらいは試してるのかと思ってたのに

つか1号機と2号機でデータ齟齬が起きたら切り替わるもんじゃないのか?
どっちが正のデータかわからなかったのか?
メモリのデータ化けはパリティで検知できるはずなんだが
2020/10/06(火) 00:24:52.13ID:eXUH053D0
>>300
お前いつから福島の話してたのよ。東証じゃないのかよ
2020/10/06(火) 00:25:19.23ID:Rn6k2QL20
2号機「1号さん生きてますか?」
1号機「・・・」
2号機「あれ?1号さん生きてますか?」
1号機「・・・」
2号機「1号さん?1号さーん!僕、指示してくれないと動けないっス!」

こんな感じ?こんな単純な訳でも無いのかしら
2020/10/06(火) 00:25:21.26ID:wDOnFhYA0
>>312
よくみたらディスクの中にあるメモリの事なのな
ファームって上のほうでレスしてる奴がいるのはそのせいか
2020/10/06(火) 00:25:48.93ID:V1ZDiWD30
物理的にメモリ壊すの無理だから
メーカーに擬似的ツールを提供して貰って
テストするしか出来ないだろ
2020/10/06(火) 00:26:26.74ID:dbtO4q2Q0
>>325
>>57からずっと福島の話といっしょにしてるだろ
全電源喪失の話をしてるだろ
330ウッドくん(茸) [US]
垢版 |
2020/10/06(火) 00:27:23.14ID:sxAtVgWZ0
>>314
それはコンピュータシステムが悪いんじゃなくて決めてなかった取引所と証券会社の運用面の問題

個人客がどう思おうと大口客的にそっちの方がいいなら、今後もこの類のシステム障害があったら終日停止の運用のままだろうけど
2020/10/06(火) 00:27:34.02ID:eXUH053D0
>>327
ETERNUSの話だろな
332ハッチー(東京都) [CN]
垢版 |
2020/10/06(火) 00:27:43.35ID:ekRMZ3/V0
>>319
だから、証券会社からの注文を取引所がエラーを返せてないから、証券会社は注文の精査出来なくて復旧出来なかったんだろ。
東証のせいじゃん。
2020/10/06(火) 00:27:55.81ID:QoQyQo7v0
こういうイレギュラーまで防げたんじゃねーのか再発防止しろだとかギャーギャー騒ぐ馬鹿が大勢いることが問題
日本のITが発展しなかった大きな要因のひとつ

OSがハングっただけなのに意地でもアプリ側に原因求めてきて、
不毛な再現試験をメーカーに課して悦に入ってる客の無能上役とか生きてる価値ないよ
334ニックン(茸) [RO]
垢版 |
2020/10/06(火) 00:27:59.19ID:R3xovDEx0
>>318
ベンダーのハードウェアモニタリングツールで見れるよ
最近のハード監視は優秀になったもんだよ
OSとは独立しててオフラインでモニタリング出来るんだし
335お父さん(SB-iPhone) [FI]
垢版 |
2020/10/06(火) 00:28:52.60ID:5WwQTxT30
肩系になる時の電圧変動で両系死ぬのはよくある不具合だよな
これはユーザーではなくメーカーのせい
336ポケモン(滋賀県) [US]
垢版 |
2020/10/06(火) 00:29:01.78ID:a0TZ+6/o0
ただの置物でしたとなぜ言えない?
337ウッドくん(茸) [US]
垢版 |
2020/10/06(火) 00:29:25.52ID:sxAtVgWZ0
>>323
仮に今の取引を立会い場でやって人間が捌けたとしとら、何秒ぐらいで部屋が紙で埋まるんだろう
338カーくん(東京都) [CO]
垢版 |
2020/10/06(火) 00:29:33.99ID:2FCh9DeF0
>>50
AIに外すのをお願いしよう
マニピュレーターつけて
2020/10/06(火) 00:30:26.60ID:SQXrNc360
昔携帯電話の交換機のSEやってたけど物理的に異常が出る試験は何回かやった
架台からモジュール引っこ抜いたり全システムの電源を瞬断したり。
まあセレモニーっぽいと言うか「やっぱここまでやると復旧に時間かかりますねぇw」
みたいな事で済ませて終わり、みたいな意味あんのかよって試験だったが
340大吉(東京都) [ニダ]
垢版 |
2020/10/06(火) 00:30:38.57ID:2zg+bi8S0
完全に壊れてくれたらいいんだろうけど
特定のビットがたまーに化けるとか
そんなんだと内部エラーが積み重なっていくのかしらね
2020/10/06(火) 00:30:58.23ID:wDOnFhYA0
>>334
そうか…ベンダーがなあ…
伊達に死屍累々拝んできてないな(´Д⊂グスン
2020/10/06(火) 00:31:00.61ID:z7OumNPr0
>>333
だよなあ
なんか事あるごとに知識もなく叩きたいだけってのが最近酷いよ
343タヌキ(福島県) [US]
垢版 |
2020/10/06(火) 00:32:47.87ID:BtC+ydPd0
>>332
東証のせいかどうかではなく前場のある時点で東証のシステムが復旧したのかどうかの問題なんだけど話すり替えないでくれる?
344アストモくん(東京都) [US]
垢版 |
2020/10/06(火) 00:34:13.52ID:EWttCNyx0
富士通はやらかしても
東証から請求書が届くこともなく。
アベ友はいいなぁ。
345こぶた(神奈川県) [BE]
垢版 |
2020/10/06(火) 00:35:11.75ID:OZXjqOT40
問題は切り替わらなかったことじゃなくて、
切り替えに失敗したことだろ。

日○なら、もしこんな方向性で原因追及やったら社内でボコボコだぞ。
346ピカちゃん(庭) [SE]
垢版 |
2020/10/06(火) 00:35:19.54ID:gQHwi0X10
ならhdd販売会社のせいなのでは?
347ハッチー(東京都) [CN]
垢版 |
2020/10/06(火) 00:35:38.53ID:ekRMZ3/V0
>>330
そんそんなの当たり前だろ。誰がコンピュータシステムが全て悪いなんて言ったんだよ。
東証の事業継続性はどうなんだと説いてるんだよ。
348ウッドくん(茸) [US]
垢版 |
2020/10/06(火) 00:36:29.78ID:sxAtVgWZ0
>>333
そのシステムが止まったときの損害と想定や試験にかけるコストの天秤とか
手動での手続きや救済策の準備とか

割り切りは大事だよね
証券取引所会社の経営者はそれに理解のある人みたいだが
2020/10/06(火) 00:36:47.79ID:B1H3dG5+0
>>322
超高速取引をこなしつつ障害で停止しないシステムとして開発されたのがアローヘッドなので

富士通SEが今回のは仕方がないですと言った瞬間に東証に殺される
350ウッドくん(茸) [US]
垢版 |
2020/10/06(火) 00:38:37.68ID:sxAtVgWZ0
>>347
次の日、取引開始直後に株価はそこまで下がらなかった
信用のない市場なら資金流出してたろうし、そういう可能性があると報道はされてた

これが全てじゃ?
2020/10/06(火) 00:39:35.60ID:OZXjqOT40
コストを楯に原因追及をやめたくなる気持ちは分かるがそれじゃ同件類似事故は防げないぞ
osやドライバーのバグ発見するいい機会になるかも知れない。
352ハッチー(東京都) [CN]
垢版 |
2020/10/06(火) 00:40:24.54ID:ekRMZ3/V0
>>343
じゃあ、取引出来て無いのにシステムが復旧していつでもOKだったという証左を出せ証左を
そもそも取引出来てないのに復旧してましたという事に何の意味があるのか。1日システムが止まって取引出来なかった事実しかないわ。
2020/10/06(火) 00:40:28.12ID:fXRnEGtg0
ハード売ってる人が試さないとダメよそれ
2020/10/06(火) 00:40:46.10ID:UR5n61bY0
つーか物理的に壊れてたのかあれ
2020/10/06(火) 00:41:18.09ID:K632wVn20
>>36
試験なのに始末書出すハメ撮りになったの?
356ウッドくん(茸) [US]
垢版 |
2020/10/06(火) 00:41:51.92ID:sxAtVgWZ0
>>349
取引所会社は我々の責任って言ってるし
そもそもストレージメモリ障害によるシステム障害がないことを要求してるか次第でどっちに瑕疵があるか決まるんじゃないかな
要求してたのなら富士通が悪いし、要求してなかったのならシステム発注者が悪い

何かよくわからんがいかなる場合でも壊れないこと
なんて要求仕様じゃ誰も受けないだろうし
357ハッチー(東京都) [CN]
垢版 |
2020/10/06(火) 00:42:34.84ID:ekRMZ3/V0
>>350
東証で上場を考えている国外ファンド等の評価は下がっただろうね。
358ごきゅ?(埼玉県) [US]
垢版 |
2020/10/06(火) 00:43:16.76ID:TuTOel/g0
金融関連で障害起こすのは、りそなか富士通って相場は決まってんだよ
359おたすけ血っ太(京都府) [US]
垢版 |
2020/10/06(火) 00:43:44.59ID:wDd1dd0D0
アローヘッドが稼働して10年、これまで大きな障害なかったからかなり安定したシステムだったんだな
うちらが知らん苦労は多々あったにせよ
2020/10/06(火) 00:45:02.00ID:l0Jxhrw20
末端の請負作業員だけクビになるんだろうな
2020/10/06(火) 00:45:43.54ID:Rn6k2QL20
よく読んだら1号機応答してたんですね
HDD抜去くらいはしてるだろうから、とても災難だったんじゃないの
362ハッチー(東京都) [CN]
垢版 |
2020/10/06(火) 00:46:02.99ID:ekRMZ3/V0
>>359
しかしね、全国の鉄道が1日全線停止したようなもんだからね。
経済的損失もそれなりでしょう。
363テット(光) [US]
垢版 |
2020/10/06(火) 00:48:14.20ID:6q4uYOR50
>>66
ワロタ
ヤクザでも切腹の代わりに小指だけ斬るというのに
2020/10/06(火) 00:48:26.40ID:Wlyhg30I0
物理破壊じゃどうしょまない
2020/10/06(火) 00:48:51.74ID:B1H3dG5+0
>>356
個々の装置が壊れても縮退運転で動き続ける事ができるのが、最も重要な非機能要件なので。

壊れない事が要求仕様になる事はないよ
壊れても動き続けることが要求仕様
2020/10/06(火) 00:49:39.64ID:F7DPDxsn0
官公庁系やってるけど
テストもっとやれ、と言ってくるかもなー
いい迷惑だ
2020/10/06(火) 00:51:56.18ID:pXgyffVU0
どうやるんだ?w
2020/10/06(火) 00:52:17.53ID:B1H3dG5+0
>>344
東証が紳士的というか、いい取引先だと思う
2020/10/06(火) 00:55:06.87ID:fXRnEGtg0
1号機と2号機の関係がまだよくわからないな
なんらかの方法で1号機の物理ディスクに書き込まれたデータは2号機に同期されてるけど
1号機のキャッシュメモリに書き込まれてるデータは1号機しか持ってないから
再起動も出来なかったってことだろうか?
2020/10/06(火) 00:55:11.06ID:AeLoCzno0
支那は関係ないの?
2020/10/06(火) 00:56:41.79ID:B1H3dG5+0
>>366
DRとBCPのテストと訓練が増えるだろうね
想定外のケースを想定しろとかね。

想定できるなら初めから対応しとる
372ハッチー(東京都) [CN]
垢版 |
2020/10/06(火) 00:57:09.11ID:ekRMZ3/V0
>>368
経産省的に国内IT企業を疲弊させるようなマネはせんでしょ
373タヌキ(福島県) [US]
垢版 |
2020/10/06(火) 00:57:46.24ID:BtC+ydPd0
>>352
https://shikiho.jp/news/0/378998
>このような状況であるため、後場からの再開も不可能ではなかったようだ。
>しかし、後場からの取引再開に向け、各証券会社に再起動のプロセスについて説明したところ、スムースな再開は難しいという意見もあり、当日の取引を全て停止して翌日以降、新しい取引として新たに注文を受けることとした。
2020/10/06(火) 00:58:22.66ID:fXRnEGtg0
メモリ破壊のテストは製品で保証して欲しい
2020/10/06(火) 00:59:57.28ID:fXRnEGtg0
>>373
それは無理って話だよ
なんでできなかったかっていうと
1号機のメモリにしかない取引データが消えてしまうから
それを消す方法で午後稼働再開したとしても
復旧ではないよ
2020/10/06(火) 01:02:11.35ID:B1H3dG5+0
>>372
金融庁のシステム監査(金融庁検査)が結構厳しい
金融システムが停止して国民経済に影響が出るのは絶許だから

厳しくなったにはみずほ銀行のせいだけど
377ニックン(茸) [RO]
垢版 |
2020/10/06(火) 01:02:12.78ID:R3xovDEx0
ここで言ってるメモリって、主記憶装置のメモリのこと?
それとも、アレイコントローラーのキャッシュメモリのこと?
多分、前者なんだろうけどさ。
2020/10/06(火) 01:05:00.24ID:4ZRLpfre0
東電「そういうときは想定外と言うとけ。日本はそれさえ言っとけば全ての責任から解放されるぞ」
379ニックン(茸) [RO]
垢版 |
2020/10/06(火) 01:05:40.70ID:R3xovDEx0
>>373
この記事はソフト屋さんが書いた記事だな
ハード目線ではない
2020/10/06(火) 01:06:14.50ID:tWL9tGFV0
メモリ破壊のテストしたら次はデータセンタ破壊したパターンのテストもせんとな
381ハッチー(東京都) [CN]
垢版 |
2020/10/06(火) 01:06:37.27ID:ekRMZ3/V0
>>373
100歩譲ってそれが証拠だとしてさ、一体何処にシステムは復旧していたと断定した事が書いてあるんだ?

「再開も不可能ではない」としか聞いてないけど。
2020/10/06(火) 01:07:52.35ID:MlWRz9mj0
物理的って上手いごまかし方だな
馬鹿が勝手に勘違いしてくれる
383ハッチー(東京都) [CN]
垢版 |
2020/10/06(火) 01:10:12.08ID:ekRMZ3/V0
>>376
金融機関や取引所にはかなり厳しいけど、国内メーカーにはそんなに厳しくないでしょ?
2020/10/06(火) 01:10:40.75ID:wYbJ8T+x0
>>1
これの再発防止とかアホかよ
こんなことやってるから日本のITはいつまでたっても糞なんだよ
385ヤン坊(東京都) [SE]
垢版 |
2020/10/06(火) 01:10:55.12ID:tpP4zXqw0
>>380
それはよくやる。
DRサイトで動作するかチェック。
2020/10/06(火) 01:11:21.71ID:B1H3dG5+0
>>380
それは当然テストしていると思うけど
387タヌキ(福島県) [US]
垢版 |
2020/10/06(火) 01:12:06.65ID:BtC+ydPd0
>>381
東証が記者会見で同じこと言ってたから
388ヤン坊(東京都) [SE]
垢版 |
2020/10/06(火) 01:12:29.86ID:tpP4zXqw0
手動フェールオーバー、業務2時間前にやるとか手が震えますよ。
2020/10/06(火) 01:14:57.31ID:HG8qLouE0
そんなテストやらないとか言ってるやつは記事読んでないよな

全ての可能性を潰せって話じゃなくて理由不明でも正常な状態でなくなったら代替機(2号機)に移行しろって話よ
390Kちゃん(東京都) [DE]
垢版 |
2020/10/06(火) 01:15:11.18ID:B80fgMAe0
物理的に壊れるって、想定もしないほどレアな故障なのか?
391ハッチー(東京都) [CN]
垢版 |
2020/10/06(火) 01:16:12.20ID:ekRMZ3/V0
>>387
え、じゃあ東証はシステムは復旧していていつでも取引OKでしたけど、面倒くさくて1日休んじゃいました。テヘペロって言ってたの?
2020/10/06(火) 01:16:19.48ID:MYoqAeag0
>>380
DC物理破壊だと隕石落とすとかかな
2020/10/06(火) 01:18:11.10ID:MYoqAeag0
>>390
ディスクとか稼動部分があるものに比べりゃレアだけど何枚もあるからたまにある。今回は故障で切り替わらなかったのが問題
2020/10/06(火) 01:18:33.51ID:B1H3dG5+0
>>380
というか、一部装置のメモリが破壊されたくらいでシステム全体が止まるのがおかしい、という考えになる。(クリティカルなシステムなので)

DRサイトで業務継続できなかったのか?
395ハッチー(東京都) [CN]
垢版 |
2020/10/06(火) 01:18:48.49ID:ekRMZ3/V0
>>390
いやいやあり得ないでしょ。そんな事あったら世界中で起こってるでしょ。設定ミスか、ディスクのシステム設計ミスじゃね?
2020/10/06(火) 01:19:12.28ID:fXRnEGtg0
>>389
データを抱えて壊れてんのよ
1号機くんが
397タヌキ(福島県) [US]
垢版 |
2020/10/06(火) 01:19:59.63ID:BtC+ydPd0
>>391
証券会社と後場から取引再開のリスクについての折り合いがつかなかったからって言ってるんだが何いってんの?
アルゴ取引が暴走してジェイコム事件みたいなのが起こったらお前が責任とるの?
2020/10/06(火) 01:23:38.88ID:fXRnEGtg0
>>397
いや、再起動するとメモリにある取引データが消えるから
できなかったってどっかに書いてあったと思うけど
2020/10/06(火) 01:26:25.76ID:PoEEnSBH0
物理破壊のテストなんて普通のシステムならしないなあ
2020/10/06(火) 01:26:57.04ID:HG8qLouE0
>>396
それは全く別の問題
今回のケースと関係なく設計次第で起こり得る別の話な
401ハッチー(東京都) [CN]
垢版 |
2020/10/06(火) 01:27:00.77ID:ekRMZ3/V0
>>397
いやだから、システムは復旧していたという事実を書けよ。

後場からの再開も不可能ではなかったようだ。しかし、後場からの取引再開に向け、各証券会社に再起動のプロセスについて説明したところ、スムースな再開は難しいという意見もあり、当日の取引を全て停止
402パレナちゃん(京都府) [CH]
垢版 |
2020/10/06(火) 01:27:56.12ID:FGMlRmhO0
>>203
アホか
バックアップのバックアップが壊れる可能性は低く見積もれる
仮に1/10で壊れるなら二台同時に壊れる確率は1/100まで下がる
メモリ単体が物理故障はありえるけど、それが連続して起こる可能性は極小だからバックアップを置く
2020/10/06(火) 01:28:21.04ID:Ivz6rio30
メモリだけを意図的に破壊するのはちょっと難易度高すぎるからこれは富士通を擁護しちゃうわw
404ハッチー(東京都) [CN]
垢版 |
2020/10/06(火) 01:28:44.62ID:ekRMZ3/V0
>>397
なんでアルゴ取引が暴走する話が出てくるの?
それにジェイコム事件は誤発注でしょ?大丈夫?
405タヌキ(福島県) [US]
垢版 |
2020/10/06(火) 01:29:35.24ID:BtC+ydPd0
>>398
だから後場がその日の寄り付き扱いなら再開できるから証券会社とそれについて協議したら
それじゃリスクあるから困るってことで終日取引停止にしたんだよ
406リスモ(神奈川県) [FR]
垢版 |
2020/10/06(火) 01:32:07.94ID:lOABFFMc0
お金かかっちゃうしね
2020/10/06(火) 01:33:50.08ID:9QnA9sRW0
原発でいうたらメルトダウンしたようなもんやな
直ちに影響はないっ
408ハッチー(東京都) [CN]
垢版 |
2020/10/06(火) 01:34:37.33ID:ekRMZ3/V0
>>405
いや、だから復旧出来なかったから証券会社に無理言ってんじゃん。
復旧という言葉の意味わかってる?
409タヌキ(福島県) [US]
垢版 |
2020/10/06(火) 01:34:56.52ID:BtC+ydPd0
>>404
本来9:00に始まるはずのものが12:30に始まった場合に誤発注するリスクがないとでもいうの?
2020/10/06(火) 01:38:04.41ID:B1H3dG5+0
↓これ、考えただけで頭が痛くなる。。


今回は情報配信システムとともに、売買を監視するシステムなど障害の影響が広範に及んだ。このため、証券会社から朝方に東証に集まった注文について、一律に売買を止めるという措置ができなくなってしまった。

売りと買いを突き合わせる売買のシステムは稼働していたため、約定する注文や、発注を受け付けただけの状態の注文が混在する事態となった。一斉の取引再開が可能な証券会社とそうでない証券会社が出てくることが予想され、投資家間の公平性も考えて東証は終日の売買停止措置にしたという。今後は東証側と証券会社が協議し、障害時の取引再開についての手順も見直す。
411タヌキ(福島県) [US]
垢版 |
2020/10/06(火) 01:38:09.36ID:BtC+ydPd0
>>408
後場からなら取引可能な状態にできるから証券会社と協議したわけだけど?
東証は取引再開の見通し立たないのに後場から初めていい?って協議したと思ってるの?
その場合OKって言われたら東証はどうするつもりだったの?
412ティグ(神奈川県) [FR]
垢版 |
2020/10/06(火) 01:40:12.24ID:02+ciVnO0
実質テストしてなかったってこと??
まぁ物理的な故障のテストはなかなかハードルが高いな…。
メモリーエラーをわざと起こすテストはしても、それとは違うしなぁ…。
413小梅ちゃん(神奈川県) [ニダ]
垢版 |
2020/10/06(火) 01:42:55.52ID:ei6734Gx0
>>82
実際にメモリ故障させる試験をしなかったから、メモリ故障しても切り替えられないことがわかってなかったということだろ。
414ハッチー(東京都) [CN]
垢版 |
2020/10/06(火) 01:43:07.10ID:ekRMZ3/V0
>>411
再起動のプロセスで証券会社は夜間バッチと同じ事しなきゃいけなかったんだろ?
そんなの無理に決まってんじゃん。
データの復旧出来てないのに偉そうにシステムは復旧してましたとかどの口が言えんだよ。
415ハッチー(東京都) [CN]
垢版 |
2020/10/06(火) 01:45:03.31ID:ekRMZ3/V0
>>409
そんな事言ったら、システム再起動してもそもそもダメって事じゃん。
2020/10/06(火) 01:45:27.88ID:fXRnEGtg0
>>413
ディスクのファームウェア作った人が
知ってたかどうか、試したどうかはわからないな
ただ対応はできてなかった
417リボンちゃん(大阪府) [PL]
垢版 |
2020/10/06(火) 01:45:38.89ID:yax60cPe0
もし俺で良かったら愛のメモリー歌うで
2020/10/06(火) 01:46:25.47ID:fXRnEGtg0
>>415
彼はそれが言いたいんでしょ
システムは問題なかった
東証に問題があるって主張だと思うよ
ID辿ったらストレートにそう書いてある
419タヌキ(福島県) [US]
垢版 |
2020/10/06(火) 01:51:38.62ID:BtC+ydPd0
>>414-415
過去には実際東証のシステムトラブルで後場スタートになったとこがあるわけ
420ハッチー(東京都) [CN]
垢版 |
2020/10/06(火) 01:54:34.21ID:ekRMZ3/V0
>>418
えーーその主張に何の意味があるの?
それは屁理屈というものでしょ。。
システムってハードだけがシステムじゃないのをわかって言ってるのかね。
東証に問題があるって主張は完全に同意しますけど。
2020/10/06(火) 01:55:12.72ID:yJMEVc5+0
まあ富士通だしなって感じがする。
2020/10/06(火) 01:56:09.77ID:y7bO3P/70
デジタル化も富士通は避けよう
2020/10/06(火) 01:56:19.44ID:z0qVc5KJ0
こんな言い訳通用するの?
それじゃマザーボードも、チップを1つずつ壊すテストをしなきゃいけないってこと?
424カールおじさん(大阪府) [US]
垢版 |
2020/10/06(火) 01:56:23.20ID:cYDVqLCQ0
メモリが物理的に壊れるケース、って
まあそんなテストは普通せんよね
メモリが物理的に壊れるなんてレアケースだから

やってる所があるなら知りたいぐらい
2020/10/06(火) 01:56:57.84ID:B1H3dG5+0
メモリーを破壊するテストをしていないというよりも、メモリー(監視装置)が破壊される事を想定していなかったんだろ

擬似的に再現するの一番簡単そうなテストケースなのに
426ハッチー(東京都) [CN]
垢版 |
2020/10/06(火) 01:59:57.96ID:ekRMZ3/V0
>>419
取引スピードが速くなったからなのか、顧客が増えたからなのか知らんけど、それはアローヘッド前じゃないの?
427小梅ちゃん(神奈川県) [ニダ]
垢版 |
2020/10/06(火) 02:03:26.68ID:ei6734Gx0
何を試験するかも顧客が承認してのものだからね。
やると言ってやってなかったり、試験結果を捏造してたりでなければ
責任は顧客にある。
428タヌキ(福島県) [US]
垢版 |
2020/10/06(火) 02:03:49.80ID:BtC+ydPd0
>>426
それはアロヘになるまえはHFTなんて存在しなかったしアルゴ取引も今よりずっと少なかったから証券会社もOKしたけど
今はリスクが増えすぎて拒否したって事なんだが
東証が証券会社に拒否される可能性にかけて一か八かで後場からの取引開始を持ちかけたとでも思ってんの?
2020/10/06(火) 02:04:03.88ID:45zbe2v30
>>294
あぁ、起きるはずがないから用意しないってそれ完全に間違ってるよ
ミスが起きてはならない
だからミスが起きないようにしよう
ミスが起きないようにしてるからミスは起きるはずがない
っていう日本のいつもの失敗パターンだよね
それでもミスは起こるから起きた時にどうするかを考えるんだよ
2020/10/06(火) 02:04:38.83ID:B1H3dG5+0
>>186
システム構築の担当からすると、クラスタソフトやディスク自体が壊れたケースまで考えてシステム構成を考える(停止させられないシステムの場合)

メモリ破壊のテストをしていないのがダメだったというのは、事の本質を矮小化した物の見方だと思う
2020/10/06(火) 02:08:15.47ID:B1H3dG5+0
>>231
それ面倒だね

ただ、面倒でも対応考えないといけないけど
ハード屋の世界だと解決できなそう
2020/10/06(火) 02:10:57.70ID:qJ8uHt9N0
ハードなんて期待したようには死なないんだよなあ
それで想定の条件から漏れて停止とかあるある案件
2020/10/06(火) 02:14:31.45ID:B1H3dG5+0
>>221
ハードウェアで自動的に切り替わりますって言えなくなったしな

ユーザーは、ハードウェアで自動的に切り替わらなかった場合の事を聞いているわけだし

土下座しとけ
434BEAR DO(東京都) [US]
垢版 |
2020/10/06(火) 02:14:52.92ID:KyF5FTSZ0
メモリが故障したらプロセス全部死ぬ気がするんだけど、そうじゃないのかね?
キャッシュが生きてれば切り替え用のプログラムは生きていられるのだろうか
2020/10/06(火) 02:19:41.10ID:m6tUpn5P0
装置に中性子当てメモリーの
ソフトエラー出たときの挙動を
調べて対策したりしてるよ

何もやって無いわけねーよ
2020/10/06(火) 02:20:45.36ID:z0qVc5KJ0
ハード屋さんのノウハウが多ければ、「私は今ここが壊れてますよー」というエラーログが、出せたのかなぁ。
それだったらエラー検出して、冗長系に切り替えれそうだけど。
437ニックン(茸) [RO]
垢版 |
2020/10/06(火) 02:21:03.79ID:R3xovDEx0
>>434
メモリが何枚乗ってると思ってんの
2020/10/06(火) 02:23:11.03ID:B1H3dG5+0
>>436
今回は、ハード屋にノウハウがないから起きた事象です
439ハッチー(東京都) [CN]
垢版 |
2020/10/06(火) 02:24:22.32ID:ekRMZ3/V0
>>428
それは東証目線なの?
何を言いたいのかわからないけど、データの復旧が出来なかったから、今の無し無しもう一回最初からやってって東証が頼んだけど断られたんでしょ?
システムの復旧出来てないじゃん。
440ニックン(茸) [RO]
垢版 |
2020/10/06(火) 02:24:54.98ID:R3xovDEx0
>>438
ん?SEじゃないの?
2020/10/06(火) 02:28:39.77ID:pbwi7dgG0
ワイのDDR SO-DIMM余っているから貸そうか?
442タヌキ(福島県) [US]
垢版 |
2020/10/06(火) 02:28:59.10ID:BtC+ydPd0
>>439
東証の取引システムが壊れたままだったらその最初からスタートが出来ないんだが?
2020/10/06(火) 02:29:17.55ID:qJ8uHt9N0
システム全体としても証券会社側のインタフェースを含めたロールバック時の責任主体が決められなくていざ非定常業務には耐えられないとかありそうですね
444エコてつくん(北海道) [ES]
垢版 |
2020/10/06(火) 02:29:49.09ID:IEcnxPBk0
https://mevius.5ch.net/test/read.cgi/win/1595502643/561
SandyBridgeおじさんイキり中
2020/10/06(火) 02:31:52.73ID:G5Bfb0XQ0
>>35
これ本当に嫌い。君確認したんでしょって言われるためだけの押印欄
446ハッチー(東京都) [CN]
垢版 |
2020/10/06(火) 02:33:33.01ID:ekRMZ3/V0
>>442
いや、だからスタートが出来なかったから1日止まってたんだろ?
システムが壊れて。
2020/10/06(火) 02:35:36.90ID:B1H3dG5+0
富士通さんへ

個々の装置にフェールセーフの機能があるから大丈夫ではなく、
個々の装置のフェールセーフが正しく機能しなくても動くようにするにはどうしたらよいか考えてね
448タヌキ(福島県) [US]
垢版 |
2020/10/06(火) 02:35:46.92ID:BtC+ydPd0
>>446
取引システムが直ったので後場からなら開始できるけどどうしますかっていう話し合いをしたんだけど?
2020/10/06(火) 02:37:11.86ID:B1H3dG5+0
>>446
ベンダーSEと社内SEでよくある言い争いだなぁ
450カールおじさん(大阪府) [US]
垢版 |
2020/10/06(火) 02:40:31.55ID:cYDVqLCQ0
>>447
それはもうあれだな、
何かの不幸で脳死しても、昨日と同じように仕事続けてね
言ってるようなもんだな

難題吹っ掛ける方の難易度が低すて
難題吹っ掛けられる方の難易度が高すぎるw
2020/10/06(火) 02:42:30.21ID:GxI0nTf10
先人たちはマイクロより優れてたのに
452ごめん えきお君(東京都) [US]
垢版 |
2020/10/06(火) 02:43:51.08ID:3n+/ISgC0
メーカー勤務だけど車とかじゃなくても結構ハードな耐久試験はするよ
でも買い入れた汎用機まではやらないわ
2020/10/06(火) 02:44:38.89ID:uT3PCd530
システムエラーの問題に対してヒューマンエラーが重なるのが日本のいつものパターンだろ。マニュアルに頼るのと責任負わないのと決定下さないいつもの奴だよ。
454カールおじさん(大阪府) [US]
垢版 |
2020/10/06(火) 02:50:25.37ID:cYDVqLCQ0
CPUは心臓、メモリは脳に相当する認識がない奴が多杉
どっちかが死ねば影響は不可避
テストしたとかしてないとかいう話ではない
455ハッチー(東京都) [CN]
垢版 |
2020/10/06(火) 02:52:38.09ID:ekRMZ3/V0
>>448
直ったの?セカンダリに切り替えたんじゃなくて?
じゃあデータもバッチリってこと?
じゃなんで協議の結果、後場から再開しなかったの?
2020/10/06(火) 02:52:53.33ID:yEkBlarD0
別に何年かに1回ぐらい止まったって良いじゃねーか
2020/10/06(火) 02:54:28.08ID:lL8DzTxK0
運用担当者が朝イチで電源オンまたはボードで確認
あれれ?昨日の終値が全然出てない!、でもシステムは正常動作してんだけど?
上司に報告、大変だ!再起動したか?しました!予備系は!正規系で動いてます!でも表示されません!大変だー取引中止ー!
みたいな感じだったんかな
2020/10/06(火) 02:58:11.29ID:B1H3dG5+0
>>454
個々の装置だけ考えるならその通り

ただね、このシステムは装置が1つ死んでも動かないとダメなのよ。
459ハッチー(東京都) [CN]
垢版 |
2020/10/06(火) 03:03:18.26ID:ekRMZ3/V0
>>448
後場からの再開も不可能ではなかったようだ。しかし、後場からの取引再開に向け、各証券会社に再起動のプロセスについて説明したところ、スムースな再開は難しいという意見もあり、当日の取引を全て停止

これを読む限りだと東証の提示した取引再開プロセスに問題があるのは明らかだと思うけど。
東証がシステムの復旧が出来なくて、証券会社は再起動のプロセスを余儀なくされたとしか読み取れないんですけど。
460ポコちゃん(千葉県) [ニダ]
垢版 |
2020/10/06(火) 03:05:16.80ID:LkDha+Xg0
いやまあその試験はしないだろうがどんな状態からでもフェールオーバーは出来るようにしとけよ
461スカーラ(大阪府) [EU]
垢版 |
2020/10/06(火) 03:08:55.61ID:TUxvAbbj0
破壊試験って大事だよな
通信系はすぐ壊れるのだし
2020/10/06(火) 03:14:00.93ID:B1H3dG5+0
これ、共有ディスクに格納されているデータの更新頻度が少ないから、Active/Active構成ではなかったという事でよいのでしょうか?
2020/10/06(火) 03:32:45.60ID:b/uzcfRI0
>>156
メモリ割るとかではなくて、壊れたメモリに取り替えるだけ、簡単

壊れたハード部品は富士通のなかにいっぱいある
2020/10/06(火) 03:33:58.70ID:b/uzcfRI0
>>133
マザーボード壊すとかじゃなくて壊れたマザーボードに取り替えてテストするだけ、簡単

壊れたハード部品は富士通のなかにいっぱいある
2020/10/06(火) 03:40:07.60ID:lL8DzTxK0
壊れたSEもいっぱいいそう
2020/10/06(火) 03:49:30.85ID:05QfHeiY0
10月1日というちょうど半期が終わったタイミングというのがなあ
なんかバグってそう
2020/10/06(火) 03:50:06.80ID:v1gndF1n0
>>459
それは、東証の提示した取引再開プロセスに対応できない各証券会社の組織やシステムが悪いと見ることもできる。

>>443
が既に指摘してるけど、市場とプレーヤーを合わせたシステム全体の責任主体とか意思決定とか明確じゃないのでは。
再起動して後場から開けなかった責任は東証だけのものかと。
2020/10/06(火) 03:59:37.00ID:StsP75E40
優子は物理的にHDD の破壊に成功している
2020/10/06(火) 04:04:58.35ID:vOAejtaK0
デュプレックスで本当に機能してるシステムなんてあるのかね
大概、切り替わらずシステム障害になるわな
2020/10/06(火) 04:24:31.63ID:UNTFYioK0
仮想化せえよ
471ハッチー(東京都) [CN]
垢版 |
2020/10/06(火) 04:26:03.58ID:ekRMZ3/V0
>>467
東証が提示した取引再開プロセスが前もって取り決められていてそれに対応出来なかったのなら、証券会社に瑕疵があったのかもしれませんが、そんな事実は無いようです。東証はプロセスについて説明したとあるので、取り決め以上のプロセスがあったと見るのが妥当ではないでしょうか。
その場合、即座に対応出来ない証券会社が悪いというのは少々乱暴だと思います。
2020/10/06(火) 04:29:06.31ID:XBjMdYjl0
東証は全銘柄売買停止したくせに変な出来情報をFLEXで送った原因もちゃんと発表しろよ、そのせいでリセットするしか選択肢なかったんだろ
473しんちゃん(岡山県) [IN]
垢版 |
2020/10/06(火) 04:36:31.45ID:RUT+FIaK0
>>11
あのバカ記者大集合の東証会見を見たあとだから
これも日経が歪めて伝えてるだけで、富士通はそんなこと言ってねえんじゃねえの?と疑わしいわ
2020/10/06(火) 04:38:14.34ID:wJM6cAAw0
ストレージのメモリの話で1号機2号機ってコントローラーの話かストレージ自体の話かよくわからんね
2020/10/06(火) 04:45:48.68ID:1xgUj2bS0
半田クラック
2020/10/06(火) 04:51:38.62ID:UUsbOQKf0
どうでもいい。国産のメモリーかえ。
海外製品買うな
2020/10/06(火) 05:00:03.53ID:dNKWrb6D0
>>454
これ
普通の人は脳が死んだらもう一つの脳に切り替わるけど今回は失敗した、ということ
2020/10/06(火) 05:00:04.68ID:8c26Idy10
>>62
多分そんな感じだったんだな。
半死状態でエラーが出ないと切り替わらない設計?
主系が即死状態で「だんまり」になったので待機系は異常を感じず、切り替わらなかったのでは?
2020/10/06(火) 05:06:02.49ID:nujq6VbO0
ブレーカ落とせば済んだ話だろ
2020/10/06(火) 05:11:58.67ID:8c26Idy10
>>303
そんな気がしますね
2020/10/06(火) 05:12:39.60ID:7me/vTU70
ftサーバにしとけよ
482ハッチー(東京都) [CN]
垢版 |
2020/10/06(火) 05:25:42.59ID:ekRMZ3/V0
https://www3.nhk.or.jp/news/html/20201006/k10012649571000.html

単なる設定ミスだったとさ
2020/10/06(火) 05:26:30.10ID:tpP4zXqw0
>>440
SEかCE
2020/10/06(火) 05:26:36.97ID:F28Xaq7W0
安いサーバーメモリ積んでたんだろ

DRAMも壊れやすいのあるからな
2020/10/06(火) 05:28:14.06ID:tpP4zXqw0
>>482
systemwalkerはそんな設定項目なかったからアップデート速攻して対応したんでしょ。
486赤太郎(東京都) [CN]
垢版 |
2020/10/06(火) 05:30:39.39ID:/I5ONOZr0
想定外だもん、しょうがないじゃん。
2020/10/06(火) 05:30:56.14ID:tpP4zXqw0
>>484
ETERNUSでしょ、メモリトラブルにものすごく敏感に反応するし活性交換もできる。
これか、この前のシリーズでしょ。
メモリを活性交換できる引き出し付き。
https://www.fujitsu.com/jp/products/computing/storage/disk/eternus-dx/dx8900/
2020/10/06(火) 05:32:19.13ID:8c26Idy10
>>434
複数のプロセスで仕掛かり中の処理が死ぬと、どのデータを生かし、どの処理を戻すかログと処理フローを1つ1つ確認しながら待機系に切り替えるから、なかなか自動では難しい。
400台もサーバーがあると動いているプロセスも膨大だから大変だろうね。
「ヤバイ、そろそろダメ」見たいなワーニングが出ているとタイミング見て切り替えは楽だけどね。
2020/10/06(火) 05:33:39.20ID:0FhJnQIi0
>>22
前の人が確認したからヨシ!
490なるこちゃん(ジパング) [CA]
垢版 |
2020/10/06(火) 05:38:59.10ID:GVF+jiFl0
ディスク1号から2号に切り替わらなかった→ダメシステムだがわかった
即座に手動で切り替え出来ない→2号さんほんとにいるの?

手動で切り替え出来ない時点でバックアップないだろ
2020/10/06(火) 05:41:17.59ID:0FhJnQIi0
>>294
機械は必ず壊れる前提で危機管理しないといけない
あんたのようにその理念が間違ってるから日本はいつまで経ってもでかい規模のシステム運用で失敗する
わかるだろと他人に求める前に自分がダメなことやってると悟れ
2020/10/06(火) 05:47:43.42ID:fXRnEGtg0
壊れたんだか壊れてないんだかわからないやつが1番怖い
2020/10/06(火) 05:51:56.75ID:X8UI+QMD0
>>355
どんな予測変換になってるんだよw
494こうふくろうず(埼玉県) [ニダ]
垢版 |
2020/10/06(火) 05:53:35.20ID:0HpaR7Py0
ハードディスクにメモリ故障を検知する機能なんてあんの?
元々そんなもんないなら全世界的な問題だぞ
2020/10/06(火) 05:54:03.88ID:X8UI+QMD0
RAMの問題だったん?
2020/10/06(火) 05:55:51.86ID:THj+N9bA0
メモリなんて初期不良がなければ壊れることなんかないだろ
2020/10/06(火) 05:55:53.62ID:F28Xaq7W0
>>492
だな、物理的にとかいってる奴が一番こわい
2020/10/06(火) 05:59:12.30ID:i0YMzn0E0
そんなんだからIBMにやられんだよ
2020/10/06(火) 06:05:51.47ID:UQ/3UGF40
切り替えられるときじゃなきゃ切り替えられない。
500ポリタン(神奈川県) [US]
垢版 |
2020/10/06(火) 06:12:43.39ID:BrlMHpr/0
>>457
実際には
運用担当者が上司にひそひと報告、上司は眉根に皺寄せ何やら指示、あたりは不穏な雰囲気
富士通から到着したSEが電話して、応援が次々と駆けつけ、時間の経過とともにその数が増える
こんなじゃなかったかなあ
2020/10/06(火) 06:15:28.89ID:Ndtvjzdh0
ソフトかハードかでも違うだろうけどIT業界に携わってる人ならこの説明で納得出来るものなの?
金融インフラ系ってこういうのにも厳しいイメージがあったわ
2020/10/06(火) 06:16:05.78ID:1TWq+1Nh0
つまり
アンパンマンの新しい頭の品質が悪い可能性を考慮してなかったと
2020/10/06(火) 06:16:42.03ID:nvpfpfZo0
避難訓練みたいに時間決めて運用中でもバックアップサーバーに切り替わるか確認できればいいんだろうけどな
無理だろうな
2020/10/06(火) 06:22:35.39ID:fJnO+Dcm0
メモリ壊れると1号機停止して2号機への切り替えが出来ないって事?構造上の問題やな、設計ミス。
505もー子(東京都) [CN]
垢版 |
2020/10/06(火) 06:22:36.65ID:gV1P0LUL0
汎用機ならだめだわ
そんくらいの実験もしないでリリースとか
506もー子(東京都) [CN]
垢版 |
2020/10/06(火) 06:22:59.91ID:gV1P0LUL0
>>203
するけど?
507キタッピー(東京都) [ニダ]
垢版 |
2020/10/06(火) 06:24:11.27ID:AF1UiEg/0
メモリって壊れるんだ
CPUとメモリは壊れないと思ってたよ
2020/10/06(火) 06:24:42.45ID:AF1UiEg/0
↑もちろん定格運用でって話で
2020/10/06(火) 06:24:43.52ID:fJnO+Dcm0
でもこれ絶対、以前に気づいた技術者居たよな。上に報告しても嫌な顔されて無視される。
2020/10/06(火) 06:25:07.34ID:oCoAgUHL0
趣味レーター全盛の時代に喝
511省エネ王子(東京都) [ニダ]
垢版 |
2020/10/06(火) 06:26:02.35ID:5aaIxFXe0
>>509
そういう風土なんだろうね
2020/10/06(火) 06:29:56.54ID:ZJQB/2/f0
OTでの漏れでもあるし東証の落ち度でもあるんだがなぁ
2020/10/06(火) 06:32:26.16ID:nvpfpfZo0
>>502
アンパンマンの餡子がだんだん劣化することを考慮してなかった
それに餡子が腐っても見た目は変わらないからバタコは新しい顔を投げなかった


>>504
たぶんハートビートLAN が普通に通信できるからだと思う
2020/10/06(火) 06:35:47.22ID:Vnb6ZHXa0
設定値を変えてから正常に稼働しているのをテストしてるから
単純な設定ミスとテスト漏れだけど
どういう言い訳をするのか力の見せどころだねw
2020/10/06(火) 06:38:07.10ID:qotov86z0
全富士通の顧客はちゃんとメモリの破壊テストをやってるか確認した方がいいな
2020/10/06(火) 06:38:29.86ID:jgQ5sdN20
もうサムソンのハードディスクにしようぜ
2020/10/06(火) 06:38:42.70ID:3RWSNczK0
銀行の機関システムのリプレースでクラサバ担当したが、メモリの物理破壊なんか試験してねーなw
518火ぐまのパッチョ(福岡県) [MT]
垢版 |
2020/10/06(火) 06:42:02.25ID:zwcu0GUy0
検知できるよう修正したら、また止まりそうw
519ポリタン(神奈川県) [US]
垢版 |
2020/10/06(火) 06:42:07.41ID:BrlMHpr/0
>>507
メモリは壊れにくいが、壊れた時、原因がメモリとつきとめるのは大変です
520めろんちゃん(福島県) [US]
垢版 |
2020/10/06(火) 06:43:04.96ID:a6qoH/B80
原発と同じだな
メルトダウンはしないから爆発も起こらない
2020/10/06(火) 06:44:38.44ID:+cvmPx8z0
物理的に壊れたって、まさか5chでも見て茶でも吹いたのかね
522モバにゃぁ?(埼玉県) [US]
垢版 |
2020/10/06(火) 06:45:01.18ID:N7fMNX3R0
NECも駄目なんだよ会社の運用システムで
HDDが2個有るから1個故障しても
大丈夫ですと言っていたのに1個故障したら駄目だった
2020/10/06(火) 06:47:26.81ID:1TWq+1Nh0
>>513
最近平和だったんだなぁ
あんこが劣化するって相当長い事変わって無かったって事だもんな
…逆に僕の頭をお食べ、する相手が居なかったのかと思うろ
ジャムおじさんに何かあったのか勘ぐってしまうな
524みらい君(神奈川県) [ニダ]
垢版 |
2020/10/06(火) 06:47:38.40ID:BAXbfEhK0
物理的に破壊しちゃったら元に戻せなくね?
2020/10/06(火) 06:48:40.69ID:X5f5XD6J0
>>1
富士通を支持する
がんばれ
2020/10/06(火) 07:01:21.72ID:jcE1qZFn0
こんな会社に税金流すなよ
2020/10/06(火) 07:04:04.92ID:Gav5Vgu20
これを批判するってのはクラスタ組んだ事もなけりゃエンタープライズのSAN機器使った事もないの丸わかりなんだよなw
2020/10/06(火) 07:06:11.83ID:+xOYJ4B80
>>4
普通物理的に負荷掛からんだろ
サーバ持ち歩くんか?
2020/10/06(火) 07:11:54.70ID:8xRbpbkg0
航空機が突っ込んできたときも考えてテストしとけよ
2020/10/06(火) 07:15:49.54ID:btwCArzr0
>>489
実際は誰も確認してないけどヨシ!なんだなぁ
チェックではなく記入漏れのないチェック表を完成させるのが目的になってる
2020/10/06(火) 07:40:42.25ID:BTIKFoYt0
>>501
するわけない
メモリ異常なんて「読み書きが正常終了しない」時点で
バックアップ切り替えに移行すべきで
メモリを物理的に破壊してテストする必要なんて
まるでない、読み書きできないのが物理破壊を内包してるんだから
532アイミー(大阪府) [KR]
垢版 |
2020/10/06(火) 07:43:31.43ID:1ZdH/T8n0
>>7
そんくらいは考えてる
ケーブルとかディスクを抜く系は実施する

メモリとかCPUを稼働中に外す試験までは、、
533ぴょんちゃん(奈良県) [US]
垢版 |
2020/10/06(火) 07:46:44.98ID:LAbuixF30
設定ミスだって?!!
テストシナリオもダメダメ
設定チェックもダメダメ
本当に後進国になったなあ
情けなさすぎ
2020/10/06(火) 07:47:10.39ID:kTk2WuTY0
フジツウさん!
535ぴょんちゃん(奈良県) [US]
垢版 |
2020/10/06(火) 07:48:08.22ID:LAbuixF30
>>509
リークすべき
536ぴょんちゃん(奈良県) [US]
垢版 |
2020/10/06(火) 07:50:11.62ID:LAbuixF30
で、日本だから
誰も責任取らないんだよ
富士通も東証も監督官庁の金融庁も
2020/10/06(火) 07:52:25.84ID:DptLTndG0
やっぱインフラみたいなのはNECだよな
538リッキーくん(埼玉県) [KR]
垢版 |
2020/10/06(火) 07:52:35.20ID:Hu0qAGyd0
ダメです!
動きません!!
539DD坊や(茸) [CA]
垢版 |
2020/10/06(火) 07:54:15.22ID:Ccgb8R+A0
>>532
やってるとこねーだろ
2020/10/06(火) 07:56:04.81ID:lKR28c3O0
>>99
ゲームと一緒にするなよ、アホかよ
2020/10/06(火) 08:00:13.70ID:jcE1qZFn0
>>538
ちゅいーん
2020/10/06(火) 08:04:18.42ID:iygS6XMr0
>>537
どうかなあ
富士通は自社でアフターサービスしないって聞いたことはあるけど
543さかサイくん(東京都) [ZA]
垢版 |
2020/10/06(火) 08:11:21.61ID:0mTu6pFc0
叩いて壊すテスト?
落としてみたり?
2020/10/06(火) 08:11:38.51ID:/6dqmllK0
>>536
東証の会見で責任は全て東証にあるって明言していたぞ
2020/10/06(火) 08:12:09.58ID:fGZD765Q0
メモリが壊れても故障扱いしない機器の設計が誤っているのでは?
2020/10/06(火) 08:13:20.42ID:8mlj9Gdg0
すげー当たり前な事だけど物って劣化するんだ
2020/10/06(火) 08:13:22.54ID:2P+SMquL0
高かろう悪かろうの典型になってきたな国産品
548都くん(山梨県) [CN]
垢版 |
2020/10/06(火) 08:14:05.07ID:Vr3pwyJ40
メモリー用パソコンのハードが、ハッカーやテロで物理的に壊されたわけではない?
2020/10/06(火) 08:15:59.98ID:kmvG/mW90
サムスン使ったバチだな
550りそな一家(大阪府) [US]
垢版 |
2020/10/06(火) 08:20:59.20ID:bZm2LVh40
顧客に納品する環境で物理破壊テストなんてしないだろ。

想定通りの動きをする事が確認出来たとして、その後、
交換したパーツが正常に動く事をどうやって保証する?って話になるし。

そういうのは、製品として保証するもんだろ。
2020/10/06(火) 08:21:22.59ID:0SRBAT6t0
>>22
https://i.imgur.com/AS8GKok.jpg
552バザールでござーる(兵庫県) [MX]
垢版 |
2020/10/06(火) 08:22:42.88ID:H8txnvSt0
こう言うデカいシステムのメモリーとか車くらいバカでかくてクレーンで付け外しするんだろ?
553火ぐまのパッチョ(福岡県) [MT]
垢版 |
2020/10/06(火) 08:34:27.80ID:zwcu0GUy0
手動でバックアップ機に切り替えられないものなの?
2020/10/06(火) 08:36:16.93ID:A5UgMr5u0
いわゆるWindows ME 的なブルーバックですか?
2020/10/06(火) 08:39:24.85ID:0pTqIVU+0
>>553
装置切り替えても現在のデータが正しい保証はないのでやらないパターンもあるので
2020/10/06(火) 08:40:46.41ID:dYKQ7fFY0
ディスクのメモリとか1号機2号機とか書くからわからなくなる

ストレージ1号機2号機なのか、ストレージのコントローラー1号機2号機なのか

コントローラーは普通に冗長構成だし、コントローラー1台のメモリ故障でストレージ1号機から2号機への
切替なんて普通は起こらないからな
2020/10/06(火) 08:54:05.57ID:A5UgMr5u0
ただ単に9:00に間に合わなかっただけだろ?
2020/10/06(火) 08:56:29.85ID:QZADDSDl0
Never Stop言ってる割にそこらの企業並みの意識じゃん
2020/10/06(火) 08:57:00.37ID:jLdhG2EC0
>>158
EMS試験だっけ
560モモちゃん(ジパング) [JP]
垢版 |
2020/10/06(火) 09:09:26.27ID:dMacRVd00
>>507
CPU壊れるぞ
パーツを順番に買い変えて原因を探ってたら最後にCPUが残った
561ポコちゃん(東京都) [US]
垢版 |
2020/10/06(火) 09:11:49.46ID:4IRJ2c6D0
システムエンジニア「そんな試験するわけねーだろ」
エンジニア「そんな試験もしてなかったのかよ」
2020/10/06(火) 09:14:10.00ID:T75hptR50
東証「何を見てヨシって言ったんですか?」
563ぴょんちゃん(奈良県) [US]
垢版 |
2020/10/06(火) 09:14:22.80ID:LAbuixF30
>>551
これだろ、マジで
2020/10/06(火) 09:18:08.87ID:YVfwkl/70
>>11
ほんこれ
2020/10/06(火) 09:18:49.40ID:r2S4u11t0
小渕を見習えや
2020/10/06(火) 09:19:02.84ID:r2S4u11t0
ヨシッ
2020/10/06(火) 09:22:24.10ID:CQribjaz0
フクイチから何も学んでいないな
2020/10/06(火) 09:26:19.42ID:zJUqIcD20
なんか社長さんがバカっぽかつた
小林よしりんみたい
2020/10/06(火) 09:27:53.80ID:ERw+RAt/0
メモリが完全に壊れればフェイルセーフも動くもんだけど
メモリが壊れかけは一番やっかいでフェイルセーフそのものを誤動作させたりするからな
2020/10/06(火) 09:31:28.02ID:46zbJ+od0
実際に壊さなくても想定したエラーコードは返すやろ?
抜けてたのか。
571ハービット(空) [EU]
垢版 |
2020/10/06(火) 09:41:26.99ID:X0J+H5cc0
冗長性ゼロで渡すの草生えるんだが
2020/10/06(火) 09:46:33.73ID:tlTMwRyO0
>>570
想定されるエラー文章は何百もあるから漏れてるんだろう
573りそな一家(神奈川県) [ヌコ]
垢版 |
2020/10/06(火) 09:47:38.77ID:Mfay45mX0
読売の1面に設定ミスってデカく書かれてたぞw
2020/10/06(火) 09:50:18.68ID:QZADDSDl0
器機の物理的な故障するケースも当然想定してるべきじゃねーの?
575にっくん(東京都) [KR]
垢版 |
2020/10/06(火) 09:50:59.22ID:XPuVcHro0
データの流れを感じ取れば手動で切り替え可能だろ。
技術者の練度が足りないだけ。なんでも自動化すればいいと思ってる屑
2020/10/06(火) 09:53:42.46ID:k7oT/kwM0
>>507
熱で断線とかじゃないのかね?知らんけど。

>>569
断線しかけで不安定になって、正常と異常をランダムに繰り返したので、わけが分からなくなって目を回したとか?
2020/10/06(火) 09:54:52.87ID:g6Bu96Cw0
故障にも色々あるけれど今回のメモリ故障は全くメモリアクセスが出来なくなるような故障だったの?
ニュース見てもストレージが機能不全になったとは書いてあってもダウンしたとは書いてないから
なんとなく半死に状態だったんじゃないかと思ってるけど
2020/10/06(火) 09:57:18.49ID:k7oT/kwM0
>>573
ハード異常発生時の対応の設定ミスとかいう意味では?
要するにバカ穴が開いてたのを見落とし。
579りそな一家(神奈川県) [ヌコ]
垢版 |
2020/10/06(火) 09:58:48.14ID:Mfay45mX0
多重下請け構造で適当な仕事したのが原因でしたwww

東証、終日取引停止のシステム障害は設定ミスが原因と発表
https://news.tbs.co.jp/newseye/tbs_newseye4094759.html

 今月1日に発生した「終日取引停止」という問題をめぐって、
東京証券取引所は障害の原因がシステム上の設定ミスにあったことを明らかにしました。

 東証は会見でシステムを納入した富士通との検証を踏まえ、障害の直接的な原因について、
「記録装置が故障した場合に予備機に自動的に切り替えを行う設定がされていなかった」と説明しました。
2020/10/06(火) 09:59:18.34ID:k7oT/kwM0
>>577
間欠的にランダムに異常が出るタイプとかね。
遭遇したことがあって、絶妙の接触不良と判明。
581ゆうさく(大阪府) [CN]
垢版 |
2020/10/06(火) 09:59:43.71ID:TOgtjDLh0
原発を爆発させる国はやっぱ違うな
582おたすけ血っ太(香川県) [CN]
垢版 |
2020/10/06(火) 10:00:51.50ID:vOt+v/rc0
どこのメモリよ??
Samsung!????
2020/10/06(火) 10:07:01.61ID:PhIFPl8S0
後知恵で好き勝手言ってるけど、じゃあ稼働中のシステムのメモリのエラーはどうやって検出すればいいか言ってみろよ

メモリ引っこ抜く?で?何が起こるか書いてみろよ
584ぶんぶん(神奈川県) [US]
垢版 |
2020/10/06(火) 10:07:49.37ID:IXzORvOC0
>>579
なんか発表できないものがいろいろ絡んでて
結局落としどころがポカミスヒューマンエラーにしましょうお手打ちシャンシャンって気がするが
2020/10/06(火) 10:07:53.14ID:fXRnEGtg0
>>577
処理が遅延してたらしい
メモリからディスクに書き切るまで待ったんじゃないの?
586りそな一家(神奈川県) [ヌコ]
垢版 |
2020/10/06(火) 10:09:46.42ID:Mfay45mX0
>>584
富士通ならその可能性もある
2020/10/06(火) 10:09:47.32ID:k7oT/kwM0
>>579
その記事は怪しい。
「全く」と受け取れる書き方になってるけど、それはなかろう。
切り替えの条件に複雑で微妙な不備があったのを、説明者が普通に意味が通じる説明をしてなくて、記者が意味が分からない部分をすっ飛ばした臭い。

そういう伝聞ミスの類いはありふれてるから要注意。
東芝のクレーマー事件も、それが一因になってる。
2020/10/06(火) 10:10:01.39ID:fXRnEGtg0
>>583
ECCメモリ
I/O返さなくなる
2020/10/06(火) 10:14:19.32ID:ERw+RAt/0
>>576
断線とかじゃなくてもメモリセルの動作が不安定になってたまに化けたり
アドレスデコーダなんかが誤動作してメモリセルの指定がおかしくなったり
2bitまでならECCで検出できるけどできないパターンも稀にあるし
ECCでエラー訂正・検出までは発生させてもそのエラー処理をやる
プログラム部分がメモリエラーの影響で誤動作すると処理が破綻する
とかメモリエラーは本当に厄介なもの
2020/10/06(火) 10:14:38.59ID:tlTMwRyO0
>>583
だから稼働前にやるんだろ
後遺症なく簡単に抜き差しできるなら物理的にやるのが理想
2020/10/06(火) 10:14:57.22ID:k7oT/kwM0
>>583
切り替えるだけのことで、それは日常茶飯的に作動して、だから何年も持ってたんじゃないか?
不安定になった場合の対応に不備があって、絶妙の不安定が生じて判定ミスとか。
592801ちゃん(神奈川県) [ニダ]
垢版 |
2020/10/06(火) 10:16:48.61ID:8WxiCL250
物理的に全てのメモリを試験するのは難しいのでは?
別の回避手段を考えないと。
2020/10/06(火) 10:17:55.28ID:k7oT/kwM0
>>585
正常と異常が極端な短時間でランダムに繰り返されて正常時だけ伝達されたら、無問題時より遅延が出るな。
594マツタロウ(神奈川県) [US]
垢版 |
2020/10/06(火) 10:18:55.06ID:SwlPsYsW0
シリコンディスク神話崩壊
2020/10/06(火) 10:20:19.33ID:7jQzruHN0
富士通で働いた事あるけど、下請けが入社3か月くらいで言語おぼえさせたはいいけど3年でSEの入れ替わるようなスキルの無い底辺会社ばかりだからなあ
2020/10/06(火) 10:20:55.27ID:6NXjyGWR0
>>539
ホットスワップなんて、2000年頃からSUNでやってるんだが?
597スイスイ(東京都) [DE]
垢版 |
2020/10/06(火) 10:23:17.95ID:a2MZ1gNC0
リアル現場猫
2020/10/06(火) 10:23:41.89ID:49Q/aQUZ0
物理的な故障は検知出来ないんだな
2020/10/06(火) 10:23:48.96ID:k7oT/kwM0
>>589
素直な断線じゃなくて、断線しかけでランダムに半端なおかしな状態が繰り返された、とか。

>>592
そのために規定信号を入れて反応で判定するのが、ランダムな不安定で目を回したとか。
2020/10/06(火) 10:27:40.45ID:k7oT/kwM0
>>598
できるどころか、のべつやってるでしょ。
601ティーラ(福岡県) [FR]
垢版 |
2020/10/06(火) 10:36:59.32ID:TtFsT1Eh0
電源抜くとかでも良いやろ?
602ティーラ(福岡県) [FR]
垢版 |
2020/10/06(火) 10:38:12.74ID:TtFsT1Eh0
>>598
そんな問題でなくパソコンごとfatal errorの時は電源切れば良いだけ
2020/10/06(火) 10:42:37.33ID:fokU5HRI0
証券取引システムとか全ての不具合を想定して構築しないといけないのに
原発は爆発させるは年金情報は消失させるわ証券取引システムはダウンさせるわとんでもないな
604パピプペンギンズ(東京都) [IT]
垢版 |
2020/10/06(火) 10:43:02.43ID:9dXBmdk00
普通抜き取りで破壊検査をしてたはずだが…
今は抜き取りなしで検査工程飛ばしてるのか?
2020/10/06(火) 10:43:55.07ID:7jQzruHN0
>>601
> 1号機が何らかの理由でダウンした場合に2号機に自動で切り替わることは、システム稼働前のテストで設計・開発した富士通とともに確認していた。

そういう試験はしてる


>>602
もしかしてパソコンで動かしてると思ってる?
2020/10/06(火) 10:44:55.56ID:z//epL1j0
>>604
ちげーよ
メモリーが物理的にダメになった時のソフトウェアの動きを把握出来て無かったって事だぞ
2020/10/06(火) 10:46:00.54ID:Yc6zOcCm0
ワローズならしょうがない
2020/10/06(火) 10:47:08.81ID:z//epL1j0
>>600
チェックサムビットなんて経費の無駄だと言う風潮
2020/10/06(火) 10:48:45.88ID:bsHOVpYr0
これが初めての不具合なら「仕方ない。次から気をつけてくれ」になるかもしれないが
2年に1回くらい市場停止させてない?
みずほ銀行といい影響の大きいところがシステムでやらかして平気な顔をしてるのはなんなの
反省とかしないのかね
2020/10/06(火) 10:50:14.40ID:dbtO4q2Q0
>>608
サーバーだったらいらないと言ってもデフォでつくるんじゃない?
つか今回のシステム障害だって本来は障害が起きた時点でそれを検知して切り替わるはずの設計になってたんだと思うんだけど
それが切り替わらなかったからもんでいになってるわけで
2020/10/06(火) 10:53:24.19ID:QDsEW/nT0
>>459
日経の記事読むと、再開するにはシステムを再起動させなきゃいけない
ただ再起動させるとそれまでに受け付け済みの注文が失効してしまうという事で再開断念したらしい
2020/10/06(火) 10:55:14.82ID:ohXcRTcg0
ドリル、槌が最強。
613ゾン太(宮城県) [DE]
垢版 |
2020/10/06(火) 10:55:54.94ID:xwLODFQq0
ある企業に訪ねていったら
社長室へどうぞと案内されて挨拶したら
社長はパソコンいじってたらしく
電源すぽっと抜いて立ち上がったよ
いつもあれなんですよと
あとで部下が言い訳してた
パソコン黎明期のころの話し
2020/10/06(火) 10:57:40.88ID:sx9UpiMs0
>>606
半死じゃ待機系に移行しない
あらゆる障害でおこりえる
2020/10/06(火) 11:06:20.34ID:SZMLEI3f0
普通、時々ダミーの取引混ぜて流して総合的な正常性チェックするよね、それもやってないとか、、
2020/10/06(火) 11:12:23.89ID:BbigSpoa0
日本がIT後進国なのは「東証や富士通でシステム障害」が起きるからではなく
それを正当に評価、理解できない人(主に経営者)が多いから

そしてそういう人ほど「日本がIT後進国」であることを問題視してる素振りを見せているのがね
やってらんないわ
617ラジオぼーや(ジパング) [US]
垢版 |
2020/10/06(火) 11:12:29.93ID:DpCHhnzu0
メモリは想定外にしても復旧作業遅すぎね?
2020/10/06(火) 11:15:07.11ID:fGZD765Q0
復旧は翌日に持ち越したんだろ?
2020/10/06(火) 11:16:52.73ID:1aeM8gbr0
試験出来ないなら、代替としてどうやって担保したのか問われると思うけど
2020/10/06(火) 11:30:03.35ID:mxWregEd0
>>20
ホンマそれ
バックアップに切り替わらなかったのと冗長性の甘さが原因なのに、丸く収めるために的外れな解決案出して余計な手間だけ増やす
2020/10/06(火) 11:34:05.39ID:tlTMwRyO0
>>616
経営者なんてITに関してアホなやつしかおらんし
2020/10/06(火) 11:35:31.37ID:RIG1gfcl0
>>80
あるある
外資メーカー製品の動作がおかしい商社に言っても「調査依頼かけてるが外資はここに限らず動きが遅い」と責任感も無い回答

結局再現性100%になる条件特定とパケットレベルでの調査を自分でやってやっとバグと認められた
2020/10/06(火) 11:38:14.50ID:swKYSDYM0
ハード障害って自己検知かタイムアウトで正副切り替えるもんじゃないの?

物理破壊なんてしなくても出来そうだけど
2020/10/06(火) 11:42:13.68ID:bNb5dHJX0
現用系がディスクエラー出すと切り替わるけど、突然死するのは想定外でした、みたいな?
625損保ジャパンダ(ジパング) [IR]
垢版 |
2020/10/06(火) 11:44:22.82ID:MbG1NIp+0
>>579
富士通は、これから地獄絵図だな。

「ウチに納めてもらったシステムは大丈夫なの?全部再確認しろや!」ってなるぞ。
2020/10/06(火) 12:19:20.23ID:PnuRrVmd0
>>36
検証で壊れたくらいで始末書なんだ
2020/10/06(火) 12:20:41.30ID:fGZD765Q0
>>626
だって1本150万のdiskだもん
2020/10/06(火) 12:25:09.18ID:8Mgdw5Az0
地球がガンマ線バーストに晒された場合を想定した試験もやっとけよ
629チップちゃん(光) [US]
垢版 |
2020/10/06(火) 12:45:54.54ID:tOTBLk810
>>628
そんなもん来たら人類滅亡確定だからやらなくてよくね?
2020/10/06(火) 12:46:26.05ID:g8eG6lZD0
>>576
普通にノイズやらなんやらで ESD ちゃうか?

どうにも理由が判然とせんというかなんというか。

日経の解説記事やったかによると、納入前の相互監視ラインの遮断によるフェイルオーバーは
機能していたということらしいが、そらなら監視系による応答なしのタイムアウトなんかは
ちゃんと検知していたはず。

設定ミスでアレイシステムのメモリ異常の検知が働かない状態だったということやが… ホンマか?
なんか、動作中のメモリ異常検知の仕組みを用意しておらず、製造、サービスダイアグでやっと
分かったってな気がせんでもない。
2020/10/06(火) 12:53:52.61ID:fWtwIoT30
メモリが壊れてるのにそれを必要とする処理がエラーしなかったって事は成功する前提になっていたって事だろう

何か異常は起きていたからシステムが動かなかったわけで
632トラムクン(東京都) [ニダ]
垢版 |
2020/10/06(火) 12:54:33.03ID:uotCeYik0
米ベンチャー企業を採用し、設計・運用・保守を自前で実施した東証の設計チョンボ‼
そもそも、メモリー故障が切り替え要因に入っていなかった・・・
#今月1日に発生したシステムトラブルについて東京証券取引所は、売買の情報を保存する装置の一部が故障した際に、自動的にバックアップに切り替わる設定になっていなかったと明らかにしました。
https://www3.nhk.or.jp/news/html/20201006/k10012649571000.html
#基準値段など基本情報を格納するディスク内のメモリーが壊れた際に、予備のディスクに自動で切り替えるような設定になっていなかったという。このため相場情報を配信するシステムが動かなかった。
https://www.nikkei.com/article/DGXMZO64626220V01C20A0I00000/
●東証がITシステムに初採用した「謎の米ベンチャー企業」の正体(2017/9)
https://ascii.jp/elem/000/001/546/1546864/
●日本の証券・金融市場を支えるインフラ基盤にNutanixを採用
https://www.nutanix.com/content/dam/nutanix/ja/resources/case-studies/cs-jpx-tokyo-stock-exchange.pdf
2020/10/06(火) 12:55:25.39ID:fWtwIoT30
メモリ容量が想定より小さい状態にしてテストしたら故障させなくてもいいだろうけどな
2020/10/06(火) 12:56:38.27ID:fWtwIoT30
実際に物理破壊しなくても故障時のテストはできるだろう
635コロドラゴン(福井県) [GB]
垢版 |
2020/10/06(火) 12:58:19.71ID:sgrU44WM0
壊すテストて象にでも踏ませるのかよ
2020/10/06(火) 12:59:18.71ID:4wnV3kGC0
>>194
俺もなったことがあるが人間的な表現をすると確かに「気まぐれ」だったな
何かのアプリのせいかと思ったり同じく不安定といえば電源かと思ったり
もちろんメモリもテストするんだが最初は手早くやろうとするから短い奴だとOKだし

んで最後にメモリモジュール引き抜いて安定動作して、こいつだったのかと
2020/10/06(火) 13:00:36.95ID:fWtwIoT30
>>78
サーバとストレージは普通別じゃないの?
ストレージは同じものを使ってないと最新データじゃなくなるし
処理システムは同じものを動かせばいいから
仮想マシンでも良いし
2020/10/06(火) 13:02:21.38ID:rH8rGdFC0
今って下請け技術者にすごい人っていないの?
元請いらねえじゃんみたいな人
2000年前後はそういう人たくさんいたけど
2020/10/06(火) 13:02:46.02ID:fWtwIoT30
>>64
物理破壊はしないけどそれを想定したテストはする
どのレベルの開発かによっても違うけど
640ラッピーちゃん(愛知県) [US]
垢版 |
2020/10/06(火) 13:05:27.10ID:swWa30at0
現物を物理破壊検査していたら永遠に納入検査が必要じゃん
2020/10/06(火) 13:08:58.26ID:NuMPEMWi0
ECC-RDIMMはビット反転したくらいなら補正してくれるけどDRAMがゴソッとエラーの場合はモジュール交換になるし
それでサーバー止まるのは良くあることなんだが・・・
642レンザブロー(神奈川県) [ニダ]
垢版 |
2020/10/06(火) 13:09:45.69ID:KERAFPqK0
東京証券取引所を物理的に破壊する試験を行なっていなかった
643ペーパー・ドギー(大阪府) [US]
垢版 |
2020/10/06(火) 13:12:32.76ID:9ZRqG4FW0
>>375
それは無いわ。トランザクションンログは全部一旦REDOログに書き出されるから。
そのREDOログは勿論共有ディスク上に存在してるから切り替えても問題ない。
逆にそうなっていないのであれば信じられないような稚拙な設計してる。もしそうなら
今回の事故以前に取引が成立しないか、約定しても約定内容が消えてるとかのトラブルが発生してるはず。
2020/10/06(火) 13:12:33.63ID:fWtwIoT30
>>131
メモリ壊れたら何かの処理がエラーになってるはずでそれを見逃しているからフェイルオーバーできなかった
2020/10/06(火) 13:15:21.46ID:fGZD765Q0
>>643
そのログの信頼性がメモリ破壊によって担保できていなかったのでは?
646ペーパー・ドギー(大阪府) [US]
垢版 |
2020/10/06(火) 13:16:36.82ID:9ZRqG4FW0
>>1
これ、1号機が30mmガトリング砲を食らった場合に2号機に切り替わるテストどころか、
宇宙から来た直径30kmの隕石が1号機に衝突した場合でも2号機に正常に切り替わるかのテストもやってないなこの調子では
だいぶ甘いテストしてる。
647トラムクン(東京都) [ニダ]
垢版 |
2020/10/06(火) 13:17:16.41ID:uotCeYik0
そだね。
東京⇔大阪で切り替えるようにしてね。BCP.
648ペーパー・ドギー(大阪府) [US]
垢版 |
2020/10/06(火) 13:17:25.95ID:9ZRqG4FW0
>>645
ログに書き込まれなかったらそもそも約定にならないから破棄してOK
2020/10/06(火) 13:17:49.95ID:fWtwIoT30
>>295
富士通はメーカーもやってるだろう
650ラッピーちゃん(SB-Android) [US]
垢版 |
2020/10/06(火) 13:18:25.36ID:Kblpv7ht0
発電所がダウンしたことまで想定した試験をすべき
あとはネバダ州でテロが発生した状況もテスト項目に加えるべき
2020/10/06(火) 13:18:48.94ID:rDQA/HsT0
> メモリー故障を理由として1号機が機能不全となった場合に、2号機に自動で切り替わらない

問題はこれだろ
652柿兵衛(SB-Android) [ニダ]
垢版 |
2020/10/06(火) 13:20:53.98ID:bhi0N7dA0
RAMが壊れるなんて自作PC組み立てる素人すら知ってるぞ
経費節約等の理由で意図的に手を抜いたとしか思えん
653ペーパー・ドギー(大阪府) [US]
垢版 |
2020/10/06(火) 13:21:02.10ID:9ZRqG4FW0
>>650
運営管理者の嫁が浮気してる事が発覚した場合もな
2020/10/06(火) 13:21:39.65ID:fGZD765Q0
>>648
それじゃ注文を勝手に破棄したことになるから注文者から訴えられる。

再注文してもらう必要があるから翌日復旧としたのはそのためじゃないか?
2020/10/06(火) 13:22:37.78ID:fWtwIoT30
モニタリングして故障する前に事前交換とかして予防ことになるだろうな
2020/10/06(火) 13:23:50.64ID:Uw9mnleo0
CPUが誤計算するかもしれない
657エネゴリくん(東京都) [US]
垢版 |
2020/10/06(火) 13:23:54.58ID:YHT01KmC0
故障モードなんて、想定外のもの可能性を考えたら星の数ほどある。
どこがどのくらいどんなふうに故障・・・影響度合いは?
案-1 もう、東証はバカだと考えてメモリ自身で異次元の冗長化するしかない。
案-2 BCP 不測の事態が発生したら大阪へ切り替える。東京0系、大阪1系運用。アローズが二ついるけど。
658こうふくろうず(埼玉県) [ニダ]
垢版 |
2020/10/06(火) 13:25:33.34ID:0HpaR7Py0
ハードディスクのバッファメモリとか
ハードディスク自体に故障検出機構がないなら
検出不可能だろ
2020/10/06(火) 13:25:56.01ID:mxtUdNeR0
なんか、とにかくマスゴミの反対を行けば正義、富士通をかばえばOK、で思ってるやつ多すぎじゃね?
メモリ故障時に予備に切りかわってないのは設計の意図に反した動きで、何かのバグの疑いが濃厚だろ
2020/10/06(火) 13:26:21.37ID:fWtwIoT30
あるそうちのメモリ壊れたらより大きなレベルで正常動作しない例外を上げてシステムとしては別系統に切り替えたりするだろう
2020/10/06(火) 13:27:39.27ID:4wnV3kGC0
>>659
単に現場で実際に苦労してる人が多いんだと思うが
662ねるね(東京都) [US]
垢版 |
2020/10/06(火) 13:27:41.82ID:IcrdcuE00
世界は関心ないみたい。日本人は神経質になりすぎ、後進国日本なんだからこんなもんだ。
#「東証マヒ」世界がスルー、1日の東京証券取引所の売買停止問題で、見逃せない点がある。外国の関心が低かったことだ。
2020/10/06(火) 13:27:51.50ID:fWtwIoT30
>>424
ロケットの打ち上げとか時刻がズレてるだけで停止する仕組みになっていると思う
664省エネ王子(東京都) [ニダ]
垢版 |
2020/10/06(火) 13:28:03.04ID:5aaIxFXe0
こんな歴史的な障害起こしておいてうだうだうだうだバカかよ
富士通なんてクソは排除してIBMに作り直させろ
2020/10/06(火) 13:30:30.67ID:fWtwIoT30
>>430
メモリ破壊が起きた時に例えばストレージがエラー上げるようになってたらシステムはストレージを切り替えるだろうけど
ストレージがエラーを上げなかったらシステムは切り替えできない
今回は多分ストレージに当る装置も富士通が作ったりしてるんじゃないのかな
666ミルバード(東京都) [US]
垢版 |
2020/10/06(火) 13:31:05.53ID:Lg8ouUpn0
いや物理的かはおいてもエラー出たらアラート出るやろ
なんで検知できんねん
667あどかちゃん(東京都) [US]
垢版 |
2020/10/06(火) 13:31:29.08ID:yMiZNwlg0
米ベンチャー企業Nutanixを採用し、設計・運用・保守を自前で実施した東証の設計チョンボ‼
#今月1日に発生したシステムトラブルについて東京証券取引所は、売買の情報を保存する装置の一部が故障した際に、自動的にバックアップに切り替わる設定になっていなかったと明らかにしました。
https://www3.nhk.or.jp/news/html/20201006/k10012649571000.html
2020/10/06(火) 13:31:29.88ID:ZkS4buJw0
>>203
それはするだろ
669りんかる(奈良県) [CH]
垢版 |
2020/10/06(火) 13:31:33.43ID:bQN33tP30
逆に物理破壊のテストまでしてるシステムなんてあるんか?
金融系でシステムやってたけどそんなテストやったことない

まぁこの記事の言い訳はいつも富士通がしてる言い訳で笑っちゃうけどww
670PAO(千葉県) [CN]
垢版 |
2020/10/06(火) 13:32:05.96ID:HbTjhKFJ0
>>659
マスゴミとお前が低能すぎて理解できないだけで東証は最初の記者会見から
なんらかのバグでメモリエラーが出た共有ストレージが自動で切り替わらなかったことが問題でその原因は調査中だって言ってるんだが
2020/10/06(火) 13:33:25.33ID:rH8rGdFC0
正副の切り替えがスムーズに行かなかったことが問題なんだよね?
2020/10/06(火) 13:33:33.84ID:ZkS4buJw0
>>13
故障したかどうか判定するのも難しいしな
検知できるレベルのものは実装してるだろうしこれで富士通叩くのはちょっとかわいそう
2020/10/06(火) 13:35:08.30
いやいや

最終手段の手動切り替えすら出来ないのは大問題だと思うんだがw
2020/10/06(火) 13:35:22.26ID:Y3XjEAIa0
スタックスネット

ガクガクブルブル
675りんかる(奈良県) [CH]
垢版 |
2020/10/06(火) 13:35:48.73ID:bQN33tP30
この規模のシステムなら
日常運用で1号機から2号機やらDRに切り替えて運用してないのかね
2020/10/06(火) 13:36:16.26ID:fWtwIoT30
ストレージのキャッシュメモリが壊れて処理性能が落ちてシステムが正常に動かせなくなったって事かな?
そしたらストレージは動いているから切り替えはしないのかも
処理時間が閾値超えたらフェイルオーバーするとかしないと
2020/10/06(火) 13:36:26.64ID:tlTMwRyO0
>>638
むしろ元請けがいらないぞ?作れるのは下請けだけだ
下請けにこれらをカバーできる技量持ちがいるかいないかの世界
2020/10/06(火) 13:38:52.66ID:+qXrb4Af0
>>673
手動切替はできるぞ
ただ整合性チェックにべらぼうな時間を要するから
復帰するのは実質全停止時と替わらないってだけ
2020/10/06(火) 14:11:32.68ID:voUfu64f0
>>667
なんだニュータか
なら普通に設定チョンボだな
メモリ障害云々は只の方便だろう
680ライオンちゃん(東京都) [IN]
垢版 |
2020/10/06(火) 14:36:05.05ID:miKEsK3G0
■企業の名はニュータニックス。米オラクル、グーグルなどの出身のエンジニア3人が、2009年に創業したばかりの米国のソフトウエア会社だ。
東証は今回、取引系以外の情報系システムの全てのインフラ部分でニュータニックスの採用を決めた。情報系システムの中には新規上場企業の審査情報や、投資家への情報配信など、重要情報を取り扱うシステムも多くある。デスクトップ仮想化システムを皮切りに、3〜5年かけて全ての情報系システムのインフラに広げていく計画だ。
東証の決断の裏には、これまでは富士通などが担当してきたシステムへの不満がある。
#東証がITシステムに初採用した「謎の米ベンチャー企業」の正体(2017/9)
https://ascii.jp/elem/000/001/546/1546864/

●日本の証券・金融市場を支えるインフラ基盤にNutanixを採用
新たな情報系システム基盤は、Nutanix Enterprise Cloud Platform上でCitrixによるVDI環境を先行して稼働させる計画です。その規模は、およそ2,000ユーザーのVDI環境をプライマリセカンダリ両現用構成で構築の予定です。VDIを皮切りに、上場企業の銘柄管理を担うシステムや投資家等へ情報配信を行うシステムなど、全ての情報系システムを対象として計画されています。最終的には、情報系システムのミッションクリティカルなシステムもNutanix上で稼働させる予定です
Nutanixの場合、設計書はWord数枚程度で、単にパラメーター設定するぐらいで運用できるのです。これまでの運用はなんだったのかと感じるほどでしたと語っています。
https://www.nutanix.com/content/dam/nutanix/ja/resources/case-studies/cs-jpx-tokyo-stock-exchange.pdf
2020/10/06(火) 14:52:07.51ID:g8eG6lZD0
>>666
メモリがこけていると、プログラムが明後日の方向へ暴走することもあって、そうなると
システムはうんともすんとも言わなくなる。

組み込み系のハードをいじったことのあるやつは知ってるやろうが、そういう時のために
ウォッチドッグタイマという仕組みがあって、犬に対して設定時間内毎に頭をなでに
行かないと「ご主人様がこない!ワンワン」とほえるようになっている。

単純なシステムやと、ほえられたら簡単にリセットを掛けて再起動でええんやが、
こういう複雑なシステムやとそうもいかんので、監視系にエラーを投げるとかの
一工夫が必要になる。

富士通の説明やと「設定ミスでエラーを投げるようになってなかった。テヘペロ」という
ことやが…
2020/10/06(火) 15:04:46.29ID:dbtO4q2Q0
>>667
いやいや、富士通が出てるじゃん
それ多分別システムでは?
2020/10/06(火) 15:17:19.43ID:v1gndF1n0
>>638
こういう大きな元請けや発注元からすると、そういう人に頼るのは属人的で良くないらしいな。
下請けとしてもエースは新規の割のいい仕事に回したいし、エース本人もそういうこと言ってくるような現場に長居したくないし。
関係者の思惑が一致してすぐいなくなる。

…え、引き継ぎはどうするって?
資料は作るみたいよ。
同等のエース級でないと読みこなせないけど!
684ぴよだまり(ジパング) [US]
垢版 |
2020/10/06(火) 15:35:48.59ID:i/pIlzm60
>>682
最近PRIMERGYにNutanixのOS載せて販売してるよ
それなのでは
685mi−na(東京都) [ニダ]
垢版 |
2020/10/06(火) 15:47:33.66ID:3Ei8whAk0
ニュータニックスを担ぐ競合他社に商談敗退し、メニュー追加した。
仮にPRIMERGY on NutanixのOS ならベンダーの富士通が設定・保守していただろう。
2020/10/06(火) 15:48:21.36ID:zNHt6nP30
象が踏んでも壊れない!
687カンクン(東京都) [US]
垢版 |
2020/10/06(火) 15:59:26.79ID:RMTM1Id70
>>687
アローヘッドの勘定系は富士通、今回の障害は情報系。
勘定系は正常でも投資家等へ情報配信を行うシステムがダウンしたため混乱をさけるため24時間停止を決めた。
情報系は、ニュータニックス社の仮想化ソフトウェア。ソフトだけでシステム構築できる。配下のPRIMERGYは部品にしかみえない。
688カンクン(東京都) [US]
垢版 |
2020/10/06(火) 16:00:24.50ID:RMTM1Id70
>>682
アローヘッドの勘定系は富士通、今回の障害は情報系。
勘定系は正常でも投資家等へ情報配信を行うシステムがダウンしたため混乱をさけるため24時間停止を決めた。
情報系は、ニュータニックス社の仮想化ソフトウェア。ソフトだけでシステム構築できる。配下のPRIMERGYは部品にしかみえない。
689ブラット君(東京都) [AU]
垢版 |
2020/10/06(火) 16:06:58.16ID:x/SDqckR0
>>682
富士通は今回の障害では機器の納入としか言っていないだろう。情報系システムについては。
勘定系アローヘッドはすべて富士通。
690バヤ坊(滋賀県) [US]
垢版 |
2020/10/06(火) 16:12:04.13ID:kFTN7N5Q0
セレロン430あるからトンカチで叩いてみる
691マックス犬(東京都) [AU]
垢版 |
2020/10/06(火) 16:13:53.69ID:qOeoOwgw0
普通パリティで補正されるし、エラーをOSに投げるし、
再起動すれば起動チェックで弾かれるだろ
起動チェックは通過して、特定の領域が不安定で再起動を繰り返すレアケースなの?
サーバー用XEONスペックで起こりうるかな
その辺のatomやAMD使った安物構成じゃあるまいし

何かあやし
2020/10/06(火) 16:16:40.22ID:JorivQWe0
PC・グラボやゲーム機でもメモリが壊れる場合はあるが
大抵一部が中途半端に壊れてバグったりデータ化け/画面にゴミが出る等しながら動くから
壊れ方・出方によっては動いてるまま故障したかどうか分かりにくいよな…

テストプログラムでも回せば見つかるけども
2020/10/06(火) 16:19:25.74ID:wVXZSYSj0
想定される不具合全部試さないでどうすんのか
694マックス犬(東京都) [AU]
垢版 |
2020/10/06(火) 16:22:05.72ID:qOeoOwgw0
そういや今度はslackサーバーが停止だってね

おかしーなー
大統領選始まったら次々、金融やwebインフラのサーバーが不具合で停止を繰り返してるなー
なんでかなー
2020/10/06(火) 16:22:53.31ID:dbtO4q2Q0
>>692
だから、メモリ故障は本当なら検知されるはずなんだって
そういうメモリ使ってるの。パソコンとは違うの
2020/10/06(火) 16:23:29.82ID:JorivQWe0
続行不能、大幅に狂うような壊れ方ならわかるのに
実際はそうじゃない悩ましいパターンの故障が多い
メモリ故障は本当に厄介

CPUが一部壊れた場合だって同じような事になる可能性がある
負荷掛けた場合や一部の処理でまれにおかしくなるなるものの一部だから分かりにくいとか
大体は動いてしまってて何が原因か悩ましい

壊れるなら明らかな異常や物理的損傷を起こして派手に破壊してくれた方がマシだったり
697バヤ坊(滋賀県) [US]
垢版 |
2020/10/06(火) 16:25:44.19ID:kFTN7N5Q0
DDR3はまだ使っているw
2020/10/06(火) 16:26:13.68ID:JorivQWe0
単体では異常なまま動き続けてる場合もあるから
複数台同じもの同時に動かして同じ値になってるか比べ続けるならイケそうな気はするけどね
何倍も規模必要だし待たせてる予備に切り替えるより複雑そうなもんだが
699ぴょんちゃん(奈良県) [US]
垢版 |
2020/10/06(火) 16:28:02.08ID:LAbuixF30
>>544
で、東証も責任を誰も取らないのさ
2020/10/06(火) 17:01:13.75ID:WvF2Q2NZ0
宇宙線からのメモリー破壊もあると思うので筐体を1ミリ厚の24金プレーティングすることにしました。
人工衛星のシールでも実績がありますので!というかんじで少々、予算が増えてもしょうが無いかなーってw
2020/10/06(火) 17:43:45.64ID:xtSNmf3z0
なぜドリル優子にテストを頼まなかったのか(・ω・)
702ラジ男(東京都) [CH]
垢版 |
2020/10/06(火) 17:56:49.94ID:E1XmCLbJ0
通信装置は対策中
#通信装置のソフトエラー対策、ITU-T国際標準制定
〜宇宙線起因のソフトエラー対策に関する設計・試験・評価基準に基づく更なる信頼性向上へ〜
https://www.ntt.co.jp/news2018/1811/181122a.html
2020/10/06(火) 17:58:03.42ID:a4E6v7p00
>>11
バカかよw
2020/10/06(火) 18:28:23.28ID:ERw+RAt/0
>>681
ウォッチドッグはタイマー割込みでリセットするようにしました
705レンザブロー(東京都) [US]
垢版 |
2020/10/06(火) 20:13:37.15ID:cwnaSaft0
>「アローヘッド」で銘柄名や基準値段などの基礎的な情報を格納しているディスク。
>その中にあるメモリーが故障し、ディスクの1号機が機能不全となった。

HDDの中にある半導体がこわれったてこと?又はSSDが壊れたってこと?
こういうとこでもまだHDD使ってるのかな???
2020/10/06(火) 20:23:04.89ID:g8eG6lZD0
>>704
おいw
2020/10/06(火) 20:23:58.30ID:6NXjyGWR0
>>11
>>203
バカは意見しなくていいよ
君のようなパソコンオタクの出る幕じゃないんだよww
2020/10/06(火) 20:25:49.32ID:g8eG6lZD0
>>705
ちゃうぞ。
アレイシステム側のメモリ。PC で例えればメインメモリが死んだってこと。
2020/10/06(火) 20:39:54.20ID:+qXrb4Af0
>>695
鯖屋にいるが、故障なんてものは「正常に壊れない」ケースが山ほどあるんだが
メモリだけでも異常パターンなんて腐るほどあるぞ、障害舐めんな
710ラジ男(東京都) [CH]
垢版 |
2020/10/06(火) 20:41:45.50ID:E1XmCLbJ0
「切り替え失敗」はよくある 東証システム障害の真因
本当の問題はメモリーの故障でも、切り替え機能が作動しなかったことでもない――。東京証券取引所で10月1日に発生した大規模システム障害を筆者なりに分析するとこうなる。
https://www.nikkei.com/article/DGXMZO64611290V01C20A0000000/
2020/10/06(火) 20:44:16.01ID:fWtwIoT30
>>698
エヴァのマギみたいに3システムで多数決とかやればいいけど単純に3倍くらいはコストかかるよね
2020/10/06(火) 21:22:04.04ID:z//epL1j0
おまえらみたいに一見まともそうなキチガイをなかなか発見出来ないのと一緒
713たまごっち(ジパング) [GB]
垢版 |
2020/10/06(火) 21:23:59.36ID:MF+SdK+40
>>12
FM8のバブルメモリからだな
2020/10/06(火) 21:59:36.94ID:1LlXJ1TK0
東証「この冗長化オプションお願いします」
某F「毎度ありぃw 8600万円です」
東証「高いなぁ…ランチワンランク節約しよ」

某F「こんな使う事なく次の更新来るで。
   適当な機材見た目だけ置いとけ、テストもいらん」

東証「なんかおっきな機械だなぁ、まあこれで安心」
2020/10/06(火) 22:00:01.38ID:SynUqJL10
>>203
水爆攻撃も想定しろよ
ちゃんとテストもやろう
2020/10/06(火) 22:00:28.01ID:SynUqJL10
>>13
引き抜けばいいだけ アホか
717リーモ(SB-iPhone) [US]
垢版 |
2020/10/06(火) 22:58:40.19ID:qVxrrbJv0
>>716
普通に引きぬけば障害検知して縮退動作して活性交換できるんですよ。
718リーモ(SB-iPhone) [US]
垢版 |
2020/10/06(火) 23:00:18.49ID:qVxrrbJv0
ETERNUS使ったことがある人とない人が話しても平行線w
2020/10/06(火) 23:07:32.29ID:L9apwl7g0
というかメモリをミラーリングできるシステム設定でで組まなかったのが悪いのでは?今時の上位のXeonシステムなら当然使えるぞ
まさか1CPUまでのローコストサーバー使ってないよな?

https://jp.fujitsu.com/platform/server/primergy/performance/pdf/wp-cascadelake-sp-memory-performance-ww-ja.pdf

BIOS パラメーター
前のセクションでは、BIOS パラメーター DDR Performance を見ましたが、ここでは、メモリシステ
ムに影響を与える他の BIOS オプションを見ていきます。このパラメーターは、Advanced(詳細)の
下のサブメニュー、Memory Configuration(メモリ構成)にあります。
Memory Configuration(メモリ構成)のメモリパラメーター
次の 7 つのパラメーターがあります。それぞれ下線付きのオプションがデフォルトです。
 Memory Mode:Independent/Mirroring/Sparing
 NUMA:Disabled/Enabled
 DDR Performance:Performance optimized/Energy optimized/Power balanced
 Patrol Scrub:Disabled/Enabled
 IMC Interleaving:Auto/1-Way/2-Way
 Sub NUMA Clustering:Disabled/Enabled/Auto
 WR CRC feature control:Disabled/Enabled/Auto
最初のパラメーター Memory Mode(メモリモード)は冗長性機能を扱います。これらは、RAS
(Reliability:信頼性、Availability:可用性、Serviceability:サービス性)機能の一部であり、メモリを
ミラーリングするか(ミラーリング)、メモリエラーが頻繁に発生する場合に DIMM ランクのレベル
でメモリスペアを有効化すること(スペアリング)で、耐故障能力を向上させます。SystemArchitect
で構成中にこれらの機能が要求された場合、工場で適切なデフォルト設定が行われます。それ以外の
場合、このパラメーターは Independent(通常の冗長性なし)に設定されます。冗長性機能がシステム
パフォーマンスに与える影響に関する数値を後で示します。
2020/10/06(火) 23:18:51.93ID:tejC4ase0
>>165
同じ仕様のソフトウェアを2人の別の人間または組織に開発させて並列化し、それぞれの出力を比較して合致したときだけ動かすという冗長化設計方法はある
2020/10/06(火) 23:30:35.16ID:tejC4ase0
>>681
開発中はウォッチドッグ機能を一時的にOFFしていたのを戻し忘れてました!www
2020/10/06(火) 23:33:39.13ID:tejC4ase0
>>711
故障したときにストップするだけなら2重系でいいけど、故障したあとも動かし続けたいなら3重系以上が必要だわな
飛行機とか自動車の一部分はそういうふうに作ってる
2020/10/07(水) 00:38:01.88ID:01G053ku0
>>719
ETERNUSのCM内部にあるメモリの話なんですが...
2020/10/07(水) 01:22:14.84ID:0xFeUtry0
>>719
ストレージというサーバーの外にあるディスクがいっぱい詰まった箱の装置で使ってるメモリーのことだよ
725MiMi-ON(東京都) [CH]
垢版 |
2020/10/07(水) 02:36:42.91ID:lGZWhNkf0
メモリーって、DATテープみたいなもの?
磁気テープが壊れた。?
726メロン熊(千葉県) [US]
垢版 |
2020/10/07(水) 02:48:48.12ID:Wpy5AH160
ディスクということはまだSSD使ってないんだね?
2020/10/07(水) 03:06:33.97ID:9IAfVzNR0
>>752
ディスクにいちいち書いてると時間かかるから
とりあえずメモリに書いておしまいにする
728ライオンちゃん(ジパング) [ニダ]
垢版 |
2020/10/07(水) 04:27:47.46ID:Lckjm8TC0
メモリ引き抜いてのテストは流石にしてんじゃないの?抜かれたら感知して予備作動とか

刺さったまま不具合起こすのをテストしてなかったんじゃね
729フクタン(東京都) [ニダ]
垢版 |
2020/10/07(水) 05:21:06.59ID:wepBKxD60
いちいち誤魔化そうとしてる感があるな
つまりはプログラムミスだろ
こういうところが富士通はムカつくんだわ
730BEAR DO(愛知県) [DE]
垢版 |
2020/10/07(水) 05:31:32.34ID:i6Lmw3j50
4トントラックで試験してなかったのか
そらあかんわ
2020/10/07(水) 06:52:52.24ID:Al9yUUx20
>>699
責任取ればカイゼンするのか?生贄?中世?
お前のことだけじゃない。日本全体がこんなんだからIT後進国なんだよ
2020/10/07(水) 06:55:24.56ID:zWl390Cp0
>>57
日本はというより全世界的にそうやで?
AWSとか物理サーバ以上に止まるしな
2020/10/07(水) 07:00:15.74ID:3FrsqkEg0
俺が担当してる某銀行のサブシステム、エターナス使ってるけど大丈夫なんだろか
2020/10/07(水) 07:34:10.15ID:2KpkAFmM0
コントローラが死んでるのに生きてるフリされると困る罠
2020/10/07(水) 09:12:21.74ID:e0sQOqks0
>>728
一般的なサーバーの構築時にはそこまでしない
やって壊れたら何百万もの損失、納期遅れ、ユーザーからの不振感、俺君が怒られるので絶対やらん
2020/10/07(水) 10:05:13.81ID:OhpffrAb0
破壊試験は実費請求しなきゃ請け負った方が赤字になるよな
2020/10/07(水) 10:15:12.75ID:aaXBV8o50
昔の家電には電源の入ってる線を抜き差しすると回路が壊れたり感電するおそれが云々と注意書きがあったもので素人でもそういう作業はしちゃ駄目と分かってるんだが、今の人は回路に刺さってる部品の抜き差しなんてことを口にするのか。
活線挿抜とやらに対応してないところでは何が起きても文句言えないんでしょ?
738しんた(東京都) [US]
垢版 |
2020/10/07(水) 10:35:33.64ID:gDtR2MOX0
メモリが壊れたって信号を擬似的に出す仕組みないのか?
そういうの組み込んどけよ
2020/10/07(水) 10:35:51.83ID:v59wURz/0
メモリの破壊テストなんてサーバー構築時ではなくサーバー開発時の話だな
しかし機器が中途半端に不安定で自動で切り替わらなかっにしても手動でメイン系の電源落とせば待機系に変わりそうなものなのに
2020/10/07(水) 11:49:53.37ID:OhpffrAb0
>>738
そんなもの幾ら付けても、本物の故障は全く意に介さない現象を引き起こすからなぁ
人間の英知の及ばないのが自然だと言う事さ
2020/10/07(水) 12:40:56.57ID:2uauSjo30
だから「安定してしっかり壊れてくれたのではない」のが落とし穴ということじゃないの?
間欠的にランダムに発狂されると始末が悪い。
742カーくん(東京都) [ニダ]
垢版 |
2020/10/07(水) 14:34:13.50ID:qxnIRjig0
>>739
記者会見全部見ればわかるけどコントローラの手動切り替えでシステムは起動できていた
証券会社側のシステムまで巻き込まざるを得ない運用上の問題があって急にはできないから終日取引停止にしたとハッキリ言っている
2020/10/07(水) 14:48:41.81ID:Y3T0esXs0
>>742
自動で切り替わってたらもっとやばかったって意味に聞こえるが
2020/10/08(木) 09:26:48.74ID:ZIZLMbRZ0
人的ミスじゃん
これ賠償とかどうなるの
2020/10/08(木) 10:49:38.27ID:fuwCVMtc0
>>744
その冗長化関連は東証のお仕事だったんでしょ?
無能なシステム部門に賠償請求するの?
2020/10/08(木) 12:41:50.33ID:DBZGCu3o0
ふーんでもそれが10月1日にたまたま起きるんだ、ふーーーん笑
■ このスレッドは過去ログ倉庫に格納されています
5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。

ニューススポーツなんでも実況