2018年10月24日
東証、9日のシステム障害の原因を説明 メリルリンチが重複IPアドレスで同時接続
東証が9日のシステム障害について詳細を公表。原因がメリルリンチ日本証券にあったことも明らかにした。

株式売買システム「arrowhead」で10月9日に起きたシステム障害について、東京証券取引所(東証)は23日、詳しい原因を説明した。メリルリンチ日本証券がarrowheadに注文を発注する際、誤って2台の仮想サーバに同じIPアドレスを設定した状態で同時に接続したことにより、短時間で大量の通信電文が発生。これにより接続装置のうち1台が高負荷でダウンし、障害が起きたという。

東証の報告より
 証券会社は発注する際、自社の仮想サーバからarrowheadの接続装置に注文電文を送信する。arrowheadの接続装置は1号機〜4号機の4台あり、それぞれ、ゲートウェイサーバの1〜4号機につながっている。

 9日午前7時31分、メリルリンチ日本証券が、2台の仮想サーバに同一のIPアドレス・ポート番号を設定した状態で、同時にarrowheadに接続。1台のTCPコネクションが確立した直後に、重複して同一のTCPコネクションの確立が試みられたため、TCPコネクションの管理番号で不整合が起き、短い間隔で大量の再送要求伝聞を送信。接続装置1号機の負荷が高まって安全機構が働き、その先のゲートウェイサーバ1号機も機能を停止した。このため、接続装置1号機に接続していたほかの証券会社の仮想サーバからの注文も受けられなくなった。

https://i.imgur.com/SdaEfJD.jpg