にぼしのリタイア日記

鬱病でサラリーマンをリタイアした56歳男の復活日記

東証システム障害はハードウェアの故障が原因?・・・なんかしっくりこない説明だなぁ~

なんかしっくりこない説明だなぁ~
news.yahoo.co.jp
ITメディアの記事では、今回の障害について、東証は10月1日16時半に記者会見を実施した。会見には、東証の宮原 幸一郎社長をはじめ、東証を傘下に抱える日本取引所グループ(JPX)の横山隆介氏(CIO:最高情報責任者、IT企画担当)らが登壇した。横山氏によれば、今回の障害は東証の株式売買システム「arrowhead」を構成する350台ほどのハードウェアのうち、1台に発生した故障が引き金になって起こった。
東証は毎朝9時の取引開始に間に合うようにシステムを立ち上げる。10月1日午前7時4分ごろ、システム立ち上げの際に必要なデータを集約する共有ディスク装置に異常が発生し、定時に処理されるはずのジョブが停止してしまった。また、管理サーバの監視処理にも異常が発生したという。
共有ディスクが立ち上げに失敗したため、同日8時1分、相場情報の配信システムにも障害が発生した。これらの障害を受け、東証は8時54分にシステムの通信を遮断し、全銘柄の売買を停止した。
横山氏によれば、東証はハードウェアなどの障害を想定した冗長構成を取っており、万一の障害発生時には自動的に待機系のシステムに切り替える仕組み(フェイルオーバー)を実装していた。「(以前から)何回もテストし、問題なく動くことを確認していた」(横山氏)という。しかし、今回は「かなりレアケースといえる障害が起こった」(横山氏)とみられ、待機系への切り替えがうまく動作しなかった
東証は、arrowheadを納入した富士通に故障したハードウェアを持ち込み、原因の解析を進めるとしている。東証はarrowheadを2019年11月に刷新した。今回故障したハードウェアは、その際に納入されたものだという。
同様の障害が発生することを防ぐため、東証は「(障害の)原因が判明するまでは、専門の人員を配置してハードウェアの監視に当たる」(横山氏)としている。
会見の中で、宮原氏は「社会インフラを運用する立場としての責任を痛感している」として謝罪した。
障害の原因になったハードウェアが富士通から納入されていたことから、質疑応答の際、一部の記者からは「(障害の)責任の所在についてどう考えるか」との質問が飛んだが、宮原氏は「富士通は機器を納入したベンダーであり、市場(システム)の運営責任は東京証券取引所にある」と返答し、責任を追及する考えを否定したと報じている。
・・・・・
私はサラリーマン時代、ハードウェア技術者だったので東証の説明が腑に落ちない
なぜなら、熱などでハードウェアが故障することは良くあることなので、必ずバックアップするシステムが2重3重に整備されているはずだからだ。
しかし、そのバックアップシステムに切り替えが出来なかったとしか説明していない。
そこが最大の問題なのに原因は分からないとお茶を濁している
何か都合の悪いことを隠しているような気がするのは私だけだろうか?