障害情報
2017/05/19
[物性研システムB] UPS故障による障害について
物性研スーパコンピュータシステム共同利用
平成29年度研究代表者・共同研究者各位
現在発生中の、物性研スパコンシステムBにおけるハードウェア障害についてお知らせいたします。
5月7日 17:44頃、UPS装置の故障により、当該UPSにより電源を供給されていたファイルシステムを含む管理用サーバ群がダウンいたしました。本障害により当時実行中であった全てのジョブが影響を受けたと考えられます。被害にあったユーザの皆様には別途連絡を差し上げました。
明日、代替UPSが届き次第システムの復旧作業を開始し、大きな問題がなければ
5月12日 (金) 17:00 –
に運用を再開する予定です。
ただし、システムの状態によっては予定通りに運用再開できない可能性もあります。
復旧にあたり、以下の点にご注意ください。
- 長時間キュー(Lキュー)は緊急保守に支障があるため停止いたします。
- /workのファイル自動削除機能は当面の間停止いたします。
再開する際にはまたお知らせいたします。 - 故障したUPSについて修理の準備が整いましたら、緊急保守を行います。
- 緊急保守の前日までにメールおよび web にて予告を行います。
- デッドラインスケジューリングを行いますので、実行中のジョブがキャンセルされることはありません。
ご不便をおかけして大変申し訳ありませんが、よろしくお願いいたします。
—-
物性研究所大型計算機室
center__at__issp.u-tokyo.ac.jp (__at__を@にして下さい。)