新型コロナウイルスに、次世代スパコン「富岳」が挑む(後編)

メインビジュアル : 新型コロナウイルスに、次世代スパコン「富岳」が挑む(後編)
News
スーパーコンピュータ「富岳」TOP500、HPCG、HPL-AIにおいて世界第1位を獲得
スーパーコンピュータ「富岳」がGraph500において世界第1位を獲得

目次


前編の続き)

新型コロナウイルス対策にスパコン「富岳」を前倒し提供

依然として猛威を振るう新型コロナウイルス感染症(COVID-19)。理化学研究所(理研)は2020年4月、文部科学省と連携し、新型コロナウイルスの対策に貢献する研究開発にスーパーコンピュータ(スパコン)「富岳(ふがく)」の計算資源を提供することを発表しました。

理研は文部科学省が決定する研究開発の実施課題に対して技術的なサポートを実施しています。研究課題は、新型コロナウイルスの性質の解明、その治療薬となり得る物質の探索、感染拡大や社会・経済的影響を明らかにすることなどが対象です。

「富岳」は、理研と富士通が共同開発している次世代型スパコンです(注1)。2019年8月に運用を終了したスパコン「京」の後継機で、富士通が開発した高性能CPU「A64FX」を高速ネットワーク「TofuインターコネクトD」で15万個以上つなげた超大システムです。

「富岳」は、2019年4月に石川県の富士通の工場にて、製造が開始され、同年12月からは理研の計算科学研究センター(兵庫県神戸市)で数百台の計算機ラックの搬入・構築がスタート。2021年頃の共用開始を目指して開発・整備が進められていますが、コロナ禍の状況を受けて支障のない範囲で一部の計算資源を優先的に前倒しで提供。コロナ対策として世界に誇るスパコンの計算能力を活用することになりました。

前倒しながら従来機「京」の約8倍の計算能力を提供

理研と共同で、搬入、設置、運用環境の構築、整備を進めていた現場では、前倒しでの計算資源の提供が決まった際、「富岳」がまだ計算機ラックの搬入や構築の途中であることから、「前倒しで安定稼働させることは簡単なことではない」という不安感がありました。しかし、「新型コロナウイルス対策という、全世界が直面している課題の解決に貢献したい」という使命感で、「前倒しでの提供とはいえ、研究開発の利用に耐えるようにして提供しよう」と整備、提供に取り組みました。

スパコンは構成要素が多く、複雑なシステムです。CPUやメモリ、ストレージ、ネットワーク機器などのハードウェア、その上で稼働するOSやミドルウェア、さらに解析などに用いる各種アプリケーションなどがあります。それらに加えて、冷却装置や電源装置なども付随する巨大な集合体がスパコンなのです。

システム全体としての安定性を保つためには、すべての要素が適切に動作しなければなりません。そこで重要となるのが、稼働状況の監視機能です。システムを止めないためには、稼働状況を常に監視できる環境をつくることが求められます。

運用管理ソフトウェアによる自動化された稼働状況の監視に加え、24時間監視サービスとの連携を構築の初期段階から進めたことで、全CPUの状態を監視できるようになりました。さらに、障害発生時の復旧作業などのオペレーション手順の確立や自動化も間に合わせることができました。

こうした取り組みの結果、2020年4月には、「富岳」の一部(「京」の約4倍から8倍の計算処理能力に相当)を使った、新型コロナウイルス対策向け研究開発での試行的利用がスタートしました。

「富岳」の前倒し提供には現場スタッフの徹底した感染防止の取り組みが

「富岳」の計算資源の提供では、システム全体の稼働状況の監視の環境作りと同時に、実際に、計算機ラックの搬入、設置や、運用環境の構築、整備をおこなうスタッフの対応も重要でした。通常の状況での作業であれば問題ないのですが、実際に作業が実施されたのはコロナ禍の真っ只中。万が一、現場で作業にあたるスタッフから新型コロナウイルスの感染者が出てしまうと、作業全体をストップさせてしまいます。

富士通関係だけでも、運輸、設置工事、試験・調整、OSやミドルウェアなどのソフトウェアの開発・調整、運用環境の構築・整備を担当するシステムエンジニアなど多岐にわたる部門から構成される多くの現場スタッフが、密に連携しながら感染予防の対応に当たりました。

感染予防には、人と人との物理的な接触を避けるための工夫を行いました。例えば、作業者の居室を分ける、計算機建屋の東西で動線を分ける、時差出勤やテレワークによって人員が密集する状況を回避するなど、理研とも相談し、協力を頂きながら徹底した対策を実施しました。万が一、感染者が出た場合でも人員を補充できるバックアップ体制を用意するといった工夫もしました。

写真 : 設置された「富岳」の写真(2020年2月撮影) (5月に設置完了) (提供:理化学研究所)

設置された「富岳」の写真(2020年2月撮影)(5月に設置完了)
(提供:理化学研究所)

富士通グループでは全社的なテレワークを2015年から推進しており、ほとんどの社員がテレワークを使い慣れていたこともあって、今回の特殊なケースでも問題なく対応することができました。

現場だけでなく、機器を製造する工場や部品サプライヤー、物流・調達部門といったサプライチェーン全体を含めた多くの関係者が一丸となってサポート頂いたことも今回の成果につながったと思います。

新型コロナ対策という人類の課題解決にICTで貢献する

富士通では、CPUなどのハードウェアの製造からソフトウェア開発、システムインテグレーションなどを総合的にサポートできる点が強みです。今回の「富岳」の計算資源を前倒しで提供する」というチャレンジは、富士通のICTで社会課題の解決に役に立ちたいという想いが結束した成果だといえるでしょう。

今後もお客様や取引先企業、従業員とその家族の安全確保と感染拡大の防止を最優先としつつ、お客様への製品・サービス提供の継続を通して、感染拡大により生じる様々な社会課題の解決に役立つ取り組みを進めていきます。

(注1)スーパーコンピュータ「富岳(ふがく)」とは?
超高速で膨大な計算ができる計算機が、スーパーコンピュータです。「富岳」は、スーパーコンピュータ「京」の後継機です。「京」の名は1秒間に1京(10の16乗)回の計算ができることに由来します。「京」は世界性能ランキングのTOP500で2011年6月と11月に1位、Graph500では2014年以降8期連続1位に輝きました。最大で「京」の100倍のアプリケーション実効性能を目指す「富岳」には、FACOMに始まる富士通コンピュータ開発の知識と経験も結集しています。

「富岳」とは“富士山”の異名で、富士山の高さが性能の高さを表し、また富士山の裾野の広がりがユーザーの拡がりを意味しています。医療だけでなく災害・エネルギーや持続可能性といった社会課題解決、新発想のものづくり、宇宙や生命の謎の解明、それらを助けるAIやロボット研究などの世界最先端技術を結集した「富岳」は現在も多くの挑戦を続けています。
「京」では、一般に流通しているようなソフトウェアをそのまま利用するのは簡単ではありませんでした。「富岳」のCPU「A64FX」には、スパコン向けに拡張されたArm命令セットアーキテクチャーを採用し、標準のLinux OSにも対応することで、改善を図っています。また、消費電力あたりのアプリケーション実効性能を大幅に向上し、「京」と比較して最大で100倍のアプリケーション実効性能を、3倍程度の消費電力で実現することを目指しています。