AI革命の浸透:AIによって続くネットワーク変革

2023年8月15日

著者:ラミ・ラヒム(ジュニパーネットワークス最高経営責任者)


私は、AIの登場であらゆることが変わろうとしていると気づいた瞬間を覚えています。

5年前、Mist Systems(当時は当社のテクノロジーパートナー)の創業者たちがビジネスチャンスを探るために当社のオフィスを訪れたときに、画期的なアイデアを紹介してくれました。それはAIドリブンネットワークプラットフォームというアイデアで、そこではネットワーク上の問題がユーザーに顕在化する前に自律的にトラブルシューティングを行い、解決できるというものでした。

そのアイデアは、あらゆる点ですばらしいと感じました。しかし、何十年もの間、AIのことは流行り言葉として耳にしていたので、MistのほんもののAIを目の当たりにするまで、その可能性について懐疑的でした。実際のところ、当社のITチームはすでにMistを試験的に導入し、その効果を実感していました。このプラットフォームは、その圧倒的な精度とスピードにより、文字通りリアルタイムで問題を自己診断して修復することができていました。

その瞬間、ジュニパーにとっても世界にとっても、AIがどれほど大きな意味を持つことになるのかがわかりました。

ご存知の方も多いと思いますが、当社のAIOpsプラットフォームはその後、ジュニパーの戦略の要となっています。業界内の他企業が議論を続けるなか、私たちは業界をリードする第7世代のAIによりネットワークに革命をもたらし、卓越したユーザーエクスペリエンスへの道を切り開きました。ある世界的なソフトウェア会社では、全世界のトラブルチケット件数が90%削減され、ある多国籍小売企業では、店舗への訪問回数が85%減少しました。ある国内の携帯電話会社は、史上最速でブランチネットワークを展開しました。

ジュニパーのAIドリブンMistプラットフォームが、何千もの組織に革新的な進化をもたらしてきたことは明らかです。

しかし、これは始まりにすぎません。

Mistの成功を目の当たりにした私たちは、AIの採用がさらに広範囲に急拡大するのは確かであり、AIモデルとデータセンターの規模も拡大していくだろうと予測しました。

ここからが、ジュニパーにとってさらに面白くなるところです。

AIデータセンター:AI革命をつなぐ存在

しばらく前にシリコン企業各社が発見したように、ゲーム用に製造されたGPU(グラフィックプロセッシングユニット)はAIの実行する学習や推論のワークロードに非常に適しています。

しかし、単一のGPUのみでは、実行できるAI処理に限界があります。最新のAI(人工知能)またはML(機械学習)クラスタは、数百、ときには数千のGPUで構成されており、今日のAIモデルの学習に必要な大規模な並列計算能力を有しています。

そしてもちろん、これらのGPUを結び付け、非常に強力な単一のAI処理システムとして動作させるのがネットワークです。

クラウド、モバイル、ストリーミングサービスなど、これまでの技術革新はネットワークを新たな高みへと押し上げてきましたが、分散型の機械学習ワークロードから発生するデータセンターのトラフィックは、他のほとんどのアプリケーションのトラフィックに比べて小規模です。大規模なデータセットを通信し、数十億、さらには数兆のモデルパラメーターを解決するというAI要件は、ネットワークにかつてないほどのストレスを与えます。

それを踏まえて考えてみると、お客様の希望がGPUクラスタを最大限のパフォーマンスで導入することである典型的な事例では、全米のインターネットトラフィックとほぼ同量のネットワークトラフィックが毎秒GPUクラスタを通過します。また、AIデータセンターの経済性を理解するため、GPUサーバーは1台40万ドルもすることを知っておく必要があります。そのため、GPUの利用率を最大化し、GPUのアイドルタイムを最小化することは、AIデータセンター設計の最も重要な推進要因の1つです。

ワークロードを複数のGPUに分散させ、それらを同期させてAIモデルをトレーニングするには、「ジョブ完了時間」(JCT)を高速化し、最後のGPUの計算が終了するまでのシステム待機時間(テールレイテンシ)を短縮できる、新しいタイプのネットワークが必要です。

したがって、AIとMLに最適化されたデータセンターネットワークは、混雑の管理、ロードバランシング、遅延、そして何よりもJCTの最小化に関する特別な機能を備えていなければなりません。これらは、ジュニパーが長年にわたって得意としてきたシステム特性です。また、モデルのサイズとデータセットの増大に伴って、ML専門家はさらに多くのGPUをクラスタに収容しなければなりません。ネットワークファブリックは、パフォーマンスを損なうことや通信のボトルネックを引き起こすことなく、シームレスなスケーラビリティをサポートする必要があります。

私はジュニパーでキャリアをスタートし、90年代にインターネットの成長を支えた高度に専門化されたASICを開発したエンジニアとして、長年にわたりこの業界の規模、パフォーマンス、スピードを新たなレベルに押し上げるイノベーションサイクルを間近で見てきました。

AIネットワーキングは一世代に一度の転換点であり、今後何年にもわたって複雑な技術的課題を突きつけてくるものと思われます。そして、ジュニパーにはこの未来を可能にする要素がそろっていると信じています。それはつまり、ジュニパーにとっては、「AIデータセンターネットワークの3つの基準」と私たちが呼んでいる以下の要件を守ることです。

1. ハイパフォーマンス
GPU利用率の最大化は、AIモデルのトレーニングにおける包括的な経済的要因であり、これを実現するにはJCTを最適化してテール遅延を最小化するネットワークが必要です。モデルのトレーニングがスピードアップすると、結果が得られるまでの時間が短縮されるだけでなく、より適切に最適化されたコンピューティングリソースを備えたデータセンターのコストも抑えられます。

ジュニパーは当初からシリコンに依存しない姿勢を貫いており、その取り組みによって、スパイン型、リーフ型、データセンター相互接続型など、電力効率や規模などさまざまな要素に合わせて最適化を行う各種オプションをお客様に提供しています。地球上で最大規模のネットワークを強化するサードパーティおよび自社設計のシリコンをベースとしたシステムの幅広いポートフォリオを提供すると同時に、AI導入のさまざまな段階にあるお客様に対してニーズと制約に合わせた柔軟な対応を行っています。

2. オープンインフラストラクチャ
パフォーマンスは重要です。だからこそ、誰もがパフォーマンスに投資します。しかし、その後は経済が関わってきます。そして、経済は競争によって動かされ、競争は開放性によって動かされます。私たちの業界では、以前にも同じようなことがありました。そして、私が賭けるなら、前回同様にイーサネットの勝利に賭けます。オープンプラットフォームは、イノベーションを最大化します。独自のテクノロジーに役割がないわけではありませんが、1人の技術提供者が市場の他企業を凌駕するようなイノベーションを起こすことはめったにありません。ましてや、多くの利害が絡む環境では、イノベーションが起きることは決してありません。ジュニパーは、イーサネット規格とその強力なベンダーエコシステム(新しいUltra Ethernet Consortiumも含む)を堅実にサポートしています。それによってコスト削減とイノベーションを促進し、最終的にはInfiniBandのような独自のアプローチを行います。

ジュニパーは、広範なイーサネットエコシステムの他の組織と協力して、データ転送の高速化、ロスレス伝送、混雑制御の強化など、AI革命を推進するうえで不可欠なネットワーキングテクノロジーの革新を続けています。

3. エクスペリエンスファーストの運用
データセンターネットワークはますます複雑化しており、AIワークロードのパフォーマンスニーズに応えるためには、新しいプロトコルをファブリックに追加する必要があります。複雑化は今後も続くと思われますが、インテントベースの自動化は、ネットワークオペレーターをこうした複雑さから守ります。ジュニパーは、マルチベンダーと運用優先の考え方で、データセンターに取り組んでおり、Junosと、Apstraデータセンターファブリック管理および自動化ソリューションに対し、AIクラスタ用の拡張機能を追加しようとしているところです。ちなみに、Apstraは、業界唯一のマルチベンダープラットフォームです。最初の導入後に、運用面でロックインされてしまっては、オープンである意味がありません。

AIが登場しており、もう後戻りはできません。

ジュニパーは、AIが有線、無線、広域ネットワークの管理を簡略化し、エンドユーザーエクスペリエンスやネットワークオペレーターの業務を劇的に改善するという効果をすでに実証しています。しかし、機械学習と大規模言語モデルがネットワークにプレッシャーを与えることから、私たちは革新を続け、新たな課題を解決し続ける必要があります。

そして、確かにこれらの課題は、困難を極めるものばかりです。しかし、世界中で最も困難な問題を解決することこそ、ジュニパーを常に突き動かしてきた原動力です。私たちは、どんな形であれ、つながりを強化し、変化を促すという目的によって突き動かされています。私たちは、ハイパフォーマンスの伝統とエクスペリエンスファーストのネットワーク運用へのこだわりを実践していきます。

私は、データセンターネットワーキングに対するジュニパーのアプローチによって、AIの新時代が花開くと確信しています。