Kubernetes Engine (OKE)

エンタープライズクラスのKubernetesの運用を大規模に簡素化します。自動スケーリング、パッチ適用、アップグレードにより、AIなどのリソース集約的なワークロードを簡単に導入および管理できます。

Oracle Cloud Infrastructure: Kubernetesのコスト・パフォーマンス担当リーダー

CIO Magazineは、スケーラブルで効率的なアプリケーション開発をサポートする最先端のKubernetesソリューションを提供するOCIの専門知識を高く評価しています。

OKEが選ばれる理由

  • コストパフォーマンス

    OKEは、すべてのハイパースケーラ(特にサーバーレス)の中で最も低コストのKubernetesサービスです。

  • 自動スケーリング

    OKEはオンデマンドでコンピュート・リソースを自動的に調整するため、コストを削減できます。

  • 効率性

    GPUは不足しがちですが、OKEのジョブ・スケジューリングではリソースの利用状況を簡単に最大化できます。

  • 移植性

    OKEはクラウドとオンプレミス間で一貫しているため、ポータビリティを実現し、ベンダー・ロックインを回避できます。

  • シンプルさ

    OKEは、Kubernetesインフラストラクチャの複雑な管理に必要な時間とコストを削減します。

  • 信頼性

    自動アップグレードとセキュリティ・パッチ適用により、コントロール・プレーンおよびワーカー・ノードの信頼性が向上します。

  • 耐障害性

    OCI Full Stack Disaster Recoveryを使用しており、完全に自動化されたネイティブなクロスリージョン・リカバリを利用できます。

OKEのユースケース

OKE、OCI AIサービスを強化

Kubernetesは、AIワークロードを導入するための主要なプラットフォームです。OKEは、Oracle Cloud Infrastructure(OCI)AIサービスを強化します。

AIモデルの構築

- AIプロジェクトの初期構築段階では、問題を定義し、モデルを作成するためのデータを準備します。

- Kubernetesクラスタは、セキュアで一元管理された環境を提供しながら、高価で制限されがちなGPUリソースへの共有アクセスを許可することで、効率の大幅な向上を実現します。

–Kubernetes関連のオープンソースプロジェクトであるKubeflowは、モデルの構築、トレーニング、導入を効率化するために設計された包括的なフレームワークを提供します。

AIモデル構築のためのOKE

OKEはOCI上に構築されており、以下のようなAI/MLワークロード向けに設計された高いパフォーマンスのインフラストラクチャを完全なスタックで提供します。

- H100、A100、A10などを含むさまざまなNVIDIA GPU。

– 超高速RDMAネットワーク

OKEセルフマネージド・ノードを使用しているため、Kubernetesクラスタ上でAI/ML構築ワークロードを実行することができます。

OKE、OCI AIサービスを強化

Kubernetesは、AIワークロードを導入するための主要なプラットフォームです。OKEはOCI AIサービスを強化します。

AIモデルのトレーニング

- モデルのトレーニングでは、データ・サイエンティストはアルゴリズムを選択し、準備されたデータを使用してトレーニング・ジョブを開始します。この段階では、ジョブを効率的に処理するための高度なスケジューリング・システムが必要です。

VolcanoやKueueなどのKubernetesプロジェクトは、このような要件への対応を支援し、コンピュート・リソースを効率的に利用します。

– 大規模な分散トレーニングでは、クラスタ内の低レイテンシのノード間通信が必要です。ここでは、リモート・ダイレクト・メモリ・アクセス(RDMA)を備えた特殊な超高速ネットワークが必要です。これによりCPUをバイパスしてアプリケーションのメモリに直接データを移動し、レイテンシを短縮することができます。

AIモデルのトレーニングのためのOKE

OKEはOCI上に構築されており、以下のようなAI/MLワークロード向けに設計された高いパフォーマンスのインフラストラクチャを完全なスタックで提供します。

- H100、A100、A10などを含むさまざまなNVIDIA GPU。

- 低レイテンシおよび超高パフォーマンスRDMAネットワーク

OKEセルフマネージドノードを使用しているため、Kubernetesクラスタ上でAI/MLトレーニングを実行することができます。

OKE、OCI AIサービスを強化

Kubernetesは、AIワークロードを導入するための主要なプラットフォームです。OKEはOCI AIサービスを強化します。

AIモデル推論(サービング)

- AIモデルの推論はKubernetesが真の力を発揮する分野です。Kubernetesはオンデマンドで推論ポッドの数を自動的にスケールアップまたはスケールダウンできるため、リソースを効率的に利用できます。

- Kubernetesは、コンテナのCPUとメモリの上限を指定する機能など、高度なリソース管理を提供します。

AIモデル推論のためのOKE

OKEは耐障害性の高さを中核に設計されており、Kubernetesに組み込まれた自動スケーリングを活用して、使用量に応じて従業員ノードをスケールします。わーかー・ノードは、複数のフォルト・ドメインや可用性ドメインにわたり分散して高可用性を実現できます。

OKE仮想ノードは、サーバーレスKubernetesエクスペリエンスを実現します。ワーカー・ノードをスケーリングせずに、ポッド・レベルでスケーリングするだけで済みます。これにより、サービス料金が使用するポッドのみに基づくため、迅速なスケーリングと経済的な管理が可能になります。

仮想ノードは推論ワークロードに適しており、GPUが不足している場合には特に、AI推論にとってはるかに魅力的選択肢になりつつあるArmプロセッサを使用できます。

既存のアプリケーションをOCIおよびOKEに移行することによるメリットの取得

OKEは、総所有コストを削減し、市場投入までの時間を短縮します。

OKEは、次の方法で大規模な操作を簡素化します。

  • リフト・アンド・シフト: 再設計の必要がない
  • 自動化による業務負担の軽減
  • インフラストラクチャ管理にかかる時間の短縮
  • リソースの利用状況と効率の向上
  • アジリティ、柔軟性、稼働時間、耐障害性の向上
  • コンプライアンス・リスクの軽減とセキュリティの強化

マイクロサービスはモノリシック・アプリケーションよりも多くのメリットを提供

OKE中心のマイクロサービス・アプリケーション・アーキテクチャで将来性のあるアプリケーションを実現します。

  • アーキテクチャの最新化
  • イノベーションのペースの加速
  • 導入の自動化
  • 並行開発
  • 拡張が容易
  • 信頼性の向上
  • 柔軟性の向上
  • アジリティの向上

「多くのOCI AIサービスは、オラクルのマネージドKubernetesサービスであるOCI Kubernetes Engine(OKE)上で実行されます。実際、当社のエンジニアリング・チームは、以前のプラットフォームからOKEに切り替えただけで、OCI Visionのパフォーマンスが10倍向上しました。それほど優れているのです。」

Jun Qian

Oracle Cloud Infrastructure、OCI AI Services担当VP

OCIのクラウドネイティブ・サービスでイノベーションを実現するお客様

他のお客様事例を見る

Kubernetes Engineを使い始める

  • OKE マネージド・ノードを使用したシンプルなコンテナ化済アプリの導入

    Dockerコンテナとしてパッケージ化された共通のAPIを介して通信するシンプルなマイクロサービスを導入できます。


  • 仮想ノードを備えたKubernetesクラスタの導入

    提供されているTerraform自動化とリファレンス・アーキテクチャを使用してサーバーレス仮想ノードプールのにおけるベストプラクティスを見出します。


  • Kubernetesリソースを最適化するためのパターンの詳細

    Tryg Insuranceがダイナミック・ライツサイジングによってコストを50%削減した方法をご覧ください。


2025年3月26日

OCI Full Stack DRを利用するOCI Kubernetes Engineの完全自動ディザスタ・リカバリを発表

シニア・プリンシパル・プロダクト・マネージャ、Gregory King

Oracle Cloud Infrastructure(OCI)Full Stack Disaster Recovery(Full Stack DR)は、OCI Kubernetes Engine(OKE)のネイティブなサポートを発表します。OKEクラスタは、仮想マシン、ストレージ、ロードバランサー、Oracle Databaseと同様に、フルスタックDRに選択可能なOCIリソースになりました。つまり、ITスタッフが1行のコードも、スプレッドシートやテキストファイルのステップバイステップの指示も書かなくても、OKE、インフラストラクチャ、データベースをリカバリする機能の検証、フェイルオーバー、スイッチオーバー、テスト方法を正確に把握しています。

全文を読む

Kubernetesのリソース

ワークショップ

Kubernetesとは

Kubernetesは、コンテナ化したアプリケーションとサービスのクラスターを管理およびスケーリングするためのオープン・ソース・プラットフォームです。

さらにトレーニング

Kubernetesの関連製品

レジストリ

コンテナ・イメージを扱うための安全で標準ベースのサービス

フルスタックDR

Oracle Kubernetes Engineのディザスタ・リカバリを完全に自動化

DevOps CI/CD

ビルド、テストおよびデプロイメントにわたってアプリケーションのデリバリを自動化します

Resource Manager

Terraformベースのクラウド・インフラストラクチャを自動化

OKEを使い始める


Oracle Cloud Free Tier

CI/CDツール、マネージドTerraform、テレメトリなどに30日間アクセスできます。


Architecture Center

デプロイ可能なリファレンス・アーキテクチャおよびソリューションのプレイブックを確認します。


Oracle Cloud Nativeサービス

Kubernetes、Docker、サーバーレス、APIなどでアプリ開発を支援します。


お問い合わせ

販売、サポート、その他の質問については、アソシエイトにご連絡ください。