Skip to content

Commit

Permalink
チュートリアル:OCI HPCチュートリアル集
Browse files Browse the repository at this point in the history
カテゴリ:OCI HPCポータル
更新内容:"ブロック・ボリュームでファイル共有ストレージを構築する"の構築手法をNFS Cluster StackからGitHubレポジトリtutorial_bvnfsを使用する方法に変更、これらに伴う修正及び誤記訂正・軽微な修正
  • Loading branch information
fwiw6430 committed Oct 4, 2024
1 parent f48c4ea commit d34289c
Show file tree
Hide file tree
Showing 25 changed files with 590 additions and 750 deletions.
8 changes: 4 additions & 4 deletions _pages/hpc.md
Original file line number Diff line number Diff line change
Expand Up @@ -51,7 +51,7 @@ HPC/機械学習ワークロードを実行する際に有益なテクニカル
本ポータルサイトを読み進めるうえで理解が必要なHPC関連のOCI用語を解説しています。

提供するコンテンツは、随時追加・更新されますので、定期的にチェックしてみて下さい。
また本ポータルサイト内のコンテンツは、作成者が誠心誠意作成していますが、間違いや不正確な記述などを見つけた場合は、 **[ここ](https://github.com/oracle-japan/ocitutorials/issues)** からIssue登録でご連絡ください。
また本ポータルサイト内のコンテンツは、作者が誠心誠意作成していますが、間違いや不正確な記述などを見つけた場合は、 **[ここ](https://github.com/oracle-japan/ocitutorials/issues)** からIssue登録でご連絡ください。

***
# 1. OCI HPCチュートリアル集
Expand Down Expand Up @@ -149,7 +149,7 @@ HPC/機械学習ワークロードを実行する際に有益なテクニカル
| :-------------------------------------------------------------------------: | :-----:| :-----: | :------------------------------: |
|標準FSS| **[ファイル・ストレージで<br>ファイル共有ストレージを構築する](/ocitutorials/hpc/spinup-nfs-server-fss/)** | 長期保存データ | 120 MiB/s(※8) |
|高性能FSS| **[ファイル・ストレージで<br>ファイル共有ストレージを構築する](/ocitutorials/hpc/spinup-nfs-server-fss/)** | 長期保存データ | 10 GiB/s(※8) |
| ブロック・ボリュームNFSサーバ|**[ブロック・ボリューム<br>でNFSサーバを構築する](/ocitutorials/hpc/spinup-nfs-server/)** | 中期保存データ | 5 GiB/s(※9) |
| ブロック・ボリュームNFSサーバ|**[ブロック・ボリューム<br>でファイル共有ストレージを構築する](/ocitutorials/hpc/spinup-nfs-server/)** | 中期保存データ | 5 GiB/s(※9) |
|DenceIO NFSサーバ|**[短期保存データ用高速ファイル共有ストレージ<br>を構築する](/ocitutorials/hpc/spinup-nfs-server-nvme/)** | 短期保存データ | 10 GiB/s(※9) |

※7)対象の構築手法が提供するデータ可用性レベルに応じて分類しています。(データ可用性が低いほど短期保存データ用ファイル共有ストレージに分類)
Expand Down Expand Up @@ -327,7 +327,7 @@ HPC/機械学習ワークロードを実行する際に有益なテクニカル

- **[HPC/GPUクラスタ向けファイル共有ストレージの最適な構築手法](/ocitutorials/hpc/tech-knowhow/howto-configure-sharedstorage/)**

HPC/GPUクラスタを運用する際必須となるファイル共有ストレージは、NFSでこれを構築することが一般的ですが、この際の選択肢は、NFSのマネージドサービスである **ファイル・ストレージ** を使用する方法と、高帯域のネットワークポートを持つベア・メタル・インスタンスとストレージサービスを組合せてNFSサーバを自身で構築する方法があります
HPC/GPUクラスタを運用する際必須となるファイル共有ストレージは、NFSでこれをサービスすることが一般的ですが、この際の選択肢は、NFSのマネージドサービスである **ファイル・ストレージ** を使用する方法と、高帯域のネットワークポートを持つベア・メタル・インスタンスとストレージサービスで構築する方法があります
本テクニカルTipsは、コストパフォーマンス、可用性、構築・運用のしやすさ等を考慮し、自身の要件に沿った最適なファイル共有ストレージ構築手法を選定する方法を解説します。

- **[ブロック・ボリュームを使用するNFSサーバのインスタンス障害からの復旧方法](/ocitutorials/hpc/tech-knowhow/bv-sharedstorage-recovery/)**
Expand Down Expand Up @@ -728,7 +728,7 @@ $

**構成ソース・プロバイダ** は、 **GitHub** 等のソースコード管理サービスで公開されているソースコードを **[リソース・マネージャ](/ocitutorials/hpc/#5-2-リソースマネージャ)****[スタック](/ocitutorials/hpc/#5-3-スタック)** として取り込むための、ソースコード管理サービスへの接続情報を持つOCIリソースです。

**GitHub** 等で公開されている **[Terraform](/ocitutorials/hpc/#5-12-terraform)** スクリプトを基にOCI上にHPC/GPUクラスタを構築する場合、まずこの **構成ソース・プロバイダ** を作成し、これを介して **Terraform** スクリプトを **GitHub** 等から取り込んで **リソース・マネージャ****スタック** を作成、この **スタック** を適用してデプロイします。
**GitHub** 等で公開されている **[Terraform](/ocitutorials/hpc/#5-12-terraform)** スクリプトを基にOCI上にHPC/GPUクラスタ等を自動構築する場合、まずこの **構成ソース・プロバイダ** を作成し、これを介して **Terraform** スクリプトを **GitHub** 等から取り込んで **リソース・マネージャ****スタック** を作成、この **スタック** を適用してデプロイします。

**[OCI HPCチュートリアル集](#1-oci-hpcチュートリアル集)** で紹介する **Terraform** スクリプトを使用する手法は、ソースコード管理サービスに **GitHub** を使用しますが、 **GitHub** にアクセスするための **構成ソース・プロバイダ** の作成は、 **GitHub** のアカウントを持っておりこのアカウントで **Personal access token** を発行しておく必要があります。
**GitHub** のアカウント作成は **[ここ](https://github.com/signup?ref_cta=Sign+up&ref_loc=header+logged+out&ref_page=%2F&source=header-home)****Personal access token** の発行は **[ここ](https://docs.github.com/ja/authentication/keeping-your-account-and-data-secure/managing-your-personal-access-tokens)** を参照してください。
Expand Down
2 changes: 1 addition & 1 deletion tutorials/_hpc/benchmark/run-imb.md
Original file line number Diff line number Diff line change
Expand Up @@ -46,7 +46,7 @@ header:
2. **Intel MPI Benchmarks** インストール
3. **Intel MPI Benchmarks** 実行

## 1-1. **OpenMPI** インストール
## 1-1. OpenMPIインストール

**[OCI HPCテクニカルTips集](/ocitutorials/hpc/#3-oci-hpcテクニカルtips集)****[Slurm環境での利用を前提とするOpenMPI構築方法](/ocitutorials/hpc/tech-knowhow/build-openmpi/)** に従い、 **Intel MPI Benchmarks** を実行する全てのノードに **OpenMPI** をインストールします。

Expand Down
Loading

0 comments on commit d34289c

Please sign in to comment.