コンピュート・インスタンス・メトリック

コンピュート・インスタンスのヘルス、容量およびパフォーマンスは、メトリックアラームおよび通知を使用してモニターできます。

このトピックでは、メトリック・ネームスペースoci_computeagent (コンピュート・インスタンス上のコンピュート・インスタンスのモニタリング・プラグイン)から出力されるメトリックについて説明します。

個々のコンピュート・インスタンス、およびインスタンス・プール内のすべてのインスタンスについて、これらのメトリックを表示できます。

リソース: モニタリング対応のコンピュート・インスタンス。

インスタンスおよび関連リソースのメトリックの概要

この項では、インスタンスおよびそのストレージ・デバイスとネットワーク・デバイスで使用可能な様々なタイプのメトリックの全体像を示します。概要は、次の図と表を参照してください。

この図は、インスタンスと関連コンポーネントで使用可能なメトリックのタイプを示しています。

メトリック・ネームスペース リソースID 測定される場所 使用可能なメトリック
oci_computeagent インスタンスのOCID インスタンス。このネームスペース内のメトリックは、インスタンス上のすべての関連リソースについて集計されます。たとえば、DiskBytesReadはインスタンスにアタッチされたすべてのストレージ・ボリュームについて集計され、NetworkBytesInはインスタンスにアタッチされたすべてのVNICについて集計されます。

使用可能なメトリック: oci_computeagentを参照してください。

oci_blockstore ブート・ボリュームまたはブロック・ボリュームのOCID ブロック・ボリューム・サービスごと。このメトリックは個々のボリューム(ブート・ボリュームまたはブロック・ボリューム)に対応しています。 ブロック・ボリューム・メトリックを参照してください。
oci_vcn VNICのOCID ネットワーキング・サービスごと。このメトリックは個々のVNICに対応しています。

VNICメトリックを参照してください。

開始する前に

  • IAMポリシー: リソースをモニターするには、コンソールを使用するか、SDK、CLIまたはその他のツールでREST APIを使用するかにかかわらず、管理者が作成するポリシーで必要なタイプのアクセス権が付与されている必要があります。ポリシーでは、モニター・サービスおよびモニター対象のリソースにアクセス権を付与する必要があります。アクションを実行しようとしたときに、権限がない、または認可されていないというメッセージが表示される場合は、付与されているアクセスのタイプと作業するコンパートメントを管理者に確認してください。モニタリングのユーザー認可の詳細は、「IAMポリシー」(モニター)を参照してください。
  • モニタリングに存在するメトリック: モニタリング対象のリソースは、モニタリング・サービスにメトリックを出力する必要があります。
  • コンピュート・インスタンス: メトリックを生成するには、コンピュート・インスタンスのモニタリング・プラグインがインスタンスで有効になっており、プラグインが実行されている必要があります。また、モニタリング・サービスにメトリックを送信するには、インスタンスにサービス・ゲートウェイまたはパブリックIPアドレスが必要です。詳細は、コンピュート・インスタンスのモニタリングの有効化を参照してください。

使用可能なメトリック: oci_computeagent

コンピュート・インスタンス・メトリックは、コンピュート・インスタンスのアクティビティ・レベルとスループットの測定に役立ちます。次の表に示すメトリックは、モニタリング対応のすべての コンピュート・インスタンスで使用できます。これらのメトリックを取得するには、インスタンスのモニタリングを有効にします。

このネームスペース内のメトリックは、インスタンス上のすべての関連リソースについて集計されます。たとえば、DiskBytesReadはインスタンスにアタッチされたすべてのストレージ・ボリュームについて集計され、NetworkBytesInはインスタンスにアタッチされたすべてのVNICについて集計されます。

メトリック・ネームスペースoci_computeagentから出力されるメトリックの場合、データ・ポイントは10秒ごとにサンプリングされます。毎秒6つのデータ・ポイントのバッチが発行されます。したがって、毎分の粒度の場合、集計数は常に6、集計合計は6つのデータ・ポイントの合計、集計平均は6つのデータ・ポイントの平均になります。

モニタリング・サービスを使用して、カスタム問合せを作成することもできます。

各メトリックには次のディメンションが含まれます:

availabilityDomain
インスタンスが存在する可用性ドメイン 
faultDomain
インスタンスが存在するフォルト・ドメイン
imageId
インスタンスのイメージ のOCID。
instancePoolId
インスタンスが属するインスタンス・プール
region
インスタンスが存在するリージョン
resourceDisplayName
インスタンスのわかりやすい名前。
resourceId
インスタンスのOCID 
shape
インスタンスのシェイプ
メトリック メトリック表示名 単位 説明 ディメンション
CpuUtilization CPU使用率 %

CPUのアクティビティ・レベル。合計時間に対する割合として表されます。

インスタンス・プールの場合、値はプール内のすべてのインスタンスの平均です。

availabilityDomain

faultDomain

imageId

instancePoolId

region

resourceDisplayName

resourceId

shape

DiskBytesRead1、3 ディスク読取りバイト バイト 読取りスループット一定時間当たりに読み取られたバイト数として表されます。
DiskBytesWritten1、3 ディスク書込みバイト バイト 書込みスループット。一定時間当たりに書き込まれたバイト数として表されます。
DiskIopsRead1、3 ディスク読取りI/O 操作 I/O読取りからのアクティビティ・レベル。一定時間当たりの読取り数として表されます。
DiskIopsWritten1、3 ディスク書込みI/O 操作 I/O書込みからのアクティビティ・レベル。一定時間当たりの書込み数として表されます。
LoadAverage 負荷平均 プロセス数 1分を期間として計算したシステムの平均負荷。
MemoryAllocationStalls メモリー割当てのストール ストール数 ページ再利用が直接コールされた回数。
MemoryUtilization1 メモリー使用率 %

現在使用中の領域。ページ単位で測定されます。使用済ページの割合として表されます。

インスタンス・プールの場合、値はプール内のすべてのインスタンスの平均です。

NetworksBytesIn1、2 ネットワーク受信バイト バイト

ネットワーク受信スループット。受信したバイト数で表されます。

NetworksBytesOut1、2 ネットワーク送信バイト バイト ネットワーク送信スループット。送信したバイト数で表されます。

1このメトリックは、Oracle Cloud Agentソフトウェアの各セッションについて単調に増加する動作を示す累積カウンタです。オペレーティング・システムが再起動されるときにリセットされます。

2ネットワーキング・サービスでは、インスタンス上の各VNICについて追加のメトリックが(oci_vcnメトリック・ネームスペースで)提供されます。詳細は、ネットワーキング・メトリックを参照してください。

3ブロック・ボリューム・サービスでは、インスタンスにアタッチされたボリュームごとに追加のメトリックが(oci_blockstoreメトリック・ネームスペースで)提供されます。詳細は、ブロック・ボリューム・メトリックを参照してください。

使用可能なメトリック: gpu_infrastructure_health

コンピュート・インスタンス・メトリックは、コンピュート・インスタンスのアクティビティ・レベルとスループットの測定に役立ちます。次の表に示すメトリックは、モニタリング対応のすべての コンピュート・インスタンスで使用できます。これらのメトリックを取得するには、インスタンスのモニタリングを有効にします。

このネームスペース内のメトリックは、インスタンス上のすべての関連リソースについて集計されます。たとえば、DiskBytesReadはインスタンスにアタッチされたすべてのストレージ・ボリュームについて集計され、NetworkBytesInはインスタンスにアタッチされたすべてのVNICについて集計されます。

メトリック・ネームスペースgpu_infrastructure_healthから出力されるメトリックの場合、データ・ポイントは10秒ごとにサンプリングされます。毎秒6つのデータ・ポイントのバッチが発行されます。したがって、毎分の粒度の場合、集計数は常に6、集計合計は6つのデータ・ポイントの合計、集計平均は6つのデータ・ポイントの平均になります。

モニタリング・サービスを使用して、カスタム問合せを作成することもできます。

各メトリックには次のディメンションが含まれます:

コンポーネント
GPUまたはrdma_nic
タイムスタンプ
ペイロード/ハートビートが出力されるUTC時間
翻訳
互換性のペイロード・バージョン番号
メトリック メトリック表示名 単位 説明 ディメンション
GpuUtilization GPU使用率 %

GPUのアクティビティ・レベル。合計時間に対する割合として表されます。

インスタンス・プールの場合、値はプール内のすべてのインスタンスの平均です。

availabilityDomain

faultDomain

gpuId

imageId

instancePoolId

region

resourceDisplayName

resourceId

shape

GpuMemoryUtilization GPUメモリー使用率 % 使用中のGPUメモリー・リソースの割合。
GpuPowerDraw GPUパワー・ドロー 整数値 使用されるGPU電力の量。
GpuTemperature GPU温度 整数値 報告されたGPU温度。
GpuEccSingleBitErrors GPUシングルビット・エラー 整数値 報告されたGPUシングル・ビットECCエラーの数。
GpuEccDoubleBitErrors GPUダブルビットエラー 整数値 報告されたGPUダブル・ビットECCエラーの数。

1このメトリックは、Oracle Cloud Agentソフトウェアの各セッションについて単調に増加する動作を示す累積カウンタです。オペレーティング・システムが再起動されるときにリセットされます。

2ネットワーキング・サービスでは、インスタンス上の各VNICについて追加のメトリックが(oci_vcnメトリック・ネームスペースで)提供されます。詳細は、ネットワーキング・メトリックを参照してください。

3ブロック・ボリューム・サービスでは、インスタンスにアタッチされたボリュームごとに追加のメトリックが(oci_blockstoreメトリック・ネームスペースで)提供されます。詳細は、ブロック・ボリューム・メトリックを参照してください。

使用可能なメトリック: rdma_infrastructure_health

コンピュート・インスタンス・メトリックは、コンピュート・インスタンスのアクティビティ・レベルとスループットの測定に役立ちます。次の表に示すメトリックは、モニタリング対応のすべての コンピュート・インスタンスで使用できます。これらのメトリックを取得するには、インスタンスのモニタリングを有効にします。

このネームスペース内のメトリックは、インスタンス上のすべての関連リソースについて集計されます。たとえば、DiskBytesReadはインスタンスにアタッチされたすべてのストレージ・ボリュームについて集計され、NetworkBytesInはインスタンスにアタッチされたすべてのVNICについて集計されます。

メトリック・ネームスペースrdma_infrastructure_healthから出力されるメトリックの場合、データ・ポイントは10秒ごとにサンプリングされます。毎秒6つのデータ・ポイントのバッチが発行されます。したがって、毎分の粒度の場合、集計数は常に6、集計合計は6つのデータ・ポイントの合計、集計平均は6つのデータ・ポイントの平均になります。

モニタリング・サービスを使用して、カスタム問合せを作成することもできます。

各メトリックには次のディメンションが含まれます:

コンポーネント
GPUまたはrdma_nic
タイムスタンプ
ペイロード/ハートビートが出力されるUTC時間
翻訳
互換性のペイロード・バージョン番号
メトリック メトリック表示名 単位 説明 ディメンション
RdmaTxBytes RDMA集計ネットワーク送信バイト バイト RDMAインタフェース上で送信されるバイト数。

availabilityDomain

faultDomain

imageId

instancePoolId

rdmaId

region

resourceDisplayName

resourceId

shape

RdmaRxBytes RDMA集約ネットワーク受信バイト バイト RDMAインタフェースで受信されたバイト数。
RdmaTxPackets RDMA集約ネットワーク送信パケット 整数値 転送されたRDMAインタフェースパケット数。
RdmaRxPackets RDMA集約ネットワーク受信パケット 整数値 受信されたRDMAインタフェースパケット数。

1このメトリックは、Oracle Cloud Agentソフトウェアの各セッションについて単調に増加する動作を示す累積カウンタです。オペレーティング・システムが再起動されるときにリセットされます。

2ネットワーキング・サービスでは、インスタンス上の各VNICについて追加のメトリックが(oci_vcnメトリック・ネームスペースで)提供されます。詳細は、ネットワーキング・メトリックを参照してください。

3ブロック・ボリューム・サービスでは、インスタンスにアタッチされたボリュームごとに追加のメトリックが(oci_blockstoreメトリック・ネームスペースで)提供されます。詳細は、ブロック・ボリューム・メトリックを参照してください。

コンソールの使用

単一コンピュート・インスタンスのデフォルトのメトリック・チャートを表示するには
  1. ナビゲーション・メニューを開き、「コンピュート」をクリックします。「コンピュート」で、「インスタンス」をクリックします。
  2. 関心のあるインスタンスをクリックします。
  3. 「リソース」で、「メトリック」をクリックします。
  4. 「メトリック・ネームスペース」リストで、「oci_computeagent」を選択します。

    メトリック・ページに、現在のインスタンスのデフォルトのチャート・セットが表示されます。

    インスタンスのメトリック・チャートが表示されない

    メトリック・チャートがまったく表示されない場合、インスタンスからメトリックが出力されていない可能性があります。次に示す考えられる原因と解決方法を参照してください。

    考えられる原因 確認方法 解決策
    コンピュート・インスタンスのモニタリング・プラグインがインスタンスで無効になっているか、プラグインが停止しています。 インスタンス・プロパティを確認します。 コンピュート・インスタンスのモニタリング・プラグインを有効にし、すべてのプラグインを起動します
    VCNがインターネットを使用していないため、インスタンスはモニタリング・サービスにアクセスできません。 インスタンスのIPアドレスを確認します。パブリックでない場合は、サービス・ゲートウェイが必要です。 サービス・ゲートウェイを設定します
    インスタンスはサポートされているイメージを使用しません。 サポートされているイメージを確認します。 サポートされているイメージを使用してインスタンスを作成します。
    古いイメージおよびカスタム・ イメージ: インスタンス上にOracle Cloud Agentソフトウェアが存在しません。 インスタンスに接続し、ソフトウェアを探します。 Oracle Cloud Agentソフトウェアをインストールします
    Oracle Cloud Agentソフトウェアに問題があります。 (なし) Oracle Cloud Agentのトラブルシューティング・ステップに従います

    メトリックのモニタリングおよびアラームの使用の詳細は、モニタリングを参照してください。アラームの通知の詳細は、通知を参照してください。

コンパートメント内のすべてのコンピュート・インスタンスのデフォルトのメトリック・チャートを表示するには
  1. ナビゲーション・メニューを開き、「監視および管理」をクリックします。「モニタリング」で、「サービス・メトリック」をクリックします。
  2. コンパートメントを選択します。
  3. 「メトリック・ネームスペース」で、「oci_computeagent」を選択します。

    サービス・メトリック・ページでは、選択したメトリック・ネームスペースから出力される各メトリックのチャートを示すようにページが動的に更新されます。

メトリックのモニタリングおよびアラームの使用の詳細は、モニタリングを参照してください。アラームの通知の詳細は、通知を参照してください。

インスタンス・プール内のインスタンスのデフォルトのメトリック・チャートを表示するには
  1. ナビゲーション・メニューを開き、「コンピュート」をクリックします。「コンピュート」で、「インスタンス・プール」をクリックします。
  2. 関心のあるインスタンス・プールをクリックします。
  3. 「リソース」で、「メトリック」をクリックします。
  4. 「メトリック・ネームスペース」リストで、「oci_computeagent」を選択します。

    メトリック・ページに、現在のインスタンス・プールのデフォルトのチャート・セットが表示されます。

メトリックのモニタリングおよびアラームの使用の詳細は、モニタリングを参照してください。アラームの通知の詳細は、通知を参照してください。