インフラストラクチャ・ヘルス・メトリック

コンピュート仮想マシン(VM)およびベア・メタル・インスタンスのインフラストラクチャのヘルス、容量およびパフォーマンスは、メトリックアラームおよび通知を使用してモニターできます。

このトピックでは、メトリック・ネームスペースoci_compute_infrastructure_healthによって出力されるメトリックについて説明します。

リソース: コンピュート・インスタンス。

メトリックの概要: oci_compute_infrastructure_health

コンピュートのインフラストラクチャ・ヘルス・メトリックは、コンピュート・インスタンスのステータスおよびヘルスのモニターに役立ちます。

  • インスタンス・ヘルス(稼働中/停止)ステータス: instance_statusメトリックにより、VMインスタンスが実行中の状態のとき使用可能(稼働中)か使用不可(停止)かを確認できます。インスタンスが30分を超えて使用できない場合は、サポートに連絡してください。
  • インスタンス・メンテナンス・ステータス: maintenance_statusメトリックにより、VMまたはベア・メタル・インスタンスの計画インフラストラクチャ・メンテナンスがスケジュールされているかどうかをモニターできます。
  • ベア・メタル・インフラストラクチャ・ヘルス・ステータス: health_statusメトリックにより、CPUやメモリーなどのハードウェア・コンポーネントを含むベア・メタル・インスタンスのインフラストラクチャのヘルスをモニターできます。

メトリックの値に基づいて、予防的に影響を受けるインスタンスを正常なハードウェアに移動できるため、アプリケーションへの影響を最小限に抑えることができます。

必要なIAMポリシー

リソースをモニターするには、コンソールを使用するか、SDK、CLIまたはその他のツールでREST APIを使用するかにかかわらず、管理者が作成するポリシーで必要なタイプのアクセス権が付与されている必要があります。ポリシーでは、モニター・サービスおよびモニター対象のリソースにアクセス権を付与する必要があります。アクションを実行しようとしたときに、権限がない、または認可されていないというメッセージが表示される場合は、付与されているアクセスのタイプと作業するコンパートメントを管理者に確認してください。モニタリングのユーザー認可の詳細は、「IAMポリシー」(モニター)を参照してください。

使用可能なメトリック: oci_compute_infrastructure_health

次の表に示すメトリックは、インスタンスで自動的に使用可能になります。これらのメトリックを取得するためにインスタンスでモニタリングを有効にする必要はありません。

モニタリング・サービスを使用して、カスタム問合せを作成することもできます。

メトリックに応じて、次のディメンションを使用できます:

faultClass

ハードウェアの問題のタイプ:

  • CPU: 1つ以上のCPUで障害が検出されました。
  • MEM-BOOT: インスタンスの起動中または最近の再起動中にメモリー・サブシステムで障害が検出されました。
  • MEM-RUNTIME: メモリー・サブシステムで障害が検出されました。
  • MGMT-CONTROLLER: インスタンス管理コントローラの障害が検出されました。
  • PCI: PCIサブシステムの障害が検出されました。
  • PCI-NIC: インスタンス・ネットワーク・インタフェース・カード(NIC)で障害が検出されました。

    重要

    PCI-NICフォルト・クラスは、非推奨です。同様の機能を使用するには、PCIフォルト・クラスに移行する必要があります。
  • SDN-INTERFACE: インスタンス・ソフトウェア定義ネットワーク・インタフェースで障害が検出されました。

トラブルシューティングの提案およびこれらのハードウェアの問題の詳細は、ベア・メタル・インスタンスのコンピュート・ヘルス・モニタリングを参照してください。

resourceDisplayName
インスタンスのわかりやすい名前。
resourceId
インスタンスのOCID 
maintenanceDueTime

24時間メンテナンス・ウィンドウのスケジュールされた開始時間(RFC3339で定義されたフォーマット)。

computeMaintenanceAction

スケジュール済メンテナンス・イベント中にインスタンスでOracle Cloud Infrastructureが実行するアクション:

  • REBOOT: インスタンスは、メンテナンスが必要な物理ホストから正常なホストに移行されます。ライブ移行が不可能な場合、インスタンスは再起動移行されます。
  • REBUILD_IN_PLACE: インスタンスは停止され、同じ物理ハードウェア上に再構築されてから再起動されます。メンテナンス・プロセス中に数時間の停止時間が発生します。
recommendedAction

アプリケーションで停止時間が発生する方法とタイミングを制御できるように、スケジュールされたメンテナンス・イベントの前に実行できるアクション。

  • REBOOT: スケジュールされたメンテナンス時間の前に、インスタンスを事前に再起動できます。メンテナンスのためにインスタンスを再起動移行すると、メンテナンスが必要な物理ホストでインスタンスが停止され、正常なホストで再起動されます。
メトリック メトリック表示名 単位 説明 ディメンション
health_status インフラストラクチャ・ヘルス・ステータス 問題

インスタンスのヘルスの問題の数。ゼロ以外の値はヘルスに不具合があることを示します。

このメトリックは、ベア・メタル・インスタンスでのみ使用できます。

faultClass

resourceDisplayName

resourceId

instance_status インスタンス・ステータス 件数

実行中のインスタンスのステータス。0の値は、インスタンスが使用可能(稼働中)であることを示します。1の値は、インフラストラクチャの問題のためにインスタンスが使用不可(停止)であることを示します。インスタンスが停止済の場合、メトリックに値はありません。

このメトリックは、VMインスタンスでのみ使用できます。

resourceDisplayName

resourceId

maintenance_status メンテナンス・ステータス 件数

インスタンスのメンテナンス・ステータス。0の値は、インスタンスのインフラストラクチャ・メンテナンス・イベントがスケジュールされていないことを示します。1の値は、インスタンスのインフラストラクチャ・メンテナンス・イベントがスケジュールされていることを示します。

このメトリックは、VMおよびベア・メタル・インスタンスの両方で使用できます。

maintenanceDueTime

computeMaintenanceAction

recommendedAction

resourceDisplayName

resourceId

コンソールの使用

単一コンピュート・インスタンスのインフラストラクチャ・ヘルス・メトリックを表示するには
  1. ナビゲーション・メニューを開き、「コンピュート」をクリックします。「コンピュート」で、「インスタンス」をクリックします。
  2. 関心のあるインスタンスをクリックします。
  3. 「リソース」で、「メトリック」をクリックします。
  4. 「メトリック・ネームスペース」リストで、「oci_compute_infrastructure_health」を選択します。

    メトリック・ページに、現在のインスタンスのデフォルトのチャート・セットが表示されます。

メトリックのモニタリングおよびアラームの使用の詳細は、モニタリングを参照してください。アラームの通知の詳細は、通知を参照してください。

コンパートメント内のすべてのコンピュート・インスタンスのインフラストラクチャ・ヘルス・メトリックを表示するには
  1. ナビゲーション・メニューを開き、「監視および管理」をクリックします。「モニタリング」で、「サービス・メトリック」をクリックします。
  2. コンパートメントを選択します。
  3. 「メトリック・ネームスペース」で、「oci_compute_infrastructure_health」を選択します。

    サービス・メトリック・ページは、選択したメトリック・ネームスペースから出力される各メトリックのチャートを示すように動的に更新されます。

メトリックのモニタリングおよびアラームの使用の詳細は、モニタリングを参照してください。アラームの通知の詳細は、通知を参照してください。