Métricas da Instância do Serviço Compute

Você pode monitorar a integridade, a capacidade e o desempenho de suas instâncias de computação usando métricas, alarmes e notificações.

Este tópico descreve as métricas emitidas pelo namespace de métricas oci_computeagent (o plug-in Compute Instance Monitoring nas instâncias de computação).

Você pode exibir essas métricas para instâncias de computação individuais e para todas as instâncias em um pool de instâncias.

Recursos: Instâncias de computação ativadas para Monitoramento

Visão Geral das Métricas de uma Instância e Recursos Relacionados

Esta seção fornece uma visão geral dos diferentes tipos de métricas disponíveis para uma instância e seus dispositivos de armazenamento e rede. Consulte o diagrama e a tabela a seguir para obter um resumo.

Esta imagem mostra os tipos de métricas disponíveis para uma instância e componentes relacionados.

Namespace de Métricas ID do Recurso Onde Medido Métricas Disponíveis
oci_computeagent OCID da Instância Na instância. As métricas deste namespace são agregadas entre todos os recursos relacionados na instância. Por exemplo, DiskBytesRead é agregado em todos os volumes de armazenamento anexados da instância, e NetworkBytesIn é agregado em todas as VNICs anexadas da instância.

Consulte Métricas Disponíveis: oci_computeagent.

oci_blockstore OCID do volume em blocos ou de inicialização Pelo serviço Block Volume. As métricas são para um volume individual (volume de inicialização ou volume em blocos). Consulte Métricas do Serviço Block Volume.
oci_vcn OCID da VNIC Pelo serviço Networking. As métricas são de uma VNIC individual.

Consulte Métricas de VNIC.

Antes de começar

  • Políticas do serviço IAM: Para monitorar recursos, você deve ter o tipo necessário de acesso em uma política  gravada por um administrador, quer esteja usando a Console ou a API REST com um SDK, uma CLI ou outra ferramenta. A política deve fornecer acesso aos serviços de monitoramento, bem como aos recursos que estão sendo monitorados. Caso tente executar uma ação e receba uma mensagem de que não tem permissão ou que não está autorizado, confirme com o administrador o tipo de acesso que você tem e em qual compartimento  trabalhar. Para obter mais informações sobre autorizações do usuário para monitoramento, consulte Políticas do Serviço IAM (Monitoring).
  • Métricas existentes no Monitoring: Os recursos que você deseja monitorar devem emitir métricas para o serviço Monitoring.
  • Instâncias do serviço Compute: Para emitir métricas, o plug-in de Monitoramento de Instâncias do Serviço Compute deve estar ativado na instância e os plug-ins devem estar em execução. A instância também deve ter um gateway de serviço ou um endereço IP público para enviar métricas ao serviço Monitoring. Para obter mais informações, consulte Ativando o Monitoramento de Instâncias do Serviço Compute.

Métricas Disponíveis: oci_computeagent

As métricas da instância de computação ajudam você a medir o nível de atividade e o throughput das instâncias de computação. As métricas listadas na tabela a seguir estão disponíveis para qualquer instância de computação com monitoramento ativado. Para obter essas métricas, ative o monitoramento na instância.

As métricas deste namespace são agregadas entre todos os recursos relacionados na instância. Por exemplo, DiskBytesRead é agregado em todos os volumes de armazenamento anexados da instância, e NetworkBytesIn é agregado em todas as VNICs anexadas da instância.

Para métricas emitidas pelo namespace de métricas oci_computeagent, os pontos de dados são amostrados a cada dez segundos. Um batch de seis pontos de dados é emitido a cada minuto. Portanto, para granularidade a cada minuto, a contagem agregada é sempre seis, a soma agregada é a soma dos seis pontos de dados e a média agregada é a média dos seis pontos de dados.

Você também pode usar o serviço Monitoring para criar consultas personalizadas.

Cada métrica inclui as seguintes dimensões:

availabilityDomain
O domínio de disponibilidade no qual a instância reside.
faultDomain
O domínio de falha no qual a instância reside.
imageId
O OCID da imagem  da instância.
instancePoolId
O pool de instâncias ao qual a instância pertence.
região
A região  onde a instância reside.
resourceDisplayName
O nome amigável da instância.
resourceId
O OCID  da instância.
forma
A forma  da instância.
Métrica Nome para Exibição da Métrica Unidade Descrição Dimensões
CpuUtilization Utilização de CPU  percentual

Nível de atividade da CPU. Expresso como um percentual do tempo total.

Para pools de instâncias, o valor é médio entre todas as instâncias do pool.

availabilityDomain

faultDomain

imageId

instancePoolId

region

resourceDisplayName

resourceId

shape

DiskBytesRead1, 3 Bytes de Leitura de Disco bytes Throughput de leitura. Expresso como bytes lidos por intervalo.
DiskBytesWritten1, 3 Bytes de Gravação em Disco bytes Throughput de gravação. Expresso como bytes gravados por intervalo.
DiskIopsRead1, 3 Entrada/Saída de Leitura de Disco operações Nível de atividade de leituras de Entrada/Saída. Expresso como leituras por intervalo.
DiskIopsWritten1, 3 Entrada/Saída de Gravação em Disco operações Nível de atividade de gravações de Entrada/Saída. Expresso como gravações por intervalo.
LoadAverage Média de Carga número de processos Carga média do sistema calculada ao longo de um período de 1 minuto.
MemoryAllocationStalls Paralisações de Alocação de Memória número de paralisações Número de vezes em que a reivindicação de página foi chamada diretamente.
MemoryUtilization1 Utilização de Memória percentual

Espaço usado atualmente. Medido por páginas. Expresso como um percentual de páginas utilizadas.

Para pools de instâncias, o valor é médio entre todas as instâncias do pool.

NetworksBytesIn1, 2 Bytes Recebidos na Rede bytes

Throughput de recebimento de rede. Expresso como bytes recebidos.

NetworksBytesOut1, 2 Bytes Transmitidos na Rede bytes Throughput de transmissão de rede. Expresso como bytes transmitidos.

1 Esta métrica é um contador cumulativo que mostra um comportamento uniformemente crescente para cada sessão do software Oracle Cloud Agent, fazendo a redefinição quando o sistema operacional é reiniciado.

2 O serviço Networking fornece mais métricas (no namespace de métricas oci_vcn) para cada VNIC da instância. Para obter mais informações, consulte Métricas do serviço Networking.

3 O serviço Block Volume fornece mais métricas (no namespace de métricas oci_blockstore) para cada volume anexado à instância. Para obter mais informações, consulte Métricas de Volume em Blocos.

Métricas Disponíveis: gpu_infrastructure_health

As métricas da instância de computação ajudam você a medir o nível de atividade e o throughput das instâncias de computação. As métricas listadas na tabela a seguir estão disponíveis para qualquer instância de computação com monitoramento ativado. Para obter essas métricas, ative o monitoramento na instância.

As métricas deste namespace são agregadas entre todos os recursos relacionados na instância. Por exemplo, DiskBytesRead é agregado em todos os volumes de armazenamento anexados da instância, e NetworkBytesIn é agregado em todas as VNICs anexadas da instância.

Para métricas emitidas pelo namespace de métricas gpu_infrastructure_health, os pontos de dados são amostrados a cada dez segundos. Um batch de seis pontos de dados é emitido a cada minuto. Portanto, para granularidade a cada minuto, a contagem agregada é sempre seis, a soma agregada é a soma dos seis pontos de dados e a média agregada é a média dos seis pontos de dados.

Você também pode usar o serviço Monitoring para criar consultas personalizadas.

Cada métrica inclui as seguintes dimensões:

componente
GPU ou rdma_nic
timestamp
Horário UTC em que o payload/pulsação cardíaca é emitido
versão
O número da versão do payload para compatibilidade
Métrica Nome para Exibição da Métrica Unidade Descrição Dimensões
GpuUtilization Utilização de GPU percentual

Nível de atividade da GPU. Expresso como um percentual do tempo total.

Para pools de instâncias, o valor é médio entre todas as instâncias do pool.

availabilityDomain

faultDomain

gpuId

imageId

instancePoolId

region

resourceDisplayName

resourceId

shape

GpuMemoryUtilization Utilização de memória de GPU percentual A porcentagem do recurso de memória de GPU em uso.
GpuPowerDraw Desenho de energia da GPU inteiro A quantidade de potência de GPU usada.
GpuTemperature Temperatura da GPU inteiro A temperatura da GPU informada.
GpuEccSingleBitErrors Erros de bit único de GPU inteiro O número de erros de ECC de bit único de GPU relatados.
GpuEccDoubleBitErrors Erros de dois bits de GPU inteiro O número de erros de ECC de bit duplo de GPU relatados.

1 Esta métrica é um contador cumulativo que mostra um comportamento uniformemente crescente para cada sessão do software Oracle Cloud Agent, fazendo a redefinição quando o sistema operacional é reiniciado.

2 O serviço Networking fornece mais métricas (no namespace de métricas oci_vcn) para cada VNIC da instância. Para obter mais informações, consulte Métricas do serviço Networking.

3 O serviço Block Volume fornece mais métricas (no namespace de métricas oci_blockstore) para cada volume anexado à instância. Para obter mais informações, consulte Métricas de Volume em Blocos.

Métricas Disponíveis: rdma_infrastructure_health

As métricas da instância de computação ajudam você a medir o nível de atividade e o throughput das instâncias de computação. As métricas listadas na tabela a seguir estão disponíveis para qualquer instância de computação com monitoramento ativado. Para obter essas métricas, ative o monitoramento na instância.

As métricas deste namespace são agregadas entre todos os recursos relacionados na instância. Por exemplo, DiskBytesRead é agregado em todos os volumes de armazenamento anexados da instância, e NetworkBytesIn é agregado em todas as VNICs anexadas da instância.

Para métricas emitidas pelo namespace de métricas rdma_infrastructure_health, os pontos de dados são amostrados a cada dez segundos. Um batch de seis pontos de dados é emitido a cada minuto. Portanto, para granularidade a cada minuto, a contagem agregada é sempre seis, a soma agregada é a soma dos seis pontos de dados e a média agregada é a média dos seis pontos de dados.

Você também pode usar o serviço Monitoring para criar consultas personalizadas.

Cada métrica inclui as seguintes dimensões:

componente
GPU ou rdma_nic
timestamp
Horário UTC em que o payload/pulsação cardíaca é emitido
versão
O número da versão do payload para compatibilidade
Métrica Nome para Exibição da Métrica Unidade Descrição Dimensões
RdmaTxBytes bytes de transmissão de rede agregada RDMA bytes Os bytes transmitidos na interface RDMA.

availabilityDomain

faultDomain

imageId

instancePoolId

rdmaId

region

resourceDisplayName

resourceId

shape

RdmaRxBytes bytes de recebimento de rede agregada RDMA bytes Os bytes recebidos na interface RDMA.
RdmaTxPackets Pacotes de transmissão de rede agregada RDMA inteiro O número de pacotes transmitidos da interface RDMA
RdmaRxPackets Pacotes de recebimento de rede agregada RDMA inteiro O número de pacotes recebidos da interface RDMA

1 Esta métrica é um contador cumulativo que mostra um comportamento uniformemente crescente para cada sessão do software Oracle Cloud Agent, fazendo a redefinição quando o sistema operacional é reiniciado.

2 O serviço Networking fornece mais métricas (no namespace de métricas oci_vcn) para cada VNIC da instância. Para obter mais informações, consulte Métricas do serviço Networking.

3 O serviço Block Volume fornece mais métricas (no namespace de métricas oci_blockstore) para cada volume anexado à instância. Para obter mais informações, consulte Métricas de Volume em Blocos.

Usando a Console

Para exibir gráficos de métrica padrão para uma única instância de computação
  1. Abra o menu de navegação e clique em Compute. No serviço Compute, clique em Instâncias.
  2. Clique na instância em que você está interessado.
  3. Em Recursos, clique em Métricas.
  4. Na lista Namespace de métricas, selecione oci_computeagent.

    A página Métricas exibe um conjunto padrão de gráficos para a instância atual.

    Não está visualizando gráficos de métrica para a instância?

    Se você não vir gráficos de métricas, pode ser que a instância não esteja emitindo métricas. Consulte as possíveis causas e soluções a seguir.

    Possível causa Como verificar Solução
    O plug-in Compute Instance Monitoring está desativado na instância ou os plug-ins foram interrompidos. Verifique as propriedades da instância. Ative o plug-in Compute Instance Monitoring e inicie todos os plug-ins.
    A instância não pode acessar o serviço Monitoring porque sua VCN não usa a internet. Verifique o endereço IP da instância. Caso não seja público, será necessário um gateway de serviço. Configure um gateway de serviço.
    A instância não usa uma imagem suportada. Verifique as imagens suportadas. Crie uma instância com uma imagem suportada.
    Imagens mais antigas e imagens personalizadas: Não existe software Oracle Cloud Agent na instância. Conecte-se à instância e procure o software. Instale o software Oracle Cloud Agent.
    Outra coisa está errada com o software Oracle Cloud Agent. (não aplicável) Siga as etapas de solução de problemas do Oracle Cloud Agent.

    Para obter mais informações sobre o monitoramento de métricas e o uso de alarmes, consulte Serviço Monitoring. Para obter informações sobre notificações de alarmes, consulte o serviço Notifications.

Para exibir gráficos de métrica padrão de todas as instâncias de computação em um compartimento
  1. Abra o menu de navegação e clique em Observabilidade e Gerenciamento. No serviço Monitoring, clique em Métricas do Serviço.
  2. Selecione um compartimento.
  3. Para Namespace de métricas, selecione oci_computeagent.

    A página Métricas do Serviço atualiza dinamicamente a página para mostrar gráficos para cada métrica emitida pelo namespace de métricas selecionado.

Para obter mais informações sobre o monitoramento de métricas e o uso de alarmes, consulte Serviço Monitoring. Para obter informações sobre notificações de alarmes, consulte o serviço Notifications.

Para exibir gráficos de métrica padrão para as instâncias em um pool de instâncias
  1. Abra o menu de navegação e clique em Compute. Em Compute, clique em Pools de Instâncias.
  2. Clique no pool de instâncias em que você está interessado.
  3. Em Recursos, clique em Métricas.
  4. Na lista Namespace de métricas, selecione oci_computeagent.

    A página Métricas exibe um conjunto padrão de gráficos para o pool de instâncias atual.

Para obter mais informações sobre o monitoramento de métricas e o uso de alarmes, consulte Serviço Monitoring. Para obter informações sobre notificações de alarmes, consulte o serviço Notifications.