Manutenção da Infraestrutura

O Oracle Cloud Infrastructure executa a manutenção rotineira do data center na infraestrutura física das instâncias de computação. Essa manutenção inclui tarefas como fazer upgrade e substituir hardware ou executar manutenção que interrompe a energia do host. Este tópico fornece detalhes sobre manutenção da infraestrutura, opções de migração e métricas de status que você pode usar para monitorar a manutenção da infraestrutura.

Você pode usar métricas de integridade da infraestrutura de computação para monitorar o status de suas instâncias durante a manutenção.

Recuperando uma Instância Durante a Manutenção Planejada

Quando a infraestrutura subjacente de uma instância precisa passar por uma manutenção planejada, quando possível, o Oracle Cloud Infrastructure tentará recuperar automaticamente a instância. A ação de manutenção depende do tipo de instância.

  • Instâncias de máquina virtual (VM): Quando possível, a instância é migrada ao vivo para um host físico íntegro. Se a migração ao vivo não for possível, a instância passará pelo processo de migração com reinicialização ou será recriada no local, dependendo da forma.
  • Instâncias bare metal: Quando possível, a instância passará pelo processo de migração com reinicialização para um host físico íntegro. Se a migração com reinicialização não for possível, você deverá migrar manualmente a instância.

Manutenção Planejada para Instâncias de VM

Quando um evento de manutenção de infraestrutura afeta instâncias de VM, o Oracle Cloud Infrastructure migra ao vivo as instâncias de VM suportadas do host de VM físico que precisa de manutenção para um host de VM íntegro, com interrupção mínima das instâncias em execução.

Se uma instância de VM não puder ser migrada ao vivo ou não suportar a migração ao vivo, o Oracle Cloud Infrastructure programará uma data de vencimento de manutenção em até 14 a 16 dias e enviará a você uma notificação descrevendo o tipo de ação de manutenção necessário, como migração com reinicialização. Uma migração ao vivo poderá não ser bem-sucedida se algum dos seguintes eventos ocorrer durante a migração: há muita atividade na instância, uma alteração na instância foi feita usando a API ou ocorre erro interno não relacionado à instância.

Se uma instância de VM estiver programada para manutenção, você poderá reinicializar proativamente (ou interromper e iniciar) a instância a qualquer momento antes da data de vencimento da manutenção programada. A reinicialização proativa permite controlar como e quando seus aplicativos passam por tempo de inatividade. Se você não reinicializar a instância proativamente antes da data de vencimento, será feito para você o processo de migração com reinicialização ou recriação no local da instância, dependendo da forma.

Existe suporte para a manutenção gerenciada pelo cliente em instâncias de VM nas formas de instância padrão e com alta densidade de Entrada/Saída, incluindo imagens de plataforma e imagens personalizadas que foram importadas de fora do Oracle Cloud Infrastructure.

Para formas padrão, você pode prorrogar a data de vencimento da manutenção.

Se você optar por não reinicializar antes do tempo programado, o Oracle Cloud Infrastructure migrará ou recriará a instância. Após uma migração, por padrão, a instância é recuperada para o mesmo estado do ciclo de vida anterior ao evento de manutenção. Se você tiver um processo alternativo para recuperar a instância, poderá, opcionalmente, configurá-la para permanecer interrompida após a migração com reinicialização para um hardware íntegro.

Manutenção Planejada para Instâncias Bare Metal

Quando um evento de manutenção de infraestrutura afeta instâncias bare metal, o Oracle Cloud Infrastructure faz a migração com reinicialização de instâncias bare metal suportadas do host físico que precisa de manutenção para um host íntegro. O Oracle Cloud Infrastructure programa uma data de vencimento de manutenção dentro de 14 a 16 dias e envia a você uma notificação descrevendo o tipo de ação de manutenção necessário, como migração com reinicialização. Até 24 horas após a data de vencimento da manutenção, a instância bare metal é interrompida, migrada para um host íntegro e reiniciada. Um curto período de indisponibilidade ocorre durante a migração.

Se uma instância bare metal estiver programada para manutenção, você poderá reinicializar proativamente a instância a qualquer momento antes da data de vencimento da manutenção programada. A reinicialização proativa permite controlar como e quando seus aplicativos passam por tempo de inatividade. Se você não reinicializar a instância proativamente antes da data de vencimento, será feito para você o processo de migração com reinicialização da instância.

Existe suporte para a migração com reinicialização para instâncias bare metal em formas de instância padrão que usam imagens de plataforma baseadas em Linux. Não há suporte para a migração com reinicialização para instâncias bare metal em instâncias que usam imagens do Windows ou personalizadas, instâncias protegidas, instâncias que têm VNICs secundárias criadas e configuradas na NIC física com índice 1 ou em instâncias que não usam o comando padrão sanboot no script iPXE.

Para formas padrão, você pode prorrogar a data de vencimento da manutenção.

Se você optar por não reinicializar antes do tempo programado, o Oracle Cloud Infrastructure migrará ou recriará a instância. Após uma migração, por padrão, a instância é recuperada para o mesmo estado do ciclo de vida anterior ao evento de manutenção. Se houver um processo alternativo para recuperar a instância, você poderá, se preferir, configurá-la para permanecer interrompida após a migração com reinicialização para um hardware íntegro.

Identificando Instâncias com Manutenção Planejada

Se uma instância suportar as ações de manutenção de migração ao vivo, migração com reinicialização ou reconstrução no local, uma data no campo Reinicialização de manutenção da instância (disponível na Console, na CLI e nos SDKs) indicará que a manutenção planejada está programada. Para instâncias que suportam apenas a migração manual, o Oracle Cloud Infrastructure envia uma notificação, mas nenhuma data é exibida no campo Reinicialização de manutenção.

Para identificar as instâncias programadas para manutenção, execute um dos seguintes procedimentos:

Usando a Console: Para ver quais instâncias no compartimento atual estão programadas para manutenção
  1. Abra o menu de navegação e clique em Compute. No serviço Compute, clique em Instâncias.

    Se a instância tiver uma manutenção programada e puder ser reinicializada de modo proativo, um ícone de advertência será exibido ao lado do nome da instância.

  2. Clique na instância desejada e, em seguida, verifique o campo Reinicialização de manutenção da instância. Esse campo exibe a data e o horário de início da manutenção.
Usando a API: Para ver quais instâncias em um compartimento estão programadas para manutenção

Use a operação ListInstances. O campo timeMaintenanceRebootDue da Instância retorna a data e o horário inicial da manutenção.

Usando a Pesquisa: Para localizar todas as instâncias programadas para manutenção
  1. Na barra de navegação superior, clique em Pesquisar recursos, serviços, documentação e Marketplace e selecione Consulta avançada de recursos.
  2. Clique em Selecionar Consulta de Amostra e, em seguida, clique em Consultar todas as instâncias que tenham uma futura reinicialização de manutenção programada.
  3. Clique em Pesquisar.

Uma instância não será mais afetada por um evento de manutenção quando o campo Reinicialização de manutenção da instância estiver em branco.

Recuperação de VM em Decorrência de Falha de Infraestrutura

Quando a infraestrutura subjacente de uma instância de VM falhar por causa de problemas de software ou hardware, o Oracle Cloud Infrastructure tentará recuperar automaticamente a instância.

As instâncias de VM padrão são recuperadas usando uma migração com reinicialização, que restaura automaticamente a VM em um host íntegro, seja ele o host físico original ou outro host físico. A falha da VM é detectada um minuto após a ocorrência. Se o host não puder ser recuperado imediatamente, ocorrerá uma movimentação íntegra, em que a VM será movida para outro host. Nesse cenário, o processo de migração e reinicialização em um host íntegro é iniciado automaticamente em cinco minutos. Durante a reinicialização, as propriedades da instância, como endereços IP públicos privados e efêmeros, volumes em blocos anexados e VNICs, são preservadas.

As instâncias de VM com alta densidade de E/S são recuperadas com a reinicialização da instância no mesmo host físico. Se não for possível recuperar uma instância com alta densidade de Entrada/Saída no mesmo host físico, o Oracle Cloud Infrastructure notificará você para excluir (encerrar) a instância em até de 14 dias. Se você não excluir a instância antes do prazo, o Oracle Cloud Infrastructure desativará a instância no prazo e a excluirá nos próximos sete dias. O volume de inicialização e o volume de dados anexados remoto são preservados.

O Oracle Cloud Infrastructure notifica você por e-mail ou anúncios de qualquer evento de falha de infraestrutura de VM, com o status da ação de recuperação que foi executada. Você também pode monitorar a métrica de status da instância para ficar ciente de qualquer reinicialização inesperada.

Você não tem a opção de reiniciar suas VMs automaticamente configurando suas instâncias para permanecerem interrompidas depois de recuperadas.

Métricas de Integridade da Infraestrutura

Você pode usar métricas, alarmes e notificações para monitorar o status de manutenção da infraestrutura na qual as suas instâncias de computação são executadas. As principais métricas a serem consideradas para a manutenção da infraestrutura são as métricas de integridade da infraestrutura:

  • Status de integridade da instância (ativo/down): A métrica instance_status permite verificar se uma instância de VM está disponível (ativa) ou indisponível (down) quando no estado em execução. Se a instância ficar indisponível por mais de 30 minutos, entre em contato com o suporte.
  • Status de manutenção da instância: A métrica maintenance_status permite monitorar se uma instância de VM ou bare metal está programada para manutenção de infraestrutura planejada.
  • Status de integridade da infraestrutura bare metal: A métrica health_status ajuda você a monitorar a integridade da infraestrutura das instâncias bare metal, incluindo componentes de hardware, como CPU e memória.

Exibindo o Status da Instância e as Notificações de Manutenção na Console

Você pode exibir o status da instância e as notificações de reinicialização de manutenção na Console na página Detalhes da Instância. Para ver estes campos:

  1. Abra o menu de navegação e clique em Compute. No serviço Compute, clique em Instâncias.
  2. Clique na instância em que você está interessado.
  3. Na guia Informações da instância, na seção Detalhes da instância, consulte o campo Status da instância e o campo Reinicialização de manutenção.
    Observação

    O campo Status da instância só será exibido caso a instância não tenha estado disponível no mês passado.

Ações de Manutenção

O Oracle Cloud Infrastructure suporta uma variedade de ações de manutenção para instâncias de computação, incluindo recriação no local, migração ao vivo, migração de reinicialização e migração manual. A ação de manutenção depende de características como a forma que a instância usa.

Recriar no Local

Esta ação de manutenção não move a instância. No horário programado, a instância é interrompida, reconstruída no mesmo hardware físico e reiniciada. Um período de indisponibilidade de várias horas ocorre durante o processo de manutenção.

Uma recriação no local preserva as propriedades da instância vinculadas ao hardware físico, como o endereço MAC ou o número de identificação universal. Uma recriação no local também permite que você mantenha o SSD baseado em NVMe anexado localmente em uma instância com alta densidade de Entrada/Saída.

Para VMs, se quiser minimizar o período de indisponibilidade e excluir o SSD baseado em NVMe anexado localmente, você poderá reinicializar proativamente a instância antes do horário de manutenção programado. Será feito na instância o processo de migração com reinicialização para um host íntegro e o SSD será excluído permanentemente. Um curto período de indisponibilidade ocorre durante a migração.

Ações de Manutenção da Migração

As outras três ações de manutenção envolvem a migração de instâncias. Para obter informações detalhadas sobre cada ação de manutenção, consulte Live, Reboot e Migração Manual: Movendo uma Instância de Computação para um Novo Host. Ou clique em um dos links a seguir para ir diretamente aos detalhes dessa ação.