Failover | Definições do Glossário de Tecnologia

O que é um failover?

Um failover é uma operação de backup que troca o sistema primário para um computador, rede ou componente secundário quando o sistema central falha ou desliga temporariamente. Ele garante que os sistemas continuem a operar e a fornecer serviços durante o tempo de inatividade.

Provedores de sistema de nomes de domínio (DNS) gerenciados ajudam as organizações a gerenciar o failover enquanto controlam o tráfego de DNS. Isso previne o tempo de inatividade do sistema, ajudando a empresa a economizar em custos. O tempo de inatividade do sistema não implica perda de vendas ou produtividade, mas se houver danos relacionados a acordos de nível de serviço (SLAs), pode causar penalidades.

Failovers são parte de uma estratégia abrangente de gerenciamento de riscos e ajudam as empresas a manter a continuidade em incidentes imprevistos.

Muitas organizações usam clusters de failover para empregar uma rede de sistemas e servidores para tornar os aplicativos de software tolerantes a falhas. Elas visam alcançar disponibilidade consistente. Se um servidor falhar, outro assumirá seu lugar e carga. Este processo requer vários servidores físicos e sistemas virtuais.

G2 Grid® para Software de Provedores de DNS Gerenciados

Tipos de failover

Existem fatores como restrições orçamentárias e requisitos técnicos que as organizações consideram antes de escolher o tipo de failover que irão empregar. Abaixo estão alguns tipos notáveis de failover no mercado.

Failover ativo-passivo: Este é o failover mais comum. Aqui, o sistema secundário ou passivo torna-se ativo apenas quando o sistema primário está corrompido.
Failover ativo-ativo: Os sistemas primário e secundário trabalham juntos para lidar com a carga de trabalho. Se um sistema ou componente falhar, o outro assume, garantindo o uso eficiente dos recursos. No entanto, requer balanceamento de carga e sincronização complexos.
Failover balanceado por carga: Múltiplos servidores operam em paralelo, e um balanceador de carga distribui sua carga de trabalho. Se um componente falhar, a carga de trabalho é distribuída entre os servidores restantes.
Failover geográfico: Implanta sistemas de backup em vários locais para proteger sites distantes de falhas causadas por acidentes.
Failover de banco de dados: São projetados para bancos de dados e envolvem bancos de dados primários e de espera. Como outros failovers, o banco de dados secundário ou de espera assume se o banco de dados primário falhar.
Failover baseado em nuvem: Usa recursos de nuvem como um mecanismo de failover. Isso é comum em ambientes híbridos onde serviços de nuvem são usados como backup para falhas no local.
Failover de armazenamento: Envolve múltiplos sistemas de armazenamento idênticos. Se o armazenamento primário falhar, o outro armazenamento garante a acessibilidade dos dados.
Failover em nível de aplicação: Alguns aplicativos vêm com capacidades de failover embutidas. Se o aplicativo falhar em um servidor, ele pode reiniciar automaticamente ou mudar para o segundo servidor.
Failover de rede: Mantém cópias de caminhos e componentes de rede. O sistema seguirá automaticamente o segundo caminho se um caminho de rede falhar.
Failover de sistema de nomes de domínio (DNS): Usa o gerenciamento de DNS para redirecionar o tráfego para um servidor ou site diferente se o site primário apresentar um erro ou estiver indisponível.

O que acontece em um failover?

O failover garante uma transição sem esforço de um sistema primário para um secundário em crise. Veja o que exatamente acontece.

Estado inicial: O sistema primário está ativamente atendendo solicitações.
Gatilho: Falha detectada no sistema primário.
Ativação do failover: O sistema secundário assume automaticamente a ação.
Redirecionamento de tráfego: Todas as solicitações agora são direcionadas para o sistema secundário.
Restauração do sistema primário: O failback ocorre quando o sistema primário é consertado e tudo retorna ao sistema primário.
Monitoramento: Garante estabilidade e prontidão para manter a confiabilidade do serviço.

Aplicações de failover

Diferentes setores utilizam failovers de acordo com suas necessidades. Abaixo estão alguns casos de uso comuns em várias indústrias.

Serviços financeiros: Bancos e instituições financeiras usam failovers para garantir a disponibilidade contínua dos sistemas de processamento de transações. Essas organizações frequentemente empregam mecanismos de failover ativo-ativo para alta disponibilidade.
Saúde: Hospitais e prestadores de serviços de saúde usam failover para manter o acesso aos registros eletrônicos de saúde (EHRs). Eles empregam replicação de banco de dados e virtualização para garantir a integridade e acessibilidade dos dados. O uso de failovers aqui reduz significativamente o tempo de inatividade e garante a segurança e continuidade do atendimento ao paciente.
Comércio eletrônico: Empresas de comércio eletrônico online usam failover para gerenciar a disponibilidade do site, especialmente durante eventos de alto tráfego. Geralmente, balanceadores de carga distribuem o tráfego uniformemente por todos os servidores, com configurações ativo-ativo para lidar com picos.
Telecomunicações: Elas usam failovers de rede para garantir serviço ininterrupto. Implementam múltiplos componentes e caminhos para manter a conectividade mesmo se um nó falhar.
Provedores de serviços em nuvem: Eles têm opções de failover embutidas para aplicativos e dados hospedados. Usam uma combinação de failover geográfico e virtualização para garantir a continuidade do serviço em todo o mundo.
Governo e setor público: Departamentos de gestão de emergências e segurança pública usam failovers para manter infraestruturas críticas funcionando durante emergências e desastres sem interrupção.

Melhores práticas para gerenciamento eficaz de failover

O gerenciamento eficaz de failover é crucial para garantir a continuidade e resiliência dos negócios. Abaixo estão algumas melhores práticas que as empresas podem seguir.

Teste os sistemas de failover. Verificações e testes frequentes podem prevenir falhas de failover durante uma interrupção. Simulações de failover ajudam a identificar e mitigar possíveis problemas no processo.
Atualize os planos de failover. Revise estratégias para implementar novas tecnologias, mudanças na infraestrutura e objetivos aprimorados. Auditorias regulares e revisão dos procedimentos de failover garantem alinhamento com as práticas atuais e mudanças tecnológicas.
Treine a equipe. Os usuários devem conhecer o plano de ação de failover e seu papel durante um evento de failover ativo. Aumentar a conscientização ajuda os usuários a entender a importância de estar preparado para executar os planos de failover de forma eficaz.

Saiba mais sobre como failovers melhoram o tempo de atividade do serviço para empresas.

Sagar Joshi

Sagar Joshi is a former content marketing specialist at G2 in India. He is an engineer with a keen interest in data analytics and cybersecurity. He writes about topics related to them. You can find him reading books, learning a new language, or playing pool in his free time.