Cloud

Confiando na Segurança e Redundância em Cloud

Um cliente em nuvem específico criou um paradigma de confiança máxima na redundância e resiliência de sua rede: Netflix.

Em 2011, a Netflix revelou, através de seu blog de tecnologia (http://techblog.netflix.com), o Simian Army: um conjunto de aplicativos de teste e monitoramento que a empresa usa para avaliar constantemente sua capacidade de continuar o serviço durante situações de contingência. O uso dessas ferramentas demonstra a disposição e a visão da Netflix para criar perigos em ordem de desastres para refinar e melhorar o seu serviço.

O Simian Army não é apenas um conjunto de softwares automatizados de alerta e resposta, embora inclua o Doctor Monkey, que executa ambas as funções depois de pesquisar todos os recursos da Netflix para encontrar qualquer degradação no desempenho. O Simian Army inclui vários programas que confundiriam os profissionais de segurança por causa do conhecimento necessário para manejá-los: o Chaos Monkey e o Gorilla Chaos, especificamente.

Esses dois programas não são responsivos: eles são agressivos. Eles intencionalmente e aleatoriamente desligarmelementos da rede de recursos Netflix. Lembrando que a Netflix é executada em grande parte na nuvem pública da Amazon Web Services. O Chaos Monkey incapacita a produção específica de instâncias, e o Gorilla Chaos, desabilita os serviços em zonas inteiras de disponibilidade da Amazon. A intenção é garantir que todos os recursos de balanceamento de carga embutidos em toda a rede podem resistir à falha e continuar fornecendo serviços de maneira transparente
para clientes.

É uma ação que alguns profissionais de segurança podem chamar de imprudente e a gestão em muitas organizações consideraria isso insano. Basicamente, a empresa está em constante DOS em si mesma. Mas também é brilhante, corajoso e, finalmente, necessário: é bem provável que a única maneira ter certeza absoluta de que todo o planejamento e projeto de sistemas redundantes e controles automatizados de resposta que os gerenciam são totalmente funcionais em tempo real.

Agora pense: Esse constante cenário, não é o que acontece diversas vezes ? Não minta!.

Eu não recomendaria essa abordagem para todas as organizações, mas as organizações que querem e precisam de uma garantia total de que seus recursos de nuvem são totalmente tolerantes a falhas podem querer considerá-la. E a Netflix disponibilizou essa capacidade para o mundo: não apenas anunciaram a existência do Simian Army em um site público, mas em 2014, a empresa criou o Caos Monkey como fonte aberta e gratuita para download: https://github.com/Netflix/security_monkey.

É um nível bem corajoso de criar uma metodologia tão consistente em cenários de desastres, ainda mais atacar seus próprios recursos. Outra é anunciar ao mundo que você está usando essa metodologia. E se der errado? O fracasso não seria agravado pela vergonha de ser pego em sua arrogância evidente?