Planejamento de capacidade para a nuvem

Com base em uma pesquisa recente da IDC, a unidade CAPEX-OPEX criou um ambiente em que, em 2018, o departamento de TI típico terá uma minoria de seus aplicativos e plataformas residindo em data centers locais.

O modo tradicional de planejamento de capacidade se concentra na obtenção de servidores financiados por aplicativos capazes de obter investimento de capital. Os grupos de aplicativos precisavam obter o capital necessário para financiar recursos computacionais para operar o aplicativo. O CAPEX-OPEX simplificado é como escolher entre comprar um carro com pagamento integral com benefícios de depreciação anual ou alugar um veículo com um custo mensal com alguns limites em milhas.

Em termos de analogia, o gasto na nuvem é semelhante à um restaurante self-service, onde há um conjunto quase ilimitado / infinito de escolhas. Seu consumo é faturado no final da sua refeição pelo que você realmente consumiu. Por outro lado, se você fosse a um restaurante requintado, onde houvesse um tempo de preparação de 30 minutos para a comida, se você não planejasse sua refeição adequadamente, isso poderia significar que você ou encomendou muito pouco ou muito sob restrições de tempo. No entanto, na nuvem, parece que as pessoas ainda usam os padrões de planejamento de estilo antigo.

Uma carga de trabalho é um termo referido ao executar um conjunto de recursos na nuvem. Esse termo geralmente se refere a algumas características de computação, memória, armazenamento ou rede, normalmente em torno de um perfil de aplicativo executado na nuvem.

Uma migração de estilo de elevação e deslocamento é um método freqüentemente usado para mover a infraestrutura para a nuvem. O planejamento de capacidade em seu núcleo, quando aplicado aos aspectos de computação, armazenamento, memória e rede, com a mentalidade tradicional, cria tremendos desperdícios e oportunidades. Essa migração em massa para a nuvem possibilitou destacar as oportunidades de redução de custos além da redução de custos obtida com a migração dos data centers tradicionais para a nuvem.

A facilidade de criar capacidade sob demanda cria os cenários de capacidade ociosa – por exemplo, o desperdício de alguma infraestrutura ou teste e a falha em desativá-la (“a hora do dia” ou “desligar”). Um exemplo de capacidade subutilizada é ter 100 TB de armazenamento quando 30 TB são necessários agora, 50 TB no próximo ano e possivelmente mais no ano seguinte.

Alocação imprópria está no tipo errado de infra-estrutura, onde por exemplo, novas classes de infraestrutura podem fazer muito mais do que a infra-estrutura atualmente em uso. O gerenciamento do ciclo de vida envolve a escolha da classe correta de armazenamento ou servidores, etc. Descontos por volume ou reservas podem ser usados ​​para reservar capacidade por períodos de 1 ou 3 anos e aproveitar os preços mais baixos em termos de comprometimento com uma duração maior de uso. Quando uma reserva é usada prematuramente, pode-se encontrar com excesso de capacidade, se os níveis de subutilização não forem resolvidos primeiro.

As três principais métricas ao otimizar uma carga de trabalho para a nuvem se resumem a:

1. Capacidade em repouso
Simplificando, se ninguém está usando este serviço / aplicativo, qual é o mínimo absoluto necessário para sua disponibilidade? Por exemplo, soluções típicas de nuvem pública podem exigir um servidor da Web, banco de dados, possivelmente algum serviço de camada intermediária. O nível mais baixo de capacidade em repouso é algo que deve ser considerado com aplicativos, independentemente do número de componentes de infraestrutura necessários.

2. Velocidade de Resposta
Ou escalar para exigir velocidade. Em quanto tempo o aplicativo pode responder a um aumento na carga? Uma dessas arquiteturas scale out envolve a geração de servidores de aplicativos pela hora do dia ou com base no aumento da carga. A questão chave a ser examinada é quão rapidamente as necessidades de resposta podem ser tratadas?

3. Velocidade de Terminação:
Com que rapidez, após o burst, o aplicativo pode ser redimensionado para o mais próximo possível do “estado em repouso”?

Combinando mecanismos de marcação, a alocação de custos para recursos de computação na nuvem pode ser atribuída a cada aplicativo, visitante ou região geográfica, introduzindo novos paradigmas para planejamento de capacidade e alocação de custos.