5 de mai. de 2010

De médico e de louco, todos nós temos um pouco

Dando continuidade a um post da Thais sobre TroubleShooting em Redes (ou melhor, usando a tecla SAP, Técnicas para Resolução de Problemas), gostaria de compartilhar com vcs uma analogia que achei muito interessante:

Cuidar da saúde da Rede é muito parecido com cuidar da saúde de alguém. Isso mesmo ! O Troubleshooter é uma espécie de "Doutor das Redes" !

Quer ver só: O usuário chega e reclama que a Rede está lenta. Qual é o Diagnóstico ? É tão fácil definir a causa exata deste problema quanto definir o por quê de alguém estar com dores de cabeça. Podem haver centenas de causas para o mesmo sintoma, não é mesmo ?

Por onde começar ? Bom, se fosse num consultório médico, o doutor iria fazer uma série de perguntas para avaliar se algum evento recente ocorreu e que tenha relação com o problema, além de procurar fazer com que o paciente descreva exatamente QUAL É o problema.

Exatamente isto é o que o Troubleshooter precisa fazer: Definir exatamente QUAL É o problema é o começo de tudo. Tenho isto bem claro, o próximo passo é procurar encontrar as causas dos sintomas apresentados.

As causas de alguns sintomas são claramente visiveis como um cabo rompido ou danificado, outras necessitam de exames mais apurados para encontrar evidências de que algo anormal está ocorrendo. A estes exames damos o nome de Testes Confirmatórios !

Raio X, medir a temperatura e pressão, Ultra Sonografia, Exame de Sangue, Fezes, Urina... Opa
!!! Consultório errado !!! Que exames o Troubleshooter pede afinal ???

Bom, pra começar deve existir um "Prontuario" atualizado da Rede enferma com a descrição de todas as últimas mudanças efetuadas no Hardware e Software (infelizmente, nem sempre estas informações estão 'a mão).

Testes de Ping, Traceroute, NSLOOKUP, Relatórios de Softwares de Gerência acerca de Estatísticas de Colisão, Tráfego, Broadcast, Erros... Opa !!! Agora sim estamos falando dos exames que nos interessam !

Os Testes Confirmatórios procuram coletar evidências ou Sinais de que algo errado está ocorrendo. Identificando a causa, podemos prescrever um tratamento mais eficaz para nossa Rede enferma.

O maior problema é, depois de coletar os dados com tais ferramentas, definir o que é normal e o que não é. Não adianta nada termos todos os valores em mãos e não conseguirmos avalia-los.

Quando a pressão do paciente pode ser considerada normal ? Quando o paciente está ardendo em febre ? Ora, quando determinados valores são alcançados. Isto é o que chamamos em Redes de Computadores de Linha de Base.

Parametrizar qualquer ferramenta de monitoração de Falha e Desempenho é justamente definir quais são os valores aceitáveis e que alertas deverão ser emitidos caso este valores sejam ultrapassados.

Viu como que "De médico e de louco, todos nós temos um pouco ???"

Um comentário: