domingo, 1 de dezembro de 2013

Gauss e a Distribuição Normal no Enade



Prof. Roney Signorini
Assessor e Consultor Educacional
roney.signorini@superig.com.br

Raramente lemos algo que se possa afirmar ser o texto definitivo, acabativo quanto ao tratamento dado, completo e terminal. Assim, não creio que algo mais possa ser acrescentado ao que Jorge Gregory considerou em Avaliação: os pecados do MEC – Os problemas do conceito Enade.
Para um leitor leigo(mas não ignorante) em matemática e estatística, como eu, tomo a liberdade de esclarecer algumas abordagens feitas por ele, aqui transcritas logo abaixo no trecho com o subtítulo A INDUÇÃO AO ERRO NA INFORMAÇÃO PÚBLICA, carecedoras de esclarecimentos técnicos que se oferecidas ao artigo original alongariam demais as explicações. Afinal, o conteúdo de Gregory visou certo público alvo de leitura que não os iniciados em números, mas, no trecho citado ele desceu um degrau e matou a cobra.

A distribuição normal é uma das mais importantes distribuições da estatística, conhecida também como Distribuição de Gauss ou Gaussiana.
Além de descrever uma série de fenômenos, possui grande uso na estatística inferencial. É inteiramente descrita por seus parâmetros de média e desvio padrão, ou seja, conhecendo-se estes se consegue determinar em uma distribuição normal qualquer probabilidade(?) (Qualidade de provável. Motivo ou indício que deixa presumir a verdade ou a possibilidade dum fato.).
A distribuição normal foi introduzida pela primeira vez por Abraham de Moivre em um artigo no ano 1733. Gauss, que alegou ter usado o método desde 1794, demonstrou-o rigorosamente em 1809 supondo uma distribuição normal para os erros.

Carlos Roberto de Lana explica que para entender o que é distribuição normal, é necessário, primeiramente, definir evento aleatório. Trata-se de evento cuja ocorrência individual não obedece a regras ou padrões que permitam fazer acertadas, como, por exemplo, qual face de um dado lançado cairá para cima.

A estatística mostra que, apesar de a ocorrência individual destes eventos aleatórios ser imprevisível objetivamente, é possível tirar algumas conclusões a partir de um conjunto suficientemente grande deles.

Muitos dos conjuntos de eventos aleatórios apresentam padrões que não são identificáveis em cada evento isoladamente, como a tendência de os eventos se concentrarem próximos a uma posição que representa uma média matemática deles. Assim, a quantidade de eventos diminui constante e gradativamente à medida que nos afastamos da média.

Um levantamento das estaturas de homens adultos, em uma amostragem significativa, tende a posicionar a maioria das medidas na chamada estatura mediana, entre 1,70 e 1,80m. Já as estaturas entre 1,40 e 1,50m e entre 2,00 e 2,10m tendem a apresentar poucas ocorrências.
Um exemplo bastante próximo de todos sobre como a curva de distribuição normal ajuda a definir padrões esperados é a pressão arterial. Quando o médico infla a almofada em nosso braço, lê o manômetro e nos informa que o resultado é 12 por 8, nos sentimos aliviados.
Alguém já se perguntou, porém, por que 12/8 e não qualquer outro resultado é considerado padrão de normalidade deste parâmetro médico?
A resposta é simples: as curvas de distribuição normal para a pressão arterial sistólica e diastólica tendem a concentrar seus resultados em torno de 120 e 80 mmHg, respectivamente.
Ou seja, quem tem 11/9 ou 13/7 não está bem, está mal ? Deve ser internado e tratado do que ?
A INDUÇÃO AO ERRO NA INFORMAÇÃO PÚBLICA
“Suponhamos, para tornar o meu raciocínio mais didático, que eu seja um estatístico e queira me meter a futebólogo. Suponhamos que eu pretenda estabelecer um padrão de avaliação da qualidade dos jogadores profissionais de futebol. Suponhamos que, para tanto, eu elenque 100 habilidades e aplique testes a todos os jogadores de futebol para verificar quantas destas habilidades cada um domina. Suponhamos que como resultado, dentre um grande número de clubes pesquisados, no Luverdense o jogador Emerson apresente a menor qualidade segundo este meu critério, demonstrando dominar apenas 5 das 100 habilidades, e o Rubinho, o de melhor qualidade, mostrou dominar 25 habilidades. Suponhamos que os mesmos testes sejam aplicados ao Barcelona e o jogador com menor desempenho tenha sido o Pique, mostrando dominar 65 habilidades. Já o de melhor desempenho tenha sido o Messi, mostrando dominar 99 das 100 habilidades. Suponhamos que uma vez tabulados estes dados eu decida aplicar Gauss à amostragem de cada clube e converter a Distribuição de Gauss numa escala de 1 a 5 como se faz no ENADE e CPC.

Aplicadas todas estas suposições, chegaríamos ao resultado de que a Distribuição de Gauss no Luverdense seria aplicada no intervalo amostral de 5 a 25, e no Barcelona se daria no intervalo de 65 a 98. Aplicada a Distribuição de Gauss aos dois casos e convertido o resultado a escala de conceito de 1 a 5, eu teria como resultado que no Luverdense o Emerson é conceito 1 e o Rubinho é conceito 5. Já no Barcelona, o Piquet seria conceito 1 e o Messi conceito 5 (e quem sabe o Neymar conceito 4). Isto posto, eu divulgo os resultados da minha pesquisa para que o público tome conhecimento da qualidade dos jogadores.
Para os familiarizados com estatística, desde que informados que o método aplicado foi a Distribuição de Gauss e tendo acesso à média e ao Desvio Padrão de cada clube, entenderiam perfeitamente o padrão que eu estaria estabelecendo. Para 99,9% dos mortais que mal sabem o que é uma média, não fazem a mínima ideia o que é Desvio Padrão e muito menos uma Distribuição de Gauss. A mensagem que estaria transmitindo é que Pique é um perna de pau ao tempo que Rubinho é um craque, que Rubinho é tão bom quanto o Messi e até mesmo melhor que o Neymar. Lamento afirmar isto, mas é exatamente o que se está fazendo na educação superior.
Pior ainda, depois eu faço o somatório de todos os conceitos 1 de todos os clubes e digo que o mundo tem tantos pernas de pau jogando (incluindo o Emerson e o Pique). Somo todos os conceitos 3 e digo que temos tantos jogadores mediando jogando no mundo. Somo todos os conceitos 5 e digo que temos tantos craques maravilhosos no mundo (incluindo o Messi e Rubinho e excluindo o Neymar que ele não é conceito 5 e, portanto, pela lógica do INEP não seria um craque de ponta como o Rubinho).”

Ou seja, Gauss, distribuição normal, probabilidade, evento aleatório, desvio padrão e outros transformam o Enade, CPCs e IGCs num samba do crioulo doido regado a sakê ou cicuta(*).

(*)Sócrates
foi condenado à morte por ingestão de chá de cicuta. Após tomar a cicuta, ficou dando voltas no quarto como lhe haviam recomendado, até que sentiu as pernas pesadas. Deitou-se de costas para que, em intervalos, se examinassem os pés e as pernas, ocasião em que Sócrates já não mais os sentia. Sócrates começou a ficar frio e enrijecido, até que o veneno chegou no coração do filósofo e sobreveio a morte.

Nenhum comentário: