O erro da margem de erro 18/10/2014
- JOSÉ FERREIRA DE CARVALHO
As margens de erro declaradas na pesquisas eleitorais feitas por amostragem por cotas estão erradas. As margens não podem ser matematicamente calculadas e há evidência empírica de que excedem os valores declarados.
As estimativas das proporções das intenções de votos -- o resultado de uma eleição– são feitas por levantamentos por amostragem. Uma amostragem quase sempre é baseada em técnicas estatísticas, que permitem o cálculo dos resultados das eleições, juntamente de uma "margem de erro".
O método estatístico, por sua vez, é baseado na seleção aleatória dos eleitores. Trata-se de probabilidades conhecidas de seleção para cada um e todos do universo de eleitores.
PUBLICIDADE
A crítica aos levantamentos feitos pelos maiores institutos do país baseia-se no uso de um esquema de amostragem por cotas, que não é aleatório. Esse esquema é muito mais barato e rápido do que seria uma correspondente amostragem estatística, baseada na seleção aleatória dos eleitores.
Por que uma amostragem aleatória resulta relativamente cara? O pesquisador, por meio de processos engenhosos, seleciona eleitores. O eleitor selecionado, e exatamente os selecionados, tem de ser encontrado. Em geral, isso exige mais deslocamento do entrevistador.
Um esquema probabilístico de seleção é dado como simples exemplo. Selecionam-se municípios, por sorteio; a seguir, com um mapa de ruas, selecionam-se ruas; nas ruas, mapeiam-se e selecionam-se domicílios.
Os domicílios selecionados têm de ser visitados e escolhe-se um eleitor dentre os moradores. Usando-se dados do Censo e da PNAD (Pesquisa Nacional por Amostra de Domicílios) é possível fazer tal amostragem.
Já uma amostragem por cotas pode proceder, nos primeiros estágios de seleção, do mesmo modo. Segue um exemplo simplificadíssimo. Sorteiam-se municípios.
Nos municípios selecionados, sabe-se a distribuição das pessoas por fatores ditos como importantes quanto ao voto, que são: sexo, idade, escolaridade, "classe social" (na verdade, uma classe de renda) e região.
Os entrevistadores podem ir a locais de concentração e entrevistar eleitores nas exatas proporções dessa classificação. Os pontos de concentração podem ser shoppings, esquinas de ruas movimentadas, ou seja, lugares onde é fácil preencher as cotas.
Esse esquema não permite atribuir probabilidades de seleção aos eleitores, os membros do universo de eleitores do município.
E qual a consequência?
Na amostragem por cotas não há como calcular a margem de erro. As margens de erro declaradas para amostragem por cotas não têm fundamento. As margens declaradas usam fórmulas para a margem de erro, tiradas dos livros de amostragem, como se a amostra fosse aleatória.
Na década de 1950, na Inglaterra, ante problemas causados por levantamentos por cotas, realizou-se um teste, em que o mesmo levantamento foi realizado simultaneamente várias vezes, por cotas e por amostragem aleatória. Resultou que os desvios da amostragem por cota excediam em muito os desvios da amostragem aleatória.
Pode-se buscar esse experimento no artigo "An Experimental Study of Quota Sampling" (um estudo experimental da amostragem por cota, em tradução livre do inglês), de C. A. Moser e A. Stuart, publicado em 1953. Segue mais uma conclusão. Institutos alegam que há evidência empírica de que o método "funciona". Está provado experimentalmente que não funciona.
Não causa espanto que os desvios dos resultados de pesquisas e os de eleições, realizados em um curto intervalo de tempo, sejam tão discrepantes. É que as margens de erro não são aquelas declaradas.
Em tese apresentada na Unicamp, levantaram-se os resultados de muitas pesquisas. Os desvios estão fora da margem de erro em grande número de casos, número bem maior do que os "esperados" 5%.
...
JOSÉ FERREIRA DE CARVALHO, 69, estatístico da Statistika Consultoria, é doutor pela Universidade Iowa State e professor aposentado da Unicamp