O nível de confiança de uma pesquisa eleitoral

Por Maurício Costa Romão

O nível estatístico de confiança de uma pesquisa eleitoral é muito pouco divulgado pelos meios de comunicação e tampouco é entendido pelo grande público.  

O interesse maior de todos, naturalmente, é com os percentuais de intenção de votos para saber quem está na frente da corrida eleitoral (situação que é denominada na literatura especializada como visão “horse race”).

A mídia explora bem essa ansiedade da população eleitora e não se interessa em oferecer detalhes mais técnicos sobre a metodologia das pesquisas. A margem de erro dos levantamentos, que é um dado imprescindível para se poder interpretar os resultados tem, todavia,  aparecido com certa freqüência, o que já não acontece com o intervalo ou nível de confiança.

Imagine-se que um determinado candidato tenha obtido 20% de intenção de voto em uma pesquisa na qual a margem de erro é de 3% para mais ou para menos. Qual é a segurança que se tem de que as estimativas dessa pesquisa retratem a verdadeira preferência de toda a população, quer dizer, como ter certeza de que as intenções de voto da população por aquele candidato situam-se entre 17% e 23%?

Fazendo a pergunta de outra forma: se a eleição fosse hoje (à época da pesquisa) como se poderia assegurar que o referido candidato, que teve detectado na pesquisa uma média de 20% de intenção de votos, receberia uma votação de, no mínimo, 17% dos votos e, no máximo, de 23%?

Certeza absoluta não se tem nunca, já que se trata de estimativa probabilística, mas se pode estabelecer, estatisticamente, certo nível de confiança que indique uma alta probabilidade (“quase certeza”, grosseiramente falando) de aquela estimativa espelhe a realidade. Em geral este nível é determinado de comum acordo entre o instituto de pesquisa e o cliente, no contexto de definição de qual deve ser o tamanho da amostra e o erro máximo tolerável.

Admita-se que esse nível seja de 95%, nível que é predominantemente usado nas pesquisas de opinião, incluindo as eleitorais. Isso significa que há uma probabilidade de 95% do percentual de eleitores que manifestou intenção de votar no referido candidato estar compreendido no intervalo de 17% a 23%. Abertas as urnas, o candidato deve, “quase certamente”, receber de 17% a 23% dos votos da população, havendo apenas 5% de chance de isso não ocorrer.

Ou, visto de outro prisma, se fossem realizadas 100 pesquisas com o mesmo modelo desta sob análise (e todas elas sempre representando as características demográficas e socioeconômicas do universo), em 95 delas as intenções de voto do candidato em questão estariam dentro do intervalo de 17% a 23%.  Esquematicamente:

O nível de confiança expressa, estatisticamente, os desvios-padrão em relação à média. Numa curva normal, conhecida dos compêndios estatísticos, a média fica exatamente no centro da curva, dividindo-a em duas partes iguais.

Quando, a partir da média, se calcula um desvio-padrão para a direita e um desvio-padrão para a esquerda, a área compreendida entre esses devios-padrão corresponde a aproximadamente 68%.

Se, ao invés de um, são dois os desvios-padrão distantes da média, então a área entre eles é de aproximadamente 95% (mais precisamente, 95,45%). Este é o nível de confiança mais usado nas pesquisas eleitorais. Considerando agora três desvios-padrão, a área passa a ser de aproximadamente 99% (que, de fato, é uma área de 99,73%).

Deixe um comentário