Por Maurício Costa Romão
para os blogs Acerto de Contas e MauricioRomao

“Enquanto um homem, individualmente,
é um quebra-cabeça insolúvel, no conjunto,
ele se torna uma certeza matemática.”
Conan Doyle, O Signo dos Quatro.
As pesquisas de opinião eleitoral, como se discutiu antes no texto anterior postado neste blog Acerto de Contas, baseiam-se no fundamento da análise estatística de que para se obter indicadores de uma população (universo), basta consultar apenas uma parte (amostra) representativa dessa população. Os resultados daí derivados são chamados de estimativas dos parâmetros populacionais e, portanto, passíveis de erro, o chamado erro amostral.
Assim, toda e qualquer pesquisa que não entrevista o conjunto do universo tem erro de estimativa, que é calculado em função principalmente do tamanho da amostra e da maior ou menor homogeneidade da população pesquisada.
Para um mesmo desenho de amostra, há uma relação inversa entre erro amostral e tamanho da amostra, isto é, quanto maior é o tamanho da amostra, menor é o erro amostral e vice-versa. A mesma relação inversa se dá entre o nível de homogeneidade do universo sob pesquisa e o erro amostral: quanto mais homogêneo é o conjunto da população, tanto menor é o erro amostral e vice-versa.
Felizmente a técnica estatística permite que se possa calcular e circunscrever esse erro a um dado intervalo de variabilidade, conforme se verá mais adiante.
A maneira como se interpretam os resultados de uma pesquisa eleitoral depende, dentre outros fatores, da magnitude do erro incorrido nas estimativas. Assim, um candidato que obteve numa eleição 20% de intenção de voto, por exemplo, num levantamento cujo erro, para mais ou para menos (daí a denominação mais conhecida de “margem de erro”), foi de três pontos de percentagem, tanto pode ter tido somente 17% dessas intenções, como 23%, ou qualquer número dentro desse intervalo de 17% a 23%. Resumindo:
[20% – erro amostral; 20% + erro amostral] =
= [20% – 3%; 20% + 3%] =
= [17%; 23%]
Então [17%; 23%] é o intervalo de variabilidade das intenções de voto para um erro amostral de 3%, numa pesquisa em que o candidato obteve uma estimativa média de intenção de voto de 20%. Outra maneira de interpretar o resultado conseguido pelo mencionado candidato, aí já aplicando algum conhecimento de inferência estatística, é dizer que ele, por ter obtido esses 20% de intenção de voto na amostra (isto é, na pesquisa), deve esperar receber entre 17% e 23% de votos na população.
Margem de erro e nível de confiança

Mas qual é a segurança que se tem de que as estimativas dessa pesquisa retratem a verdadeira preferência de toda a população, quer dizer, como ter certeza de que as intenções de voto da população por aquele candidato situam-se entre 17% e 23%? Fazendo a pergunta de outra forma: se a eleição fosse hoje (à época da pesquisa) como se poderia assegurar que o referido candidato receberia uma votação de, no mínimo, 17% dos votos e, no máximo, de 23%?
Certeza absoluta não se tem nunca, mas pode-se estabelecer, estatisticamente, certo nível de confiança que indique uma alta probabilidade (“quase certeza”, grosseiramente falando) de aquelas estimativas espelharem a realidade. Em geral este nível é determinado de comum acordo entre o instituto de pesquisa e o cliente. Admita-se que esse nível seja de 95%, nível que é predominantemente usado nas pesquisas de opinião, incluindo as eleitorais.
Isso significa que há uma probabilidade de 95% do percentual de eleitores que manifestou intenção de votar no referido candidato estar compreendido no intervalo de 17% a 23%. Abertas as urnas, o candidato deve, “quase certamente”, receber de 17% a 23% dos votos da população, havendo apenas 5% de chance de isso não ocorrer.
Ou, visto de outro prisma, se fossem realizadas 100 pesquisas com o mesmo modelo desta sob análise (e todas elas sempre representando as características demográficas e socioeconômicas do universo), em 95 delas as intenções de voto do candidato em questão estariam dentro do intervalo de 17% a 23%.