Por Maurício Costa Romão
A definição do número de entrevistas a serem realizadas em uma pesquisa depende do tipo de amostragem com que se vai trabalhar e dos parâmetros que definem a confiabilidade da pesquisa. O nível de confiabilidade e a margem de erro são medidas importantes para descrever a qualidade da pesquisa. Essas medidas são utilizadas no cálculo do tamanho da amostra. A margem de erro representa a distância entre a estatística da amostra e o parâmetro populacional; já o nível de confiança especifica o percentual de amostras possíveis que satisfaz a margem de erro.
O nível estatístico de confiança de uma pesquisa eleitoral é muito pouco divulgado pelos meios de comunicação, que não se interessam em oferecer detalhes sobre metodologia das pesquisas e, tampouco, o assunto é entendido pelo grande público, considerado muito técnico, o que o torna sem atrativo midiático. O interesse maior de todos – imprensa e público – é, naturalmente, com os percentuais de intenção de votos dos candidatos para saber quem está em primeiro lugar na corrida eleitoral (situação que é denominada na literatura especializada como visão “horse race”, corrida de cavalo).
A mídia explora bem essa ansiedade da população eleitora em suas manchetes e generosos espaços são dedicados aos números das pesquisas, sempre destacando quem está na frente e quem está atrás, tal qual como numa corrida de cavalos. Já a margem de erro dos levantamentos, que é um dado imprescindível para se poder interpretar os resultados tem, todavia, aparecido com certa freqüência, até porque o conceito é mais intuitivo, de mais fácil apreensão, o que não acontece com o intervalo ou nível de confiança.
Imagine-se que um determinado candidato tenha obtido 20% de intenção de voto em uma pesquisa na qual a margem de erro é de 3% para mais ou para menos. Isso quer dizer que a intenção de votos do candidato pode ir de 17% a 23%. Qual é a segurança que se tem de que as estimativas dessa pesquisa retratem a verdadeira preferência de toda a população, quer dizer, como ter certeza de que as intenções de voto da população por aquele candidato situam-se entre 17% e 23%?
Fazendo a pergunta de outra forma: se a eleição fosse hoje (à época da pesquisa) como se poderia assegurar que o referido candidato, que teve detectado na pesquisa uma média de 20% de intenção de votos, receberia uma votação de, no mínimo, 17% dos votos e, no máximo, de 23%?
Certeza absoluta não se tem nunca, já que se trata de estimativa probabilística, mas se pode estabelecer, estatisticamente, certo nível de confiança que indique uma alta probabilidade (“quase certeza”, grosseiramente falando) de aquela estimativa espelhe a realidade. Em geral este nível é determinado de comum acordo entre o instituto de pesquisa e o cliente, no contexto de definição de qual deve ser o tamanho da amostra e o erro máximo tolerável.
Admita-se que esse nível seja de 95%, nível que é predominantemente usado nas pesquisas de opinião, incluindo as eleitorais. Isso significa que há uma probabilidade de 95% do percentual de eleitores que manifestou intenção de votar no referido candidato estar compreendido no intervalo de 17% a 23%. Abertas as urnas, o candidato deve, “quase certamente”, receber de 17% a 23% dos votos da população, havendo apenas 5% de chance de isso não ocorrer. Ou, visto de outro prisma, se fossem realizadas 100 pesquisas com o mesmo modelo desta sob análise (e todas elas sempre representando as características demográficas e socioeconômicas do universo), em 95 delas as intenções de voto do candidato em questão estariam dentro do intervalo de 17% a 23%.
O nível de confiança expressa, estatisticamente, os desvios-padrão em relação à média. Numa curva normal, conhecida dos compêndios estatísticos, a média fica exatamente no centro da curva, dividindo-a em duas partes iguais. Quando, a partir da média, se calcula um desvio-padrão para a direita e um desvio-padrão para a esquerda, a área compreendida entre esses devios-padrão corresponde a aproximadamente 68%.
Se, ao invés de um, são dois os desvios-padrão distantes da média, então a área entre eles é de aproximadamente 95% (mais precisamente, 95,45%). Este é o nível de confiança mais usado nas pesquisas eleitorais. Considerando agora três desvios-padrão, a área passa a ser de aproximadamente 99% (que, de fato, é uma área de 99,73%).