PESQUISA ELEITORAL E RESULTADOS POR REGIÃO

 

Por Maurício Costa Romão

É muito comum na realização de pesquisas eleitorais fazer alguns cruzamentos de dados para enriquecer o manancial de informações a ser disponibilizado ao núcleo decisório da campanha política.

Por exemplo, se o comando da campanha detecta que o apoiamento obtido pelo candidato provém, preponderantemente, de eleitores situados na faixa etária de 45 a 55 anos de idade, é importante manter esta adesão, mas passa a ser estratégico, sobretudo, redirecionar os esforços de abordagem e convencimento para as faixas mais jovens.

O mesmo raciocínio se aplica a outras variáveis socioeconômicas comumente usadas em pesquisas eleitorais, tais como sexo, nível de renda, escolaridade, local de residência, etc. As informações extraídas desses subconjuntos, cruzadas com as estimativas médias gerais obtidas de intenção de votos para o candidato, são preciosas fontes de planejamento estratégico da campanha.

Todavia, é preciso ter presente que os subconjuntos que representam as cotas de sexo, idade, renda, etc. são, obviamente, parte do todo, o que suscita novas composições de tamanho da amostra e margem de erro. Cada subconjunto desses, com seu tamanho menor que o tamanho da grande amostra, não pode ter o mesmo erro amostral da pesquisa geral.

As margens de erro dos subconjuntos são sempre maiores que a margem de erro do total da amostra, não se devendo imputar aos subconjuntos o mesmo erro amostral máximo válido apenas para a amostra como um todo. É a já conhecida relação inversa entre tamanho da amostra e margem de erro. Constitui-se em equívoco grave tomar o erro da amostra total e imaginar que ele é válido para os seus subconjuntos.

É muito comum, também, as pesquisas nacionais no Brasil apresentarem os resultados globais e por grande região (Norte, Nordeste, Centro-Oeste, Sul e Sudeste). Essa desagregação tem o mesmo problema de qualquer outro subconjunto: os erros amostrais das grandes regiões, individualmente, serão maiores do que aquele correspondente à amostra total, justamente porque os subconjuntos são menores em tamanho. Um exemplo concreto ajudará a esclarecer melhor o ponto em questão.

Os grandes institutos de pesquisa que têm feito sucessivos levantamentos no Brasil para a atual corrida presidencial costumam trabalhar com amostras entre 2.000 e 2.500 questionários. Em geral esses institutos apresentam também as intenções de voto dos eleitores por grandes regiões para mostrar a performance dos candidatos de forma desagregada.

Um desses institutos fez recentemente uma pesquisa de 2.000 entrevistas a nível nacional, com uma margem de erro de 2% para mais ou para menos, e também apresentou os resultados seccionados por grandes regiões do país. As intenções de voto por região dos ainda pré-candidatos (à época), que foram divulgadas pela mídia, estão apresentadas nas segunda, terceira e quarta colunas na Tabela que acompanha o texto.

Há que se registrar que em nenhum veículo de informação onde a pesquisa foi divulgada havia menção ao tamanho da amostra e aos erros amostrais em cada uma das regiões. Tal referência normalmente não aparece na grande imprensa por se tratar de detalhe técnico que pode tornar o texto jornalístico um tanto árido e de difícil assimilação pelo grande público. O pecado da omissão é deliberadamente cometido como compensação a uma maior leveza do texto.

Nos relatórios completos dos institutos, todavia, algumas informações não divulgadas na mídia são disponibilizadas, tais como os tamanhos das amostras em cada região (quinta coluna da Tabela). Normalmente, nesses relatórios, não aparecem os erros amostrais associados aos tamanhos de cada amostra (a última coluna da Tabela). Mas estes podem ser facilmente calculados (ainda que em alguns casos de forma aproximada) pelas fórmulas-padrão da literatura especializada.

Como se pode ver, de pronto, todos os erros amostrais são maiores do que o erro médio global (2%) e quanto menor o tamanho da amostra maior é o erro admitido (vide resultados na última coluna).

Essa Tabela, cuja configuração é mais ou menos padrão entre os institutos de pesquisa, em termos de tamanho da amostra regional, tem na região Norte um resultado que serve de paradigma para o ponto focal deste texto. Vendo-se o placar de 41% a 32% em prol de Dilma, tem-se a impressão de que há um grande favoritismo da pré-candidata petista (à época) na região Norte, em termos de intenção de votos.

O leitor é induzido a achar que a margem de 2% de erro amostral (a única apresentada nos textos divulgados pela mídia) é válida também para todas as regiões. Assim, a diferença de nove pontos de percentagem de Dilma para Serra é efetiva, fora da margem de erro.

Entretanto, com a margem de erro calculada de forma correta, o mencionado favoritismo pode ter até sido registrado de fato, mas do ponto de vista técnico, os dois candidatos estão empatados: Dilma tanto pode ter 49,3% de intenção de votos, quanto 32,7%. Serra pode ir de 40,3% a 23,7%.

Portanto, há empate técnico entre Dilma e Serra na região Norte, estatisticamente falando. (Há empate técnico entre os dois candidatos quando, considerando a margem de erro, seus respectivos campos de variabilidade de intenção de votos se superpõem (overlap) em determinados pontos.

É claro que se cotejando a performance dos dois postulantes na mencionada região, o percentual de intenção de voto de Dilma é bem mais confortável, significando que ela realmente esteja à frente do seu principal oponente. Ainda assim, os analistas especializados, com base no rigor estatístico, não se aventurariam a assegurar vitória definitiva desta candidata naquela área.  

Os estudantes de economia aprendem nos manuais do primeiro ano da graduação que devem ter cuidado com o conhecido “sofisma da composição”, uma forma incorreta de raciocínio, bastante comum no campo das ciências sociais, e da economia em particular, que pretende imputar ao todo certos princípios ou leis que são válidos apenas para uma parte desse todo.

No exemplo numérico do texto a forma incorreta de raciocínio é uma espécie de sofisma da composição às avessas: atribuir para a parte o que é válido apenas para o todo, quer dizer, imaginar que os 2% de margem de erro da pesquisa para todo o Brasil se aplicam para as grandes regiões que o compõem.

Deixe um comentário