Maurício Costa Romão
Nas pesquisas eleitorais, quando não há registro de manifestação de voto aos candidatos é porque os entrevistados declararam que iam votar em branco (B), anular o voto (N), não iam votar em nenhum candidato (N*), estavam indecisos (IND), não sabiam ainda (NS) ou, simplesmente, não quiseram responder (NR).
As instituições de pesquisa costumam aglutinar essas respostas de “não voto” em duas subcategorias: (1) B/N/N* e (2) NS/NR/IND.
A primeira indica o contexto de desalento do eleitor com o ambiente político-eleitoral e/ou com as candidaturas postas. Naquele momento da pesquisa sua pré-disposição é de protesto, de negação, sinalizando que se for às urnas não vai votar em ninguém, votar em branco, ou anular voluntariamente o voto.
A segunda retrata, em parte, certo estado de alienação do eleitor, caracterizado pelo não acompanhamento ou desconhecimento do processo eleitoral, incluindo aí seu alheamento às candidaturas que estão em disputa. Essa subcategoria engloba também aquele contingente que ainda não se decidiu por votar em nenhum dos nomes que lhe foram apresentados.
À guisa de exemplo, a tabela abaixo mostra o comportamento numérico dessas subcategorias, na modalidade estimulada, em pesquisas do Datafolha realizadas em seis grandes colégios eleitorais do país, na última semana da eleição municipal de 2012.

Nos levantamentos dos dias 2 e 3/10 (terça e quarta-feira) a média de manifestações da subcategoria B/N/N* alcançou 6,3%, enquanto a da subcategoria NS/NR/IND registrou 5,7%. Às véspera do pleito (sexta e sábado) esses percentuais atingiram 5,7% e 6,0%, respectivamente.
A preocupação dos institutos de pesquisa no estágio final das eleições é apresentar os resultados de intenção de voto em termos de votos válidos (votos totais menos os votos em branco e os votos nulos), já que será nessa modalidade que a divulgação oficial dos números do pleito será feita.
Procedida essa transformação as estimativas de intenção de votos dos levantamentos podem então ser comparadas com os resultados oficiais. Se a diferença entre os prognósticos e os números das urnas estiver circunscrita ao intervalo da margem de erro, a pesquisa acertou. Caso contrário, a pesquisa errou.
Mas, como fazem operacionalmente os institutos para apresentar as intenções de voto em termos de votos válidos?
Ora, se os votos válidos, por definição, não consideram os votos nulos e em branco, as pesquisas simplesmente subtraem essa subcategoria do total declarado de intenções de voto. A referência de respostas agora passa a ser 100% menos o percentual de votos nulos e em branco (incluindo o percentual de “nenhum”).
E quanto ao percentual de eleitores que não sabiam, não responderam ou se intitularam indecisos (última linha da tabela acima), qual é o procedimento dos institutos para essa subcategoria?
O caminho encontrado pelos institutos é também subtrair as declarações de voto desta subcategoria, assim como se faz com o conjunto de votos nulos e em branco, descartando todos na passagem de votos totais para votos válidos.
A porcentagem de referência passa a ser 100% menos as manifestações de voto nas duas subcategorias: B/N/N* e NS/NR/IND. Tomando como exemplo a eleição de véspera no Rio de Janeiro, em 2012 (vide tabela acima) ter-se-ia: 100% – 8% – 6% = 86%. Um candidato com 40% de intenções de voto na modalidade total teria 46,5%, em termos de votos válidos.
A passagem de uma modalidade para outra de forma a compatibilizar os resultados das pesquisas com dados oficiais do TSE está ilustrada no diagrama que segue:
O que se pode questionar nesse procedimento dos institutos é o fato de que se está cometendo uma arbitrariedade metodológica. Trata-se de uma intervenção do pesquisador nos números originais captados pela pesquisa, não obstante ele seja obrigado a fazê-lo para tornar tais números comparáveis aos resultados das urnas.
A simples subtração do conjunto de não-voto dos votos totais pode facilmente alcançar percentuais de dois dígitos, conforme se pode ver pelos números da tabela acima. O procedimento, portanto, não deixa de ser uma fonte potencial de viés, que pode influenciar os erros não amostrais.
Um atenuante para os institutos é o de que a simples extração dos votos totais da categoria do não-voto é a mesma coisa de repartir essa categoria proporcionalmente entre os percentuais de intenção de votos a candidatos, conforme se demonstra no apêndice a este texto.
Trata-se, na verdade, de um maior conforto para a rationale dos institutos, posto que a metodologia empregada, conquanto forçosamente arbitrária, não procede ao descarte de números obtidos originalmente (wasted votes), mas os distribui em proporção às posições dos candidatos na tabela de intenção de votos. Os mais bem colocados receberão frações maiores do não-voto e, assim, sucessivamente.
A justificativa do procedimento, é óbvio, não impede que possa haver o viés acima aludido. Se, por exemplo, o primeiro colocado na pesquisa já estiver com sua intenção de voto superestimada, a passagem de votos totais para votos válidos vai aumentar a sobre-estimativa já que o líder em intenção de votos será aquinhoado com uma fração maior de não-voto.
Em face do aumento de volatilidade do voto, essa camisa de força dos institutos, forçados a passar de votos totais para votos válidos, pode estar contribuindo para os frequentes equívocos nas pesquisas de véspera.
A tabela abaixo oferece uma descrição numérica preocupante para os institutos de pesquisa, quando se considera a modalidade espontânea de intenção de votos. Trata-se da constatação de que os eleitores estão postergando suas decisões de voto para o dia mesmo do pleito.

Nota-se que a parte de não-voto que inclui o conjunto de indecisos alcança uma média de 22% nas seis capitais relacionadas, considerando-se as pesquisas da semana do pleito. Isolando-se apenas os levantamentos de véspera, a média atinge 21%.
Uma incógnita e tanto para os institutos: cerca de um em cada cinco eleitores deixa para definir o seu voto no dia da eleição!
Antes, enquanto essa categoria de não-voto, que inclui alta percentagem de indecisos na pesquisa de véspera, era menor, com as manifestações espontâneas mais próximas das estimuladas, a distribuição proporcional da quantidade de não-voto que inclui os indecisos (última linha da tabela) não tinha porque acarretar viés ponderável nos prognósticos.
Agora, contudo, que não mais está havendo, nas proximidades dos pleitos, convergência entre as modalidades espontânea e estimulada, os percentuais maiores de não-voto, particularmente de indecisos, detectados na espontânea podem induzir a que a atribuição arbitrária de votos aos candidatos, na estimulada, mesmo de forma proporcional, contribua para introduzir desvio de prognóstico, eventualmente expressivo.
Dessa forma, o grande desafio metodológico dos institutos de pesquisa é procurar compreender melhor a categoria de não-voto, buscando detectar sinais junto aos respondentes de prováveis encaminhamentos de suas decisões de voto.
————————————————————————
Maurício Costa Romão, Ph.D. em economia, é consultor da Contexto Estratégias Política e Institucional, e do Instituto de Pesquisa Maurício de Nassau. mauricio-romao@uol.com.br, https://mauricioromao.blog.br.
Apêndice
O que se pretende neste apêndice é demonstrar que a intervenção do pesquisador nos dados originais das pesquisas, subtraindo, arbitrariamente, do total de intenções de voto, a parcela de não-voto B/N/N*/NS/NR/IND, com o intuito de compatibilizar os dados das pesquisas com os resultados oficiais, equivale, na verdade, a repartir essa parcela em proporção às intenções de votos consagradas aos candidatos.
Demonstração
Imagine-se uma pesquisa eleitoral que afere intenções de voto para apenas dois candidatos A e B (o raciocínio pode ser extensivo a mais de dois candidatos). Considerem-se ainda as variáveis x*, y* e z*, onde:
x* é a quantidade de intenções de voto do candidato A;
y* é a quantidade de intenções de voto do candidato B e
z* é a quantidade de intenção de votos: em branco, nulo, nenhum, não sabe, não respondeu e indeciso (o conjunto B/N/N*/NS/NR/IND, aqui denominado de não-voto em candidatos ou, simplesmente, categoria de não-voto)
Somando as quantidades declaradas de intenção de votos, tem-se:
x* + y* + z* = T [1]
em que T é a quantidade total de intenções de voto captada pela pesquisa.
Passando [1], que está expressa em quantidades, para proporções, vem:
x*/T + y*/T + z*/T = 1
Chamando x*/T de x, z*/T de z e y*/T de y, tem-se:
x + y + z = 1, ou:
x + y = 1 – z, ou ainda:
(x + y) / (1-z) = 1 [2]
Note-se que a expressão (x + y) / (1-z) equivale à transformação das intenções percentuais de votos totais em votos válidos. Naturalmente, a soma do percentual de votos de cada candidato dividido pela diferença entre o percentual de votos totais e o percentual de não-voto é igual à unidade.
Imagine-se agora que ao invés de subtrair o conjunto do não-voto dos votos totais, como aparece na equação [2], faça-se um distribuição proporcional desta categoria de não-voto entre as intenções de voto dadas a A e B. Quer dizer, reparta-se z em proporção às participações x de A e y de B no total de intenções de voto. Com efeito:
x + z (x / 1-z) + y + z (y / 1-z) = 1 [3]
onde: x é o percentual de intenção de votos original de A (em votos totais); (x / 1-z) é a participação de x no conjunto dos votos depois de subtraído o percentual de z; e a expressão z (x / 1-z) contabiliza o quanto de z vai se somar a x. A mesma explicação se dá em relação à variável y, mutatis mutandis.
A unidade em [3] resulta, naturalmente, de se subtrair z de x + y + z e distribuí-lo proporcionalmente ente x e y.
O propósito deste apêndice é mostrar, como já se disse no introito, que os institutos de pesquisa ao simplesmente subtraírem o não-voto dos votos totais, transformando tudo em votos válidos, estão, operacionalmente, particionando o não-voto em proporção às intenções de voto recebidas pelos candidatos. Quer dizer, [2] é igual a [3]. De fato:
(x + y) / (1-z) = x + z (x / 1-z) + y + z (y / 1-z)
x + y = (1-z)x + xz + (1-z)y + yz
0 = 0
C.Q.D.