DISTORÇÃO NA PESQUISA DATAFOLHA?

Maurício Costa Romão

Na matéria do blog de Jamildo, de 18/07/2014, intitulada Humberto diz que pesquisa que mostra Dilma empatada no 2º turno tem distorção” , o senador Humberto Costa assim se expressou sobre a pesquisa do Datafolha de 15 e 16 de julho:

“Eu acredito que há uma distorção provocada pelo fato de que essa pesquisa Datafolha também teve que ponderar o número de questionários para São Paulo e pro Rio, onde nós sabemos que nossa posição não é uma posição tão confortável nesse momento, e que dá um peso maior a esses estados aí”.

Na verdade, o procedimento do Datafolha de aplicar mais questionários nos dois estados para obter resultados particulares não causa nenhuma distorção na pesquisa nacional.

Já no registro da pesquisa junto ao TSE o Datafolha explica a questão da amostra ampliada para extrair mais informações de São Paulo (SP) e Rio de Janeiro (RJ):

“…Nessa amostra, os tamanhos dos estratos foram desproporcionalizados para permitir detalhamento das unidades da federação (UF’s) SP e RJ e suas capitais. Nos resultados finais, as corretas proporções serão restabelecidas através de ponderação. A amostra prevista é de 5.468 questionários, sendo 2.036 na UF SP e 1332 na UF RJ.”

Depois do trabalho de campo, com eliminação de alguns questionários que não passaram no teste de consistência, os números finais da pesquisa foram de 5.377 entrevistas, sendo 1.978 de SP e 1.317 do RJ.

O procedimento do Datafolha de expandir a amostra para incluir determinadas unidades da federação das quais se almeja obter resultados específicos é muito comum entre os institutos de pesquisa.

É uma questão de economia de escala: aproveita-se a estruturação e a logística da grande amostra para aferir números específicos de subespaços amostrais.

Claro que há de se ter o cuidado natural de não deixar que determinado subespaço do qual se queira extrair resultados particulares fique super-representado na amostra total, o que, se ocorrer, aí sim, leva o produto final a ficar viesado.

Imagine-se, por exemplo, que o Datafolha planeje fazer uma pesquisa nacional normal com 3.000 questionários. No dimensionamento da amostra suponha-se que em SP, pela sua expressão populacional, teriam que ser aplicados 1.000 questionários.

Admita-se ainda que o Instituto resolva aproveitar o levantamento nacional e obter dados específicos para SP (intenção de voto para governador, para senador, avaliação do governo paulista, etc.). Numa pesquisa regular, estritamente para SP, seriam necessários, por hipótese, 2.000 questionários.

O que faz o Instituto? Amplia a amostra nacional para 4.000 entrevistas, aplica 2.000 questionários em SP, mas pondera os resultados advindos desses questionários, de sorte que tais achados fiquem equivalentes aos que foram dimensionados originalmente para o levantamento nacional. É o que se chama de usar a base ponderada.

Portanto, aumentar o número de entrevistas de uma amostra para obter informações detalhadas de subespaços amostrais não causa distorções nos resultados, visto que as devidas proporções são restabelecidas por ponderação.

Deixe um comentário