Por Maurício Costa Romão
Segunda Parte (Final)
A fórmula simplificada
Nas pesquisas eleitorais normalmente não se trabalha com essa proporção p conhecida na população. Então, faz-se uso de uma simplificação: admite-se que a proporção de um determinado evento que produz maior variabilidade populacional é quando p = 0,5.
Por exemplo: metade da população que dirige, fuma enquanto está dirigindo, ao passo que a outra metade, não. Ou então, 50% dos eleitores são analfabetos; os outros 50%, não. Assim, atribuindo-se a p o valor de 0,5, as proporções p ou 1-p deixam de ser predominantes. Nessas circunstâncias, a variância do evento na população é a máxima possível.
Fazendo, então, p = 0,5, a fórmula [1] passa a ser a seguinte;
n = Z²p(1-p) / e²
n = Z² . 0,5 (0,5) / e²
n = Z² . 0,025 / e²
n = Z² / 4e² [2]
Esta última é uma das fórmulas mais utilizadas nas pesquisas de intenção de voto para a determinação do tamanho da amostra, a partir da definição de um dado erro amostral (e vice-versa). Assim como em [1], note-se que a relação entre as duas variáveis em [2] continua a depender do nível de confiança Z. A expressão [2] pode ser mais simplificada ainda, conforme se verá mais adiante, tornando-se uma “regra de bolso”.
É importante ilustrar a aplicação da fórmula [2] através de exemplo concreto referente a duas pesquisas realizadas pelo Instituto GPP, na cidade do Recife, durante a campanha para Prefeito em 2008 [vide Tabela, abaixo].
No levantamento de junho o Instituto informa ter operado com uma margem de erro de 3% e com um nível de confiança de 95%, mediante os quais obteve um tamanho de amostra pesquisado de 1.100 eleitores.
Então: Z = 1,96; e = 0,03.
n = Z² / 4e²
n = (1,96)² / 4(0,03)²
n = 1.067.
O número de entrevistas realizado pelo instituto foi de 1.100, um pouco maior que o achado através da fórmula. Essa diferença para mais, todavia, é comum nos levantamentos dos institutos, constituindo-se, às vezes, até na sua margem de segurança dos resultados. Na pesquisa de agosto, os números divulgados foram: 4% de margem de erro, 95% de nível de confiança e um tamanho da amostra de 600 questionários aplicados.
Assim: Z = 1,96; e = 0,04. Usando [2], vem:
n = Z² / 4e²
n = (1,96)² / 4(0,04)²
n = 600.
Neste caso o cálculo bate exatamente com o tamanho da amostra informado pelo instituto.
Regra de Bolso
A fórmula [2] pode ser ainda mais simplificada para o cálculo do tamanho da amostra, a partir de certo erro amostral, quando se sabe que o nível de confiança atribuído foi de 95%. De fato:
n = Z² / 4e² e Z = 1,96;
n = (1,96)² / 4e²
Considerando que (1,96)² é aproximadamente igual a 4, então:
n = 1/e² [3]
Assim a determinação do tamanho da amostra, de forma rápida e menos rigorosa, resume-se a calcular o inverso do quadrado do erro amostral. A aproximação dada pela fórmula [3] é razoável apenas para o nível de confiança de 95%. Observe-se, entretanto, que a mensuração correta da área sob a curva normal correspondente a dois desvios-padrão à esquerda da média e a dois desvios-padrão à direita, é de 95,45%. Neste caso, então, Z = 2,00 e, conseqüentemente, Z² = 4. Com mais razão ainda n = 1/e².