Datafolha manipula descaradamente




O Datafolha não se contentou em "anabolizar" os bairros pesquisados na cidade de São Paulo, aumentando de 18 para 71, coisa que não fez em outras capitais, como o Rio de Janeiro e Belo Horizonte.
Resolveu também "anabolizar" a pesquisa incluindo mais cidades do Estado de São Paulo na amostragem de sua pesquisa do mês de março em relação ao mês de fevereiro.
É preciso salientar que o Datafolha mudou essa sua amostragem, quando Dilma encostou em Serra, com a diferença caindo para 4%.
Em todos os demais estados, o número de cidades escolhidas ou não variaram ou sofreram variações pequenas: uma ou duas cidades a mais ou a menos. Até aí tudo dentro do aceitável.
O que espanta é só no Estado de São Paulo ter saltado de 25 cidades em fevereiro, para 55 cidades pesquisadas em março.
Isso preocupa porque, por exemplo, um maior número de cidades do estado de São Paulo, onde José Serra (PSDB/SP) é de longe o mais conhecido, pode estar sendo computado na pesquisa nacional como se fossem amostras de outras cidades pequenas e médias, de mesmo porte, de outros estados do Brasil, onde José Serra é impopular.
Como agravante, São Paulo não é o estado que tem mais municípios no Brasil. Perde para Minas Gerais.
Assim, com essa "metodologia do Datafolha" anabolizando São Paulo, 36% (na pesquisa de março) foi até pouco para o demo-tucano. Veja o quadro acima.

Mais detalhes da armação

Há uma fraude, intencional "ou não", no tamanho da amostra da pesquisa Datafolha de março em relação à de fevereiro. Da pesquisa divulgada hoje ainda não há estes dados para conferir. Mas os dados de fevereiro e março, disponíveis no TSE, são suficientes como prova.
Na pesquisa de fevereiro o instituto fez entrevistas em 18 bairros na cidade de São Paulo.
Na pesquisa de março, o Datafolha elevou a pesquisa para 71 bairros na cidade de São Paulo. Porém, inexplicavelmente, não aumentou o número de bairros nem na cidade do Rio de Janeiro, nem em Belo Horizonte.
A pesquisa do Datafolha é na rua, em lugares de movimento. Cada bairro é um ponto de coleta de entrevistas de intenção de votos.
Rio e Belo Horizonte perderam importância relativa na amostragem para São Paulo:
No Rio de Janeiro (segundo colégio eleitoral) a pesquisa foi feita em 10 bairros (10 pontos de entrevista).
O eleitorado da capital paulista é 1,8 vezes maior do que o da capital fluminense.
Pela proporção, se o Rio teve 10 pontos de coleta, São Paulo deveria escolher 18 bairros, e foi esse o número da pesquisa de fevereiro, o que estava certo. Resultado naquela data: apenas 4% de diferença entre Serra e Dilma.
Subitamente, em março, o DataFolha ampliou a coleta de amostra de São Paulo para 71 bairros. Inexplicavelmente, manteve para o Rio os mesmos 10 bairros. Resultado: a diferença aumentou para 9% entre Serra e Dilma.
Se o objetivo era ampliar a amostra para maior precisão, também seria necessário aumentar o número de bairros no Rio na mesma proporção, elevando de 10 para 39.
A mesma coisa aconteceu com Belo Horizonte. Tanto em fevereiro como em março, as pesquisas abrangeram 4 bairros. BH tem cerca de 22% do número de eleitores de São Paulo. Assim, para 18 bairros pesquisados em São Paulo em fevereiro, 4 em BH estava proporcionalmente correto. Mas para 71 bairros na capital paulista, seria necessário aumentar para 15 em BH.
O Datafolha vai argumentar que o tamanho da amostra em São Paulo não quer dizer nada, porque os resultados finais são ponderados de acordo com os dados do IBGE. É apenas uma meia verdade, pois uma pesquisa "bem feita" em São Paulo, e "mal feita" no Rio de Janeiro e Minas Gerais, afeta os resultados de toda a região sudeste e do Brasil.
Além disso, qual é a explicação para um estatístico "anabolizar" a amostragem justamente na cidade de São Paulo, onde José Serra tem índices muito melhores do que no Rio de Janeiro e em Belo Horizonte? É inexplicável que um estatístico escolha fazer esse plano de amostras desbalanceado.
Está usando critérios desproporcionais ao tamanho do eleitorado, para cidades diferentes, o que nenhum estatístico faria.
O fato indiscutível é que o Datafolha mudou sua metodologia no meio do jogo, e não comunicou ao distinto público, o que, por si só, já é prá lá de suspeito.
O segundo fato indiscutível é que o Datafolha está aumentando a importância do Estado de São Paulo na pesquisa, justamente no estado onde Serra é mais forte, o que torna tudo mais suspeito ainda.
Por fim, é um engôdo, uma forma de fraude, comparar a evolução do próprio Datafolha de fevereiro para março, quando foram feitas com metodologias diferentes, com planos de amostragem diferentes.
Qual o impacto dessa lambança no resultado nacional da pesquisa não dá para saber, inclusive porque seria necessário analisar o que foi mudado também nas demais cidades.
Só o Datafolha pode explicar. Mas quem vai confiar nas explicações do Datafolha depois disso?

Matéria veiculada no blog Amigos do Presidente Lula

Comentários

Postagens mais visitadas deste blog

O Papa que a Globo não mostrou

Num dia de agosto de 1992

Cuba além de Fidel