Translate / Tradutor

sábado, 17 de abril de 2010

Fraude no DATAFOLHA!!




Há uma fraude, intencional "ou não", no tamanho da amostra da pesquisa Datafolha de março em relação à de fevereiro. Da pesquisa divulgada hoje ainda não há estes dados para conferir. Mas os dados de fevereiro e março, disponíveis no TSE, são suficientes como prova. Na pesquisa de fevereiro o instituto fez 2.600 entrevistas, sendo em 18 bairros de São Paulo. Na pesquisa de março, o Datafolha elevou a pesquisa para 71 bairros de São Paulo. Porém, inexplicavelmente, não aumentou o número de entrevistas, mantendo as mesmas 2.600 pessoas pesquisadas. A pesquisa do Datafolha é na rua, em lugares de movimento. Cada bairro é um ponto de coleta de entrevistas de intenção de votos.

Rio e Belo Horizonte perderam importância relativa na amostragem para São Paulo:
No Rio de Janeiro (segundo colégio eleitoral) a pesquisa foi feita em 10 bairros (10 pontos de entrevista). O eleitorado da capital paulista é 1,8 vezes maior do que o da capital fluminense. Pela proporção, se o Rio teve 10 pontos de coleta, São Paulo deveria escolher 18 bairros, e foi esse o número da pesquisa de fevereiro, o que estava certo. Resultado naquela data: apenas 4% de diferença entre Serra e Dilma. Subitamente, em março, o DataFolha ampliou a coleta de amostra de São Paulo para 71 bairros. Inexplicavelmente, manteve para o Rio os mesmos 10 bairros. Resultado: a diferença aumentou para 9% entre Serra e Dilma.

Se o objetivo era ampliar a amostra para maior precisão, também seria necessário aumentar o número de bairros no Rio na mesma proporção, elevando de 10 para 39. A mesma coisa aconteceu com Belo Horizonte. Tanto em fevereiro como em março, as pesquisas abrangeram 4 bairros. BH tem cerca de 22% do número de eleitores de São Paulo. Assim, para 18 bairros pesquisados em São Paulo em fevereiro, 4 em BH estava proporcionalmente correto. Mas para 71 bairros na capital paulista, seria necessário aumentar para 15 em BH.

Os locais de entrevista em São Paulo aumentaram, mas as entrevistas continuaram em 2.600
Outro forte mau-cheiro exalado pela pesquisa de março é o número de entrevistas ter ficado fixo, quando aumentou-se os pontos de coleta de entrevistas. Na melhor das hipóteses, para aumentar o número de pontos de 18 para 71, em São Paulo, mantendo o mesmo total de entrevistas, seria necessário reduzir o número de entrevistas em cada ponto, seja em São Paulo, seja em outras cidades. Só que não faz qualquer sentido o Datafolha pagar pesquisadores para darem plantão em mais pontos, e pedir para cada um deles fazer menos entrevistas, trabalhando menos. Na pior das hipóteses, pode acontecer o famoso "descarte" seletivo de fichas. As pesquisas seriam feitas em número superior a 2.600, e depois uma parte das fichas descartada, "impugnada". Descarta aqui, impugna ali, Serra teve mais mais "sorte" do que Dilma nos descartes, a ponto da diferença aumentar de 4% em fevereiro, para 9% em março, para 10 % em abril.

O Datafolha vai argumentar que o tamanho da amostra em São Paulo não quer dizer nada, porque os resultados finais são ponderados de acordo com os dados do IBGE. É apenas uma meia verdade, pois uma pesquisa "bem feita" em São Paulo, e "mal feita" no Rio de Janeiro e Minas Gerais, afeta os resultados de toda a região sudeste e do Brasil. O fato indiscutível é que o Datafolha mudou sua metodologia no meio do jogo, e não comunicou ao distinto público, o que, por si só, já é prá lá de suspeito. E está usando critérios desproporcionais ao tamanho do eleitorado, para cidades diferentes, o que é tecnicamente condenável por qualquer estatístico. É um engôdo, uma forma de fraude, comparar a evolução do próprio Datafolha de fevereiro para março, quando foram feitas com metodologias diferentes, com planos de amostragem diferentes.

Qual o impacto dessa lambança no resultado nacional da pesquisa não d para saber, inclusive porque seria necessário analisar o que mudado nas demais cidades. Só o Datafolha pode explicar. Mas quem vai confiar nas explicações do Datafolha depois disso? Confira a relação dos bairros na pesquisa feita entre 24/02/2010 a 25/02/2010 nesta página do TSE, clicando na parte indicada abaixo que aparecer na tela:


Um comentário:

delci disse...

vamos defender nosso presidente a todo custo