sexta-feira, 24 de julho de 2009

Tomando chá com Pearson, Fisher, et al.



Um subproduto da reunião de Petrópolis foi a indicação do livro "Uma senhora toma chá". Ou "The Lady Tasting Tea: How Statistics Revolutionized Science in the Twentieth Century", no título original. O livro foi escrito por um estatístico, com experiência na universidade e na indústria.

Diz a revisão da Amazon "Statistician David Salsburg examines the development of ever-more-powerful statistical methods for determining scientific truth in The Lady Tasting Tea, a series of historical and biographical sketches that illuminate without alienating the mathematically timid".

O livro, para quem se interessa por estatística, é muito interessante. Conta as trajetórias das figuras chave do desenvolvimento da estatística, seus conflitos e posições ideológicas. Num tom intimista, entre fatos e fofocas, o desenvolvimento da estatística é delineado de forma clara e instigante. E mesmo alguns conceitos básicos da estatística acabam discutidos e contextualizados. Enfim, uma leitura agradável para quem quer ter um panorama da estatística do século XX, sem a pretensão de virar historiador :-)

Veja detalhes no sítio da Amazon. O livro tem traduação para o português, e tem pra comprar na Livraria Cultura.

quinta-feira, 23 de julho de 2009

Mind the gap!



O uso de dados para que se possa entender o mundo é uma prática antiga. Mas novas tecnolgias de coleta de dados e geração de gráficos e animação estão fazendo uma revolução! Nesse vídeo se faz uma demonstração incrível do poder dos dados e de um bom comunicador. Tenha os seus preconceitos sobre a situação dos países colocados em cheque por essa belíssima apresentação. Veja o vídeo e use o site!



Clique aqui para usar o Gapminder.

sexta-feira, 17 de julho de 2009

Jóia bem exibida



Há uns dias falei de um artigo que eu acho que é pouco valorizado. Hoje falo do artigo sobre alternativas de análise para modelagem de desfechos binários (Barros AJ, Hirakata VN. Alternatives for logistic regression in cross-sectional studies: an empirical comparison of models that directly estimate the prevalence ratio. BMC Med Res Methodol 2003;3(1):21). Esse, ao contário, é bem visto! Aproveitei a 190ª citação no sistema Scopus para escrever essa nota. E aproveitar pra fazer um pouco de auto-propaganda...

A história desse artigo é curiosa. É um daqueles enjeitados que acabaram dando certo. No meu mestrado em estatística, a razão de chances já me intrigava. Mas meu orientador, Euclydes, ou o Clydão, não achava que era nada de muito interessante. Depois de preparar o artigo, sua publicação foi complicada. Os estatísticos, como meu orientador do mestrado, não entendiam o que é que estava errado com razão de chances. E as revistas de epidemiologia não achavam que era assunto pra elas. Acabei publicando o artigo na BMC Medical Research Methodology. E descobri que esse é um sistema muito interessante. Além do acesso livre, há uma contabilidade do número de visitas ao artigo. E no último ano, sabe que este é o quinto mais acessado da revista? Teve 5563 visitas! E desde sua publicação teve 24519 acessos, sendo o quarto mais visitado de todos os tempos.

Logo antes da publicação (e depois da submissão, coisas do acaso), saiu um artigo tratando do mesmo assunto no American Journal of Epidemiology (1) e ainda outro no ano seguinte (2).

Tem gente que ainda acha estranha essa coisa de usar regressão Poisson (com variância robusta) para modelar dados binários, mas a moda pegou. Estamos trabalhando (Enrico Colosimo e eu) em um sistema de diagnóstico para o modelo para evitar as situações em que se possa estimar valores impróprios ("probabilidades" de evento > 1) a partir do modelo. E quem sabe numa rotina de estimação com restrição que resolva o problema!

1. McNutt LA, Wu C, Xue X, Hafner JP. Estimating the relative risk in cohort studies and clinical trials of common outcomes. Am J Epidemiol 2003;157(10):940-3.
2. Zou G. A modified poisson regression approach to prospective studies with binary data. Am J Epidemiol 2004;159(7):702-6.

Livro de modelagem em epidemiologia - espere que vai valer a pena!


Com essa turma, pode apostar que vai sair um livro muito legal!

Tirado do frio do inverno pelotense, acabei passando três dias gelados em Petrópolis - 14 a 16 de julho. Obrigado, Marília! ;-) Mas a turma estava quente. Animada e divertida, a troupe trabalhou sério nas primeiras linhas do que deve ser um livro bastante inovador - modelos estatísticos aplicados à epidemiologia. Um livro que vai se atrever a misturar estatística em boa dose, mas com muita intuição e interpretação. Um livro pra acabar com as desculpas dos não-estatísticos de que modelagem estatística é coisa complicada. A coordenação fica por conta de Marília Carvalho e Valeska Andreozzi. Vai ser um livro bilíngüe, português e português, graças à colaboração de Valeska (convertida à metrópole portuguesa) e colegas de Lisboa.

A composição do grupo mostra que a intenção é boa. Tem desde quem não abre mão da função de verossimilhança até quem não vai deixar passar em branco a interpretação baseada em modelo conceitual. Entre estatísticos de carteirinha e epidemiologistas assumidos, tem aqueles que ainda não sabem bem qual o seu rótulo. Mas todo mundo MUITO afiado. Não vou listar aqui os 15 (ou tantos) nomes. Mas quem conhece, pode olhar a foto e acreditar.

O social também não deixou a desejar. Jantares regados a vinho tinho - às vezes chileno, às vezes argentino - e muita história boa. Apareceram passados revolucionários e boas piadas. O livro vai ter que incorporar o teste de Potes - que segundo as entendidas tem um significado bem especial em polonês. Humm! A família exponencial também já tem figuração garantida, assim como a função de verossimilhança e os modelos conceituais. Tudo muito vaselinado, prá ninguém reclamar. Olha! aviso aos autores - vamos calcular índice de impacto por capítulo. Vamos ver quem vai se sair melhor: a Poisson ou a verossimilhança. Hehehe!

O livro certamente vai falar R (pela turma, arrastado de carioca e não retroflexo de paulista), mas vamos dar um jeito de atender a torcida do Stata também. Seja no apêndice, seja no sítio do livro, prometo não deixar meus parceiros na mão!

Agora, é esperar para ver!

segunda-feira, 13 de julho de 2009

Livro sobre modelagem em epidemiologia em gestação no LNCC/Petrópolis

Hoje, estou de viagem para a bela Petrópolis. Missão: participar de uma reunião com um grupo de bioestatísticos e assemelhados de onde deve sair um projeto de um livro brasileiro sobre modelagem de dados. Como diz Marilia Sá Carvalho, que organiza o encontro, "A idéia é elaborar um livro que trabalhe o conceito de modelagem em epidemiologia que pode ser definido através da sinergia entre EPIDEMIOLOGIA (problemas), DADOS (observação) e ANÁLISE ESTATÍSTICA (resultado). Assim como o livro de sobrevida “Análise de Sobrevida: Teoria e Aplicações em Saúde” - Editora Fiocruz, o livro de modelos de regressão terá como público alvo pessoas da área da saúde, mas com uma forte componente estatística."

A idéia parece ótima! Juntar a expertise nacional em modelagem de dados para escrever um livro que atenda às necessidades da comunidade da epidemiologia e bioestatística. Mais do que um livro, espero que saia desse esforço uma maior coordenação do grupo e da comunidade metodológica do país de forma a atacar as muitas dificuldades técnicas e metodológicas que enfrentamos no dia a dia da pesquisa. Mais notícias em breve!

quarta-feira, 8 de julho de 2009

Jóia (meio) esquecida



Tem artigo que a gente escreve e sabe que é interessante. Mas às vezes ele "pega" e às vezes não. Isso aconteceu com o artigo que escrevi (co-autorado por Cesar Victora) propondo o IEN - um indicador econômico baseado em bens domésticos, parecido com aquele usado pela ABEP (ex-Abipeme) e muito popular entre os epidemiologistas.

A idéia é boa - Dave Gwatkin uma vez me disse: "Como é que não fui eu quem pensou nisso?". Mas não "pegou". A sacada é usar bens domésticos que são registrados pela amostra do Censo Demográfico. Como essa amostra é enorme (uns 12% dos domicílios do país), é possível calcular a distribuição do IEN para regiões, estados, e mesmo municípios. No artigo, apresentamos os decis para regiões, estados e capitais. Ou seja, tendo coletado os dados e calculado o indicador para os domicílios da amostra, você pode classificá-los nos décimos (ou quintos) da população de referência que quiser. Por exemplo, o indicador foi criado para classificar uma amostra de domicílios de áreas PSF de Porto Alegre. Com a referência municipal em mãos, pude classificar a amostra dentro dos quintos de referência para Porto Alegre e obtivemos o seguinte resultado:


Ou seja, pudemos concluir que os domicílios em áreas PSF eram mais pobres do que o conjunto dos domicílios da cidade como um todo. Mais de 35% dos domicílios em áreas PSF pertenciam aos 20% mais pobres da cidade. Sem o IEN, eu ia precisar de uma amostra do resto da cidade para poder comparar. Como se tem referências para outros níveis geográficos, eu poderia ver como é que essa amostra está em relação ao conjunto do estado, ou do país.

Muita gente me pergunta porque não usar o indicador da ABEP que é mais conhecido. A questão é que com ele só dá para calcular percentis internos à amostra ou classificar nos grupos A-E que foram criados para direcionar propaganda. Além disso, a pesquisa que origina o indicador da ABEP cobre apenas as regiões metropolitanas do país.

Se você quiser usar o indicador, eu tenho um material prontinho - questionário, instruções para calcular e instruções para classificar nos percentis. Os pontos de corte estão no artigo.

terça-feira, 7 de julho de 2009

Artigo recém aceito no IJE mostra importância da estimulação das crianças

O IJE acaba de aceitar o artigo "Child development in a birth cohort: effect of child stimulation stronger in less educated mothers", de minha autoria com Alícia Matijasevich, Iná S Santos e Ricardo Halpern. O artigo mostra, em primeiro lugar, que há diferenças importantes de performance no teste de desenvolvimento aplicado às crianças da Coorte de 2004 quando elas tinham 2 anos. Comparando grupos de escolaridade materna, 22% das crianças de mães com 0-3 anos de escolaridade apresentaram um desempenho "baixo" em comparação com apenas 6% daquelas cujas mães tinham 11 anos ou mais de estudo. Avaliamos também o efeito de estimulação das crianças através de 5 indicadores simples: criança tem um livro, alguém leu/contou uma história para ela, foi ao parque, visitou alguém, assiste TV. As crianças receberam um escore de 0 a 5 dependendo do número de estímulos na última semana. Veja na tabela abaixo a diferença entre elas!
Outra coisa importante foi observar que o efeito da estimulação varia com a escolaridade da mãe. O efeito observado foi muito maior em crianças filhas de mães de escolaridade baixa. O gráfico mostra isso e que o desempenho das crianças mais estimuladas é praticamente igual, independente da escolaridade da mãe.

Desenvolvimento infantil não é uma área que tem tido muita ênfase no sistema de saúde no Brasil e que merece mais atenção. O nosso resultado sugere que se as crianças forem bem estimuladas em idade precoce, podem recuperar a desvantagem criada pela falta de escolarização das mães. Há muitas experiências positivas de estimulação cognitiva com crianças pequenas, inclusive no Brasil. O tema também foi assunto das páginas amarelas da Veja, há poucas semanas. Aqui temos mais uma razão para pensar no desenvolvimento das nossas crianças!