quarta-feira, 9 de dezembro de 2009

Uma seqüência interessante

Lendo um trabalho que utiliza algumas técnicas de "feature selection" para bioinformática, como não formado em estatística, decidi entender melhor o signifcado de "cross-validation". O de sempre, "cross-validation" no google e cheguei no verbete da Wikipedia. Além de achar interessante, as maravilhas do hypertexto me levaram a uma seqüência interessante, inesperada, mas pertinete de verbetes:
  1. Cross-validation (statistics)
  2. Uncomfortable science
  3. Magical thinking
Abs,

terça-feira, 8 de dezembro de 2009

Análise de agrupamentos com suporte usando o R

Das as áreas da Bioinformática que já trabalhei, todas aplicavam análise de agrupamento de alguma maneira. Geralmente cada área tem seu próprio software. Exemplo, filogenética tem Paup, Phylip, Mega; análise de microarrays tem o MeV... e assim vai. Entretanto, algumas vezes temos dificuldade em analisar o suporte dos agrupamentos. Fazer uma análise de agrupamentos no R é simples, basta usar o hclust. Essa semana descobri o pvclust, uma biblioteca do R, de uso super simples, que calcula o suporte dos grupos gerados pelo hclust. Além do conhecido bootstrap, ainda calcula o suporte por um valor "Approximately Unbiased".

O uso é simples. Imagine que você tenha uma matriz de microarray no seguinte formato (clássico):

Sonda, Amostra 1, Amostra N
xxxxxxx_at, 2.4, 6.8

Fazer uma análise de agrupamentos - usando distância euclidiana, 1000 pseudo-replicação para o bootstrap - bastam 4 comandos:

>library("pvclust")
>data <- read.table("data.txt", header=TRUE)
>result <- pvclust(data, method.dist="euclidian", method.hclust="average", nboot=10000)
>plot(result)

Abs,

quarta-feira, 2 de dezembro de 2009

Leitura updated!

Que a informática e os hypertextos revolucionaran a maneira como lidamos com a informação não é novidade.

Recentemente (Agosto de 2009) saiu um trabalho na "Science" sobre como a internet mudou a ciência, principalmente sobe como lidamos com os trabalhos científicos, os "papers". Além de mostrar - com base nos resultados de trabalho citado - como a interner "bombou" o número de artigos lidos por pesquisador (gostaria muito que número estivesse correto: 300 artigos/ano/pesquisador em média), faz uma análise do comportamento atual e do provavel no futuro com relação ao mesmo assunto.

Ai vai a referência:

Renear AH, Palmer CL.Strategic reading, ontologies, and the future of scientific publishing. Science. 2009 Aug 14;325(5942):828-32.

Abs,

Fred