Gene Fetcher tool no Zim

Tenho usado o Zim Desktop Wiki como caderno de anotações faz algum tempo. Ele salva as notas como arquivo texto com marcação wiki permitindo que eu acesse o conteúdo diretamente com outros editores e facilitando o backup (eg, pasta de notas sincronizada no Dropbox).

Comecei a mexer com genes no doutorado e estava guardando as sequências em arquivos texto soltos por aí. Pra manter as coisas organizadas (já que a quantidade de genes começou a aumentar) resolvi tentar guardar cada sequência em uma nota separada no Zim. Assim posso organizar os genes de maneira mais intuitiva, fica mais fácil encontrar o que estou procurando e ainda posso acessar as sequências programaticamente com scripts.

Cada gene pode ter marcadores indicando que aquela página é uma sequência, o organismo, o tipo de gene (relacionado com que processos do desenvolvimento) e o nome mais comum para agrupar genes ortólogos. Com os marcadores fica fácil filtrar as notas. Na imagem abaixo eu cliquei no gene vasa e de cara dá pra ver que tenho as sequências do peixe paulistinha (D. rerio), humanos (H. sapiens) e drosófila (D. melanogaster).

Example of gene sequence in Zim
Example of gene sequence in Zim

O link para a sequência no NCBI também é útil, caso precise voltar lá para checar alguma informação. Por fim tenho a sequência no formato FASTA, que é o que vou usar na maioria dos casos. Criar uma página assim consome alguns comandos, copy/paste e cliques, então fiz um script simples para automatizar isso.

No Zim você pode rodar scripts customizados que interagem com as páginas do caderno de notas. Criei o Gene Fetcher para gerar a página a partir do identificador da sequência. Basta você colar o identificador numa nova página, selecioná-lo com o cursor e rodar; as informações serão adicionadas ao final da página.

Nada muito revolucionário, mas útil; pelo menos pra mim, por enquanto. Também pode ser usado fora do Zim, é só passar os argumentos certos.

Bibliografia viva

Num sábado de manhã de algumas semanas atrás eu caí de paraquedas (online) no Hack4Knowledge, um encontro para criar aplicativos, ferramentas e remisturas que aproveitem os bancos de dados existentes para inovar e enriquecer a criação e disseminação do conhecimento.

Eu já estava fazendo uns testes com o API do Mendeley e resolvi aproveitar a oportunidade para por em prática uma idéia: agregar referências bibliográficas relacionadas com um determinado táxon. Não é uma idéia particularmente inédita nem difere muito de você colocar o nome de um táxon no google ou scopus, mas o fato do banco de dados do Mendeley ser construído por coleções dos usuários permite extrair algumas informações interessantes. Por exemplo, descobrir quais são os artigos mais populares ou criar um trending topics com os grupos do momento baseado na quantidade de leitores e número de publicações.

Living Bibliography Home Page
Página inicial do Living Bibliography

Possuir os dados de artigos (independente da fonte) também possibilita extrair informações interessantes como autores mais ativos em determinado táxon, rede de colaboradores, variação anual no número de artigos relacionados, tópicos mais estudados em cada grupo, etc. Integrando tudo isso e usando ferramentas para visualização de dados complexos seria possível, por exemplo, “ver” buracos no conhecimento ou acompanhar a história do estudo de um organismo.

Imagine se todos os artigos estivessem acessíveis livremente e contivessem informações (metadados) sobre os organismos em questão como informações taxonômicas, ocorrência, coletas, sequências, citações com marcação semântica, tópicos abordados, hipóteses para testar, metodologias, dados brutos, etc. Em instantes qualquer pessoa poderia ter um resumo do conhecimento atual sobre um organismo. Especialmente interessante para definir diretrizes para a pesquisa e evitar gastos de recursos com os mesmos erros; uma otimização da ciência. Isso sem contar na possibilidade de anexar observações, anotações, discussões, questões não resolvidas e outras atividades colaborativas.

Bom, depois de fazer um modelinho da idéia acabei de colocar as funções básicas do agregador para funcionar. Não tem nada do que escrevi acima, apenas uma interface de busca onde você pode usar o nome científico ou nome popular do organismo (em inglês) que você quer ver e uma página por táxon com a lista de referências relacionadas e alguns controles de ordenação. Se o táxon não estiver no banco ele vai buscar as referências na hora, portanto, é necessário esperar um pouco e recarregar a página (pelo menos até eu dar um jeitinho nisso).

Living Bibliography Taxon Page
Página de um táxon no Living Bibliography

Quem se interessar pode testar o Living Bibliography no livingbib.organelas.com. Só lembrando que é totalmente experimental, nada garantido que seus artigos favoritos aparecerão ou que as informações estejam corretas (ainda tem muito artigo duplicado, nome de autor errado, títulos mal formatados, revistas trocadas, e afins no Mendeley). Não sei o quanto vou poder me dedicar, mas o código é aberto e adoraria ouvir idéias e sugestões 🙂