Skip to content

jamessiqueirap/VarAnnotation

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

19 Commits
 
 
 
 
 
 

Repository files navigation

Filtragem e Anotação de Variantes

Esta aplicação oferece uma maneira conveniente de filtrar e anotar variantes genéticas a partir de arquivos no formato VCF (Variant Call Format). Ela é útil em análises genômicas para identificar variantes relevantes em estudos de associação genética, mapeamento de genes e outros tipos de análises.

O Dockerfile incluído neste repositório permite a criação de um ambiente isolado com todas as dependências necessárias pré-configuradas. Além disso, uma versão web da aplicação está disponível via Streamlit.

Funcionalidades Principais:

  • Filtragem Personalizada: A aplicação permite filtrar variantes com base nos critérios de profundidade mínima de leitura (-dp) e frequência mínima (-af) das variantes.
  • Anotação Genômica: Além da filtragem, a aplicação também oferece a funcionalidade de anotar as variantes com informações adicionais, como frequência populacional.
  • Flexibilidade de Banco de Dados: Você pode escolher o banco de dados a partir do qual deseja realizar a anotação das frequências populacionais, ou então, deixar que todas as frequências disponíveis sejam retornadas.
  • Saída em Formato TSV: As variantes filtradas e anotadas são salvas em um arquivo TSV (tab-separated values), facilitando sua análise posterior.

Como Usar:

  1. Baixe o repositório: Baixe

    • Descompacte os arquivos e navegue até a pasta docker_image, usando o terminal.
  2. Construção da imagem:

    • Certifique-se de ter o Docker instalado. Para construir a imagem, utilize o seguinte comando dentro da pasta my_project:
sudo docker build -t varannotation .
  1. Execução:

Para executar a aplicação, basta substituir as variáveis input e output pelos nomes dos seus arquivos, respectivamente, no seguinte comando Docker:

sudo docker run -it -v $(pwd):/input varannotation -input /input/<arquivo.vcf> -output /input/<saida.tsv> -dp <valor de dp>

Certifique-se de fornecer o caminho completo para o arquivo VCF de entrada e para o arquivo de saída desejado. O parâmetro -dp deve ser substituído pelo valor mínimo desejado para a profundidade. Este comando monta o diretório atual ($(pwd)) dentro do contêiner Docker, permitindo que você acesse facilmente os seus arquivos de entrada e saída.


  1. Argumentos:

    • -input: Caminho para o arquivo vcf de entrada.
    • -output: Nome do arquivo de saída no formato tsv contendo as variantes filtradas e anotadas.
    • -dp: Valor mínimo de profundidade para filtragem das variantes.
    • -af: Valor mínimo de frequência para filtragem das variantes (padrão: 0.5).
    • -db: Banco de dados para a anotação da frequência populacional (opcional).
  2. Saída:

    • O arquivo TSV resultante conterá as variantes filtradas e anotadas.

Esta aplicação foi desenvolvida para simplificar o processo de análise de variantes genéticas em estudos genômicos.

About

Esse repositório contem

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages