Vad är Variant Call Format (VCF)?
VCF (Variant Call Format) är ett textbaserat filformat inom bioinformatik för att lagra genetiska varianter. Formatet hanterar allt från enstaka nukleotidpolymorfier till strukturella varianter och blev standard efter att 1000 Genomes Project antog det 2011.
VCF (Variant Call Format) är ett textbaserat filformat inom bioinformatik som lagrar genetiska varianter, skillnader mellan en sekvenserad individs DNA och ett referensgenom. Formatet hanterar allt från enstaka nukleotidpolymorfier (SNP) till insertioner, deletioner och större strukturella varianter. VCF blev snabbt standard efter att 1000 Genomes Project antog det 2011.
Varje rad i en VCF-fil beskriver en variant med kolumner för kromosomposition, referensallel, alternativallel, kvalitetspoäng och filterresultat. En INFO-kolumn rymmer valfria annoteringar, exempelvis vilken gen varianten påverkar eller om den tidigare kopplats till sjukdom. Formatet stöder också genotypdata för flera individer i samma fil, vilket gör det praktiskt för populationsgenetiska studier.
Läs den formella VCF-specifikationen (version 4.2) →
Att arbeta med VCF-filer kräver bioinformatisk kompetens. Verktyg som bcftools, GATK och VEP (Variant Effect Predictor) används för att filtrera, slå samman och annotera filer. Filerna kan bli mycket stora, helgenomssekvensering genererar miljontals rader, och lagras ofta i komprimerat format (bgzip) med tillhörande index (tabix) för snabb åtkomst.
Vanliga frågor
- Vad används VCF-filer till?
- VCF-filer lagrar genetiska varianter, alltså skillnader mellan en sekvenserad individs DNA och ett referensgenom. De används inom forskning, diagnostik och populationsgenetiska studier.
- Vilken information finns i en VCF-fil?
- Varje rad beskriver en variant med kolumner för kromosomposition, referensallel, alternativallel, kvalitetspoäng, filterresultat och en INFO-kolumn med valfria annoteringar.
- När blev VCF standard inom bioinformatik?
- VCF blev snabbt standard efter att det internationella 1000 Genomes Project antog formatet 2011.
- Kan en VCF-fil innehålla data för flera individer?
- Ja, formatet stöder genotypdata för flera individer i samma fil, vilket gör det praktiskt för populationsgenetiska studier.