Vad är BAM/SAM (Sequence Alignment/Map format)?

b

BAM-filer (Binary Alignment/Map) och SAM-filer (Sequence Alignment/Map) är filformat skapade och allmänt använta inom bioinformatiksfältet för att hantera och bearbeta NGS (Next Generation Sequencing) data. Dessa data består av miljontals till miljarder sekvenser av DNA eller RNA. BAM och SAM formaten har utformats för att möta den utmaning det innebär att effektivt lagra och analysera sådana enorma mängder av data.

En SAM-fil är en textbaserad representation och kan läsas och skrivas av människor och datorer. Det är mycket informationstät format, som kodar en mängd olika typer av data, inklusive sekvenser, kvaliteter, flaggor, tags och mer. På grund av dess textbaserade natur kan SAM-filer vara ganska stora. På motsatt sida är en BAM-fil en binär version av en SAM-fil. Genom att lagra data i en binär form minskar BAM-formatet filstorleken avsevärt och gör det möjligt för snabbare dataåtkomst och processer.

Både SAM och BAM-format används bredögt inom genforskningen, eftersom de hanterar NGS-data effektivt och tillåter robusta jämförande analyser mellan prover och mellan studier. Detta är mycket användbart för exempelvis att identifiera genetiska varianter mellan patienter med samma sjukdomar, som kan leda till att förståelse för sjukdomens orsaker och potentiella behandlingsmöjligheter.

Kommentera

av Emma Smith