Protein Data Bank (PDB) är en databas som ursprungligen skapades för att lagra och dela tredimensionella data om protein och nukleinsyrakomplex, men inkluderar nu också andra stora biomolekyler. Olika typer av information om molekylstrukturen lagras i filen, såsom atomtyper, koordinater, bindningstyper, sekundärstrukturer och mer. PDB-formatet används som standardformat för datautbyte inom strukturbiologi och är akademin och forskningsindustrins huvudsakliga verkyg för att lagra och studera proteinstrukturdata.
Resultaten från röntgenkristallografi, kärnmagnetisk resonans (NMR) och elektronmikroskopi, som alla är tekniker för att fastställa molekylstrukturer, lagras vanligtvis i PDB-format. Detta innebär att forskare från över hela världen kan dela de detaljerade strukturerna på biologiska molekyler som de har upptäckt, och andra forskare kan sedan ladda ner dessa data och utforska dem på sina egna datorer. Ett PDB-dokument kan öppnas med hjälp av något av flera tillgängliga molekylvisualeringsprogram, som tillåter en detaljerad visuell granskning av molekylstrukturen.
PDB-formatet skapades på 1970-talet, och eftersom datalagringskapaciteten har ökat och forskningsmetoderna har förfinats, har det behövts förändringar i hur data lagras i formatet. För att uppnå detta har det huvudsakliga PDB-formatet utvecklats till det mer moderna mmCIF-formatet, som ger mycket mer flexibilitet och kapacitet för datalagring. Trots detta, förblir det ursprungliga PDB-formatet det mest använda och erkända formatet för att dela proteinstrukturdata.