XGBoost är inte bara ett maskininlärningsalgorithmbibliotek, det är ett helt terminsystem och ett parallellt beräkningsramverk. Det använder gradient boosting algoritmen under huven. Gradient boosting är en process som bygger på andrasvaga lärandemodeller, överväger tidigare modellers fel och försöker minimera förlusten i sammanslutningen. XGBoost tar den här idén ytterligare och lägger till flera bra saker på toppen av det.
XGBoost är särskilt framtagen för att optimera de stora beräkningsresurserna som finns idag. Den klarar av att utföra parallella beräkningar, köras på flera maskiner, gör den snabb och mer tillförlitlig. XGBoost använder även en mer regelbunden modell formalisering för att styra modellkomplexitet, vilket hjälper till att förebygga överanpassning, vilket är ett allmänt problem inom maskininlärning.
En annan aspekt av XGBoost som gör det unikt är dess flexibilitet. Utöver standard bearbetning av numeriska, katekoriska och binära variabler, kan XGBoost även bearbeta ogenerade datastrukturer för att stödja anpassade förlustfunktioner. Det har inbyggda mekanismer för att hantera saknade värden, vilket underlättar för datavetare och AI-ingenjörer att bygga robusta modeller.