GPU-databehandling – hva er det?

GPU eller grafikkbehandlingsenheter er til stede i alle elektroniske kretser som produserer en eller annen form for skjerm, spesielt datamaskinen.

Tidlige grafikkprosessorer var relativt enkle. Men med bruken av spill, 3D-animasjon og videogjengivelsesoppgaver som presset CPUer utover grensene, måtte kraftigere GPUer komme til unnsetning.

Disse nye GPU-kortene vokste i kraft og kompleksitet over tid, med forskjellige selskaper og forskere som søkte etter måter å utnytte deres parallelle kjøringsfordeler. Dette innlegget viser deg hvordan det har gått så langt.

Innholdsfortegnelse skjule

Hva er en GPU?

Hva er GPU-databehandling?

Hva er applikasjonene for GPU-databehandling?

GPU vs CPU-behandling

GPU-er vs ASIC-er

GPU vs Cluster Computing

GPU-akselerasjon vs hyper-threading

Grunnleggende om GPGPU-programmering

CUDA-kjerner vs strømprosessorer

Topp GPU-språk og biblioteker

Topp GPU-klyngeprosjekter

Konklusjon

Hva er en GPU?

En GPU eller Graphics Processing Unit er en spesialisert krets designet for manipulering av data for å hjelpe til med å lage bilder for visning. Med andre ord er en GPU et system som lager bildene du ser på en hvilken som helst skjermflate, for eksempel dataskjermen, smarttelefonskjermen, spillkonsoller og så videre.

GPUer var i utgangspunktet enkle enheter som satte grafiske elementer sammen for å skape en ideell utgang for en bestemt enhet. Over tid, og med bruken av dataspill, begynte imidlertid GPU-er å vokse i kompleksitet og kraft, og fødte GPGPU eller generell databehandling på GPUer.

Hva er GPU-databehandling?

GPU-databehandling eller GPGPU er bruken av en GPU for beregning utover grafikk. Dette betyr å bruke GPU-ene som er innebygd i en datamaskins skjermkort og opprinnelig ment for å behandle datagrafikk for beregning av andre typer data, for eksempel vitenskapelige simuleringer, gruvedrift av kryptovaluta, algebraberegninger, værvarsling, nevrale nettverk og så videre.

Årsaken til denne utviklingen av GPU-databehandling kommer fra den imponerende utviklingen av grafikkbehandlingsenheter, som kommer fra den distribuerte parallelle arkitekturen til moderne GPU-systemer.

Etter hvert som datamaskinens CPU ble kraftigere og kunne håndtere mer komplekse programmer og spill, prøvde skjermkortprodusenter også å holde tritt med utviklingen innen moderne databehandling og 3D-grafikk. Nvidia avduket GeForce 256 i 1999 som verdens første GPU-skjermkort, og ting utviklet seg derfra.

Den største fordelen med GPU-kort fremfor CPUer er deres parallelle prosesseringsarkitektur, som gjør dem i stand til å behandle store dataoppgaver på en distribuert, parallell måte som forhindrer flaskehalser og CPU-frysing.

Hva er applikasjonene for GPU-databehandling?

Applikasjonene til GPU-databehandling er mange, her er en titt på noen av de beste bruksområdene:

Maskinlæring og nevrale nettverk
Uklar logikk
Bio-informatikk
Molekylær modellering
Videogjengivelse
Geometrisk databehandling
Klimaforskning og værvarsling
astrofysikk
Kryptografi
Datasyn
Knekking av passord
Kvanteforskning

GPU vs CPU-behandling

GPUer og CPUer behandler begge digitale data, men de gjør det på forskjellige måter. CPU-en eller den sentrale prosessorenheten er designet for seriell behandling ved høye hastigheter, mens GPU-er er designet for parallell prosessering ved mye lavere hastigheter. Selvfølgelig kan en CPU bruke hyper-threading for å få 2 tråder per kjerne, eller til og med ha dusinvis av kjerner, men de er i utgangspunktet serielle prosessorer.

Mens CPU-er kan ha noen få kjerner, kommer moderne GPU-er med tusenvis av kjerner, for eksempel Nvidia GeForce RTX 3090 som har 10K+ kjerner. For å få en fordel i forhold til CPU-er, må dataene være i stand til parallell behandling, for eksempel å behandle en strøm som inneholder tusenvis av bilder samtidig.

GPU-er vs ASIC-er

ASIC står for Application Specific Integrated Circuit og dette betyr at den bare kan utføre én oppgave – det vil si oppgaven den ble designet for å utføre. En ASIC er en unik maskin som er utviklet fra bunnen av og krever ekspert hardwarekunnskap for å bygge. ASIC-er brukes ofte i gruvedrift av kryptovaluta, da de tilbyr gode parallellbehandlingsfordeler og bedre effektivitet enn GPU-er.

Den største forskjellen mellom de to er imidlertid at GPU-er er mer allsidige. For eksempel kan du enkelt bygge en gruverigg for kryptovaluta ved å bruke GPUer. Delene er lett tilgjengelige, og hvis du er ferdig med gruvedrift, kan du alltid selge GPU-kortet til spillere eller andre gruvearbeidere. Med ASIC-er kan du imidlertid bare selge en brukt maskin til andre gruvearbeidere, fordi du nesten ikke kan gjøre noe annet med den.

Utover gruvedrift av kryptovaluta, blir det enda vanskeligere å legge hendene på en ASIC-maskin, fordi de ikke er masseprodukter. Dette står i sterk kontrast til GPU-systemer som du kan få overalt og enkelt konfigurere.

GPU vs Cluster Computing

Mens et enkelt GPU-kort inneholder tusenvis av kjerner, som gir enorm kraft til enhver datamaskin du kobler det til, kan du teoretisk legge til så mange GPU-kort til datamaskinens hovedkort som det kan håndtere, og ytterligere øke prosesseringsevnen.

En datamaskinklynge, derimot, refererer til flere datamaskiner som er koblet sammen for å fungere som en stor datamaskin - en superdatamaskin. Hver datamaskin på nettverket kalles en node og kan ha en multi-core CPU, samt ett eller flere GPU-kort om bord.

Hver klynge må ha en hovednode, som er den fremre datamaskinen som er ansvarlig for å administrere og planlegge arbeidsnodene. Den vil også inneholde programvare som tildeler data og programmer for sine arbeidernoder for å beregne og returnere resultater.

GPU-akselerasjon vs hyper-threading

CPU-en er designet for å håndtere flere oppgaver samtidig, og det er derfor den kjører med svært høye hastigheter, og planlegger behandlingstid mellom disse flere prosessene. Men når den støter på en beregningsintensiv funksjon, kan den tilbringe en stund i løkken før den går tilbake til de andre prosessene. Dette resulterer vanligvis i en generell senking av datamaskinen, og i verre tilfeller, en fullstendig frysing av systemet.

Datadesignere kan unngå dette fryktede scenariet ved enten å bruke hyper-threading eller GPU-akselerasjon. Hyper-threading lar en enkelt CPU-kjerne fungere som to behandlingstråder. Så når en tråd er fanget i en beregningsintensiv sløyfe, kan den andre tråden fortsatt holde systemet sammen.

Moderne datamaskiner har nå flere kjerner fra 2 til 4, 8, 16, 32 og så videre. I tillegg har de hyper-threading, så en 2-kjerne CPU tilbyr 4 tråder, en 4-kjerne tilbyr 8 tråder, og så videre.

Hyper-threading med multi-core CPUer vil løse de fleste dataproblemer, forhindre flaskehalser og levere topp ytelse med enkle spill, musikkproduksjon og små grafikk-, video- og maskinlæringsprosjekter. Men når du trenger mer kraft enn det, så er ofte en GPU den rette løsningen.

GPU eller maskinvareakselerasjon er muligheten til en programvareapplikasjon til å utnytte en GPUs parallelle prosessorkraft til å knuse store mengder data, uten å tære på CPU. Mange profesjonelle applikasjoner er avhengige av GPU-akselerasjon for å fungere godt. Disse inkluderer video- og animasjonsdesign/gjengivelsesprogrammer, kodere, kryptografi, store nevrale nettverk og så videre.

Grunnleggende om GPGPU-programmering

Generell programmering av GPUer ble opprinnelig utført ved hjelp av DirectX og OpenGL biblioteker. Disse ble designet strengt for grafikkutvikling, så du måtte omforme dataene dine til grafisk-lignende modeller for å fungere.

Heldigvis har det vært store fremskritt i GPGPU gjennom årene, noe som har ført til biblioteker, programmeringsspråk og rammeverk. Det mest populære av disse rammeverkene er CUDA fra Nvidia.

CUDA gjør det enkelt for enhver utviklere å dykke ned i GPU-programmering uten å måtte kjenne til det finurlige med klassisk GPU-programmering. Den gir funksjoner som forbedrer utvikling utover grafikk, med mange enheter som til og med har maskinlæringsspesifikke funksjoner.

Tilgjengelige biblioteker gjør det også enkelt å lage nye GPU-akselererte programmer fra bunnen av eller å tilpasse forhåndsskrevne til parallell behandling. Du velger riktig bibliotek, optimaliserer koden din for parallellsløyfer, rekompilerer, og det er det.

CUDA-kjerner vs strømprosessorer

Ofte vil du komme over begrepene Cuda kjerner og strømprosessorer. Begge begrepene refererer ganske enkelt til GPU-kjernen eller Aritmetiske logiske enheter av en GPU. CUDA Core er en proprietær teknologi fra Nvidia, mens Stream-prosessorer er fra AMD.

Et annet begrep du kan komme over er Streaming Multi-Processor eller SM. Dette er en annen Nvidia-teknologi som opprinnelig grupperte 8 CUDA-kjerner per SM. Den utfører 32-tråds deformering på en gang, og bruker 4 klokkesykluser per kommando. Nyere design har nå over 100 kjerner per streaming multi-prosessor.

Topp GPU-språk og biblioteker

Det er så mange biblioteker og språk der ute som fungerer på både Nvidia CUDA og AMD-plattformer. Følgende er bare noen få:

Nvidia cuBLAS – Grunnleggende lineære algebra-underprogrammer for CUDA
cuDNN – Dype nevrale nettverksbibliotek
OpenCL – Åpen standard for parallell programmering
Openmp – For AMD GPUer
HOFTE – C++ bibliotek
Nvidia cuRAND – Generering av tilfeldig tall
cuFFT – For Fast Fourier-transformasjon
Nvidia NPP – 2D bilde- og signalbehandling
GPU VSIPL – Vektorbilde og signalbehandling
OpenCV – GPU-bibliotek for datasyn
ÅpneACC – Språk for parallell utvikling
I PyCU – Python for CUDA-plattform
TensorRT – Dyplæring for CUDA
CUDA C++ – C++ språk for CUDA
CUDA C – C-språk for CUDA
CUDA Fortran – CUDA for FORTRAN-utviklere

Topp GPU-klyngeprosjekter

Fra juni 2022 er 8 av de 10 raskeste superdatamaskinene i verden GPU-akselerert. De deler alle Linux OS også, og er som følger:

Rang	Navn	Petaflops	CPU-kjerner	GPU-kjerner	Effekt (kW)	År
1.	Frontier	1,102	591,872	8,138,240	21,100	2022
2.	ROM	151.90	75,264	1,034,880	2,900	2022
3.	Summit	148.6	202,752	2,211,840	10,096	2018
4.	sierra	94.64	190,080	1,382,400	7,438	2018
5.	Perlmutter	64.59	N / A	N / A	2,589	2021
6.	Selene	63.46	71,680	483,840	2,646	2020
7.	Tianhe-2	61.445	427,008	4,554,752	18,482	2013
8.	Adastra	46.1	21,632	297,440	921	2022