TPU v2 (Tensor Processing Unit verzija 2) specijalizirani je hardverski akcelerator koji je razvio Google za radna opterećenja strojnog učenja. Posebno je dizajniran za poboljšanje performansi i učinkovitosti modela dubokog učenja. U ovom odgovoru istražit ćemo strukturu izgleda TPU v2 i raspravljati o komponentama svake jezgre.
Izgled TPU v2 organiziran je u više jezgri, od kojih se svaka sastoji od različitih komponenti. Svaka je jezgra sposobna paralelno izvršavati veliki broj operacija množenja matrica, što je temeljna operacija u mnogim algoritmima strojnog učenja.
U središtu svake TPU v2 jezgre nalazi se niz procesorskih elemenata (PE). Ovi PE su odgovorni za izvođenje stvarnih izračuna. Oni su visoko optimizirani za množenje matrice i mogu izvoditi ove operacije s velikom propusnošću i niskom latencijom. Broj PE-ova u svakoj jezgri varira ovisno o specifičnom TPU v2 modelu.
PE-ovi su povezani s hijerarhijom lokalne memorije, koja uključuje različite razine predmemorija. Ove se predmemorije koriste za pohranjivanje međurezultata i smanjenje potrebe za pristupom vanjskoj memoriji, što može biti značajno usko grlo u smislu izvedbe. TPU v2 koristi kombinaciju ugrađenog SRAM-a (Static Random-Access Memory) i DRAM-a izvan čipa (Dynamic Random-Access Memory) kako bi se osigurala ravnoteža između kapaciteta i latencije.
Uz PE i hijerarhiju memorije, svaka TPU v2 jezgra također uključuje kontrolnu jedinicu. Kontrolna jedinica je odgovorna za koordinaciju izvršavanja instrukcija i upravljanje protokom podataka između različitih komponenti. Osigurava da se PE-ovi ispravno koriste i da se proračuni odvijaju na učinkovit način.
Nadalje, TPU v2 uključuje tkaninu za međusobno povezivanje velike propusnosti koja omogućuje međusobnu komunikaciju više jezgri. Ovo međusobno povezivanje omogućuje učinkovito dijeljenje podataka i sinkronizaciju između jezgri, što je važno za paralelnu obradu. Osigurava da TPU v2 može učinkovito skalirati svoje performanse korištenjem više jezgri na koordiniran način.
Ukratko, TPU v2 raspored je strukturiran oko više jezgri, od kojih se svaka sastoji od procesorskih elemenata, hijerarhije lokalne memorije, kontrolne jedinice i tkanine za međusobno povezivanje velike propusnosti. Ove komponente rade zajedno kako bi omogućile učinkovito i visokoučinkovito izvršavanje radnih opterećenja strojnog učenja.
Ostala nedavna pitanja i odgovori u vezi Zaron u TPU v2 i v3:
- Zahtijeva li korištenje podatkovnog formata bfloat16 posebne tehnike programiranja (Python) za TPU?
- Koja su poboljšanja i prednosti TPU v3 u usporedbi s TPU v2 i kako sustav vodenog hlađenja doprinosi ovim poboljšanjima?
- Što su TPU v2 moduli i kako povećavaju procesorsku snagu TPU-a?
- Koja je važnost tipa podataka bfloat16 u TPU v2 i kako doprinosi povećanju računalne snage?
- Koje su ključne razlike između TPU v2 i TPU v1 u pogledu dizajna i mogućnosti?

