Cloud Machine Learning Engine (CMLE) moćan je alat koji pruža Google Cloud Platform (GCP) za obuku modela strojnog učenja na distribuiran i paralelan način. Međutim, ne nudi automatsko prikupljanje i konfiguraciju resursa, niti upravlja isključivanjem resursa nakon završetka obuke modela. U ovom odgovoru razmotrit ćemo detalje CMLE-a, njegove mogućnosti i potrebu za ručnim upravljanjem resursima.
CMLE je osmišljen kako bi pojednostavio proces obuke i implementacije modela strojnog učenja u velikim razmjerima. Omogućuje upravljano okruženje koje korisnicima omogućuje da se usredotoče na razvoj modela, a ne na upravljanje infrastrukturom. CMLE koristi snagu GCP-ove infrastrukture za distribuciju radnog opterećenja obuke na više strojeva, omogućujući brže vrijeme obuke i rukovanje velikim skupovima podataka.
Kada koriste CMLE, korisnici imaju fleksibilnost odabira vrste i broja resursa potrebnih za njihov posao obuke. Oni mogu odabrati vrstu stroja, broj radnika i druge parametre na temelju svojih specifičnih zahtjeva. Međutim, CMLE ne preuzima i konfigurira automatski te resurse. Odgovornost korisnika je osigurati potrebne resurse prije početka posla obuke.
Kako bi stekli resurse, korisnici mogu koristiti GCP usluge kao što su Compute Engine ili Kubernetes Engine. Ove usluge pružaju skalabilnu i fleksibilnu infrastrukturu za prilagođavanje radnog opterećenja obuke. Korisnici mogu stvoriti instance ili spremnike virtualnih strojeva, konfigurirati ih s potrebnim softverskim ovisnostima, a zatim ih koristiti kao radnike u CMLE-u.
Nakon što je posao obuke završen, CMLE ne isključuje automatski resurse koji se koriste za obuku. To je zato što bi uvježbani model možda trebao biti implementiran i poslužiti u svrhu zaključivanja. Na korisniku je da odluči kada i kako prekinuti resurse kako bi izbjegao nepotrebne troškove.
Ukratko, CMLE nudi moćnu platformu za obuku modela paralelnog strojnog učenja. Međutim, zahtijeva ručno prikupljanje i konfiguraciju resursa i ne upravlja gašenjem resursa nakon završetka obuke. Korisnici trebaju osigurati potrebne resurse pomoću GCP usluga kao što su Compute Engine ili Kubernetes Engine i upravljati svojim životnim ciklusom na temelju svojih specifičnih zahtjeva.
Ostala nedavna pitanja i odgovori u vezi Napredak u strojnom učenju:
- Kada je kernel račvan s podacima, a izvornik je privatan, može li račvasti biti javan i ako jest, nije li to povreda privatnosti?
- Koja su ograničenja u radu s velikim skupovima podataka u strojnom učenju?
- Može li strojno učenje pomoći u dijalogu?
- Što je TensorFlow igralište?
- Sprečava li eager mod funkcionalnost distribuiranog računalstva TensorFlowa?
- Mogu li se Google rješenja u oblaku koristiti za odvajanje računalstva od pohrane radi učinkovitije obuke ML modela s velikim podacima?
- Je li moguće trenirati modele strojnog učenja na proizvoljno velikim skupovima podataka bez problema?
- Kada koristite CMLE, zahtijeva li stvaranje verzije navođenje izvora izvezenog modela?
- Može li CMLE čitati podatke iz Google Cloud pohrane i koristiti određeni obučeni model za zaključivanje?
- Može li se Tensorflow koristiti za obuku i zaključivanje dubokih neuronskih mreža (DNN)?
Pogledajte više pitanja i odgovora u Napredak u strojnom učenju