Kao jedan od najmoćnijih programskih okvira otvorenog koda, Hadoop je važan alat za svakoga ko se nada da će pronaći posao s velikim podacima. Ako želite poboljšati svoje vještine Hadoopa ili naučiti kako ga ovladati, vaša najbolja opcija je pohađanje internetskog tečaja. Ako vam to nije dostupno, gledajte besplatne online vodiče i upotrijebite referentne materijale za rješavanje određenih problema. Nakon što ste shvatili osnove, vježbajte na malim skupovima podataka iz stvarnog svijeta kako biste poboljšali svoje vještine.
Koraci
Metoda 1 od 2: Pohađanje kurseva i korištenje vodiča
Korak 1. Prijavite se za Cloudera za kurs od 6 dijelova i interaktivne vodiče
Cloudera vam daje primjere iz stvarnog svijeta za vježbanje u okruženju samo za čitanje, tako da ne morate brinuti o velikim greškama. Oni također nude analitičke alate koji će vam pomoći u eksperimentisanju pri upitu podataka, kao i besplatnu demo verziju uživo pod nazivom Cloudera Live koja će vam pomoći da naučite okruženje Hadoop.
Iako će vas potpuni, detaljni tečaj sa certifikacijom koštati 295 USD, definitivno će se isplatiti ako ove vještine koristite za svoj posao. Korištenje tečaja Cloudera pomoći će vam da uhvatite greške i uštedite vrijeme, zbog čega će se brzo isplatiti
Korak 2. Isprobajte besplatne internetske tečajeve putem Cloudere ako već znate osnove
Ako imate iskustva s Hadoopom i samo želite osvježenje, možda nećete morati izdvojiti novac za tečaj iz 6 dijelova. Umjesto toga, pogledajte besplatne internetske tečajeve na web stranici Univerziteta Cloudera.
Postoje resursi za administratore, programere i analitičare podataka, pa bez obzira na to koja je vaša uloga, trebali biste moći pronaći odgovarajući tečaj
Korak 3. Idite na tečaj Coursere na univerzitetskom nivou ako želite više teorije
Coursera je dobro poznat i cijenjen izvor kurseva programiranja. Iako su upute općenito više teorijske prirode i ne sadrže toliko primjera, možete vježbati zajedno s vodičem i koristiti projekte kursa za stjecanje praktičnog iskustva.
- Ovaj kurs možete pronaći na mreži na
- Cijena varira od kursa do kursa, ali Coursera nudi i mogućnost finansijske pomoći onima koji se kvalifikuju.
Korak 4. Slijedite besplatni kurs na Univerzitetu Big Data za isplativu opciju
Ako ne želite platiti online tečaj, Big Data University je odlična opcija. Imaju kurs iz 2 dijela, koji se prvo fokusira na osnove Hadoopa, zatim na programiranje s Hadoopom, a mrežni format olakšava kretanje vašim tempom.
- Ove kurseve možete pronaći na
- Nude mnoge vodiče na engleskom jeziku, kao i na japanskom, španskom, portugalskom i ruskom.
Korak 5. Potražite uputstva na YouTube -u ako vam je potrebna besplatna, posebna obuka
Postoje hiljade video zapisa koji objašnjavaju Hadoop i kako ga koristiti. Veliki izbor video zapisa daje vam fleksibilnost, a i besplatan je. Ako naiđete na određeni problem, potražite na YouTubeu video zapis koji vas vodi kroz proces.
Hadoop vodiče bi također trebalo biti prilično lako pronaći, jer je "hadoop" jedinstven pojam za pretraživanje
Korak 6. Koristite Yahoo -ove besplatne vodiče ako želite vježbati s virtualnim primjerom
Ovi vodiči su podijeljeni u 7 modula i upućuju vas na instaliranje i rad s Hadoop -om od samog početka. Ovo je izvrsna opcija za nadogradnju određenih vještina ako su malo zahrđale.
Korak 7. Pogledajte IBM Open Source dokument za besplatne, detaljne upute
Ovo je nevjerojatno temeljit PDF dokument otvorenog koda kreiran IBM-ovom inicijativom za obuku. Pažljivo vas vodi korak po korak kroz Hadoop i daje jasna pisana uputstva.
Ove upute također dobro funkcioniraju kada su uparene sa demo verzijom uživo poput Cloudere
Metoda 2 od 2: Prelazak na primjenu u stvarnom svijetu
Korak 1. Pitajte možete li primijeniti Hadoop na poslu da biste vježbali sa stvarnim podacima
Podnesite zahtjev svom šefu ili nadzorniku ili razgovarajte s njima jedan na jedan o unosu ovih novih vještina na radno mjesto. Ovo je posebno važno ako je vaša kompanija platila bilo koju obuku ili online kurseve.
Što prije počnete primjenjivati vještine koje ste naučili, prije ćete ih moći savladati
Korak 2. Potražite jednostavne projekte na kojima ćete vježbati svoje vještine
Odaberite projekte koji su relativno jednostavni i niskorizični, poput brojanja i rangiranja broja interakcija po korisničkom agentu, poput e-pošte i sesija chata.
- Neke druge aplikacije za stvarne podatke uključuju skeniranje grešaka putem web dnevnika ili praćenje osjećaja robne marke na društvenim mrežama.
- Također možete vježbati s uzorcima podataka sa web lokacija poput https://www.kaggle.com/datasets ili
Korak 3. Redovito provjeravajte svoj kod s malim podskupovima kako biste riješili sve greške
Prije izvođenja cijelog skupa podataka, odnesite manji skup podataka za testiranje na svoju lokalnu mašinu i pokrenite ga kroz nekoliko različitih načina. Na primjer, mogli biste ga pokrenuti iterativno kroz Local Jobrunner Mode, zatim Pseudo-Distributed Mode, a zatim Fully-Distributed Mode.
- Ovo će vam omogućiti da prepoznate nedostatke ili greške prije nego što se pojačaju u cijelom skupu podataka.
- Lokalni način rada Jobrunner omogućuje vam lokalno testiranje i ispravljanje pogrešaka na karti i smanjenje koda, Pseudo-distribuirani način oponaša proizvodno okruženje, a potpuno distribuirani način gleda vaš pravi proizvodni klaster.
Korak 4. Iskoristite jednogodišnju besplatnu probnu verziju za vježbanje u okruženju virtualnih mašina
Kompanije kao što su Amazon i Microsoft nude plaćene pretplate za svoje usluge vježbanja Hadoop. Amazonova virtualna mašina naziva se Amazon Web Service (AWS), a Microsoftova usluga Microsoft Azure. Za obje usluge vaša prva godina je besplatna kada unesete podatke o kreditnoj kartici.
Ne zaboravite otkazati pretplatu nakon 1 godine kako biste izbjegli naplatu
Savjeti
- Imajte na umu da je Hadoop specijaliziraniji programski jezik uske namjene. To će vam svakako dati prednost u svijetu velikih podataka, ali nije uvijek potrebno postati programer.
- Također možete čitati knjige i članke o Hadoopu, poput Hadoopa: Definitivni vodič, 3. izdanje Toma Whitea.