4 praktiska skäl att lära sig Hadoop 2.0

Dessa fyra skäl att uppgradera till Hadoop 2.0 berättar om Hadoop-arbetsmarknaden och hur det kan hjälpa dig att påskynda din karriär genom att göra dig öppen för enorma jobbmöjligheter.



När jag var yngre älskade jag Star Wars-filmserien. Jag älskade det så mycket att jag hade den här videokassetten av var och en av dem. Jag brukade titta på dem om och om igen. Då kom tiden för DVD-spelare och jag var tvungen att få filmerna igen på DVD. Jag hade inga problem med att köpa hela uppsättningen igen på DVD eftersom jag ville uppleva den nya tekniken och fortsätta att njuta av mina favoritfilmer också. Saker och ting var fantastiska tills en ny ny teknik, Blu-ray, uppstod. Efter att ha köpt filmerna redan två gånger såg jag inte fram emot att köpa dem igen. Under en tid ansträngde jag mig inte för att 'uppdatera' mig själv och tänkte att jag skulle klara mig bra utan denna teknik. Och jag klarade mig bra. Det påverkade ändå inte mitt liv. Men jag kunde se en trendförändring och kunde inte dela mina filmer med mina vänner, som de gjorde med varandra. Jag kände mig verkligen utelämnad.



Jag gick äntligen ut och hämtade filmen i Blu-ray. Jag kommer ihåg det inte för att jag älskar filmen, utan på grund av det faktum att kvaliteten på videon var i högsta grad. Och för att toppa allt fick jag hela filmen på en enda Blu-ray-skiva.

Behovet eller lusten att hålla sig uppdaterad är starkast när det gäller vårt yrke eftersom riskerna är större. Det har blivit väsentligt att hålla koll på ditt spel.



4 praktiska skäl för att lära Hadoop 2.0:

Så oundvikligt det kan vara, har det blivit en viktig del av våra liv att hålla sig uppdaterad i vårt yrke. Så skrämmande som det kanske låter finns det inget behov av att bli orolig eftersom teknologier inte riktigt förändras så snabbt eller drastiskt. Men samtalen och informationen om dessa tekniker och de saker vi kan göra med dem blir synlig. Här är några anledningar till varför du bör hålla dig uppdaterad:

# 1: Bli inte upptagen

Anledningar att lära sig Hadoop 2.0



Att inte uppmärksamma den senaste uppdateringen i en teknik kan få dig att se ut som en hjort som fångats i en strålkastare. Inte precis en strålande bild av dina professionella förmågor. Att vara uppdaterad kommer att få dig att respekteras av dina kamrater för dina professionella färdigheter. Det kanske inte finns något behov av att implementera alla nya saker du lär dig, men att vara medveten om uppdateringarna är absolut nödvändig.

Till exempel, när det talas om Hadoop, kan du låta dina kamrater veta att Hadoop 2.5.0 har autentiseringsförbättringar när du använder en HTTP-proxyserver. Och även i samma version av Hadoop finns det en möjlighet att skriva direkt till Graphite.

Det blir viktigt att vara med på de senaste uppdateringarna när organisationer funderar på att migrera till Hadoop. Och ”kunskap” kan göra stor skillnad för din karriär.

# 2: Att ha en konkurrensfördel

slå samman sortering pseudokod c ++

Professionella som är skickliga inom sina områden respekteras. Och att hålla sig uppdaterad är det bästa sättet att vara på topp. Ditt behov av att hålla dig uppdaterad speglar din passion för ditt jobb. Genom att utveckla expertis inom ditt jobb och din bransch får du förtroendet och respekten för människorna omkring dig. Ur ledarskapsperspektiv är detta ovärderligt!

Även om din organisation fortfarande arbetar med Hadoop 1.0 kommer du att känna till alla de senaste funktionerna i Hadoop 2, eftersom den är relativt ny och definitivt bättre. Att vara den första som lär sig detta skulle ge dig ett försprång över dina kamrater.

# 3: Nya möjligheter

Det är en sorglig verklighet att vår nuvarande roll fortsätter att förändras. Med tiden kommer ökat ansvar och möjligheter att utföra nya uppgifter. Genom att hålla dig uppdaterad om branschtrender är du i bästa läge för att ta tillvara dessa möjligheter.

Företag som Macy's, Lockheed Martin, California Creative Solutions, Capital One, CSpring, CACI International Inc., Oracle, Yahoo !, American Express, BlueHawk, Aetna, Lawrence Livermore National Laboratory och många fler letar efter personer som är skickliga i de senaste funktionerna i Hadoop 2, som GARN.

# 4: Ta bättre beslut

Den extra informationen gör att du kan göra välgrundade val och bättre beslut. Det hjälper dig att känna igen möjligheter och tillföra värde till din organisations strategi.

Hadoop 2 har funktioner som ökar hastigheten och minskar kostnaden. Att föreslå alternativ för att förbättra prestanda och öka hastigheten kan definitivt öka organisationens produktivitet. Här är några funktioner i Hadoop 2 som kommer att gynna organisationen och föreslår att de också kommer att öka din karriär.

  • Stöd för att köra Hadoop på Microsoft Windows

  • Förenklad distribution av MapReduce-binärer via HDFS i YARN Distribuerad cache.

  • Förbättrat stöd för nya applikationer på YARN med Application History Server och Application Timeline Server

  • Komplett HTTPS-stöd i HDFS

  • Kerberos-integration för YARNs tidslinjebutik.

  • Stöd för heterogen lagringshierarki i HDFS.

  • In-memory cache för HDFS-data med central administration och hantering.

  • Förenklad distribution av MapReduce-binärer via HDFS i YARN Distribuerad cache.

Det finns mer än bara praktiska skäl för att hålla dig uppdaterad. Det finns också tekniska skäl. Hadoop har många funktioner som är fördelaktiga för organisationerna. Att ta en djupgående titt på dem ger dig en tydlig bild av vad de är fördelaktiga.

Vad är den senaste uppdateringen i Hadoop?

Varje produkt går igenom olika skeden av utgåvor och kommer med olika versioner av sig själv. Hadoop är inget undantag och har kommit med Hadoop 2.0. Apache-stiftelsen har kommit med efterföljande versioner av Hadoop som Hadoop 2.1.0, Hadoop 2.4.0 och har nått Hadoop 2.5.1, som är den senaste versionen som släpptes i september 2014.

Varför släpptes Hadoop 2?

Med den nya versionen kommer extra funktioner och fixade buggar. Så varje gång du använder en viss version av Hadoop och tror att en viss funktion kan läggas till eller att några buggar måste åtgärdas, låter du killarna på Apache foundation veta om det. Dessa killar arbetar i sin tur med det och ger dig en bättre produkt i nästa version.

Hadoop 2 - Inte bara ett nummer

Hadoop 2 är inte bara den senaste versionen av Hadoop. I stort sett är det en andra generationens arkitektur. Arun Murthy, grundare och arkitekt vid Hadoop-distributören Hortonworks, insisterar på att skillnaden är viktig eftersom mängden ombyggnad som krävs för att flytta Hadoop utöver batchbehandling och till en realtidsanalysvärld har varit betydande.

Låt oss diskutera hur olika Hadoop 2.0 är från sin föregångare Hadoop 1.0. Uppenbarligen kommer den senare släppta versionen att vara överlägsen än den tidigare utgåvan. Följande är de fyra stora förbättringarna i Hadoop 2.0 jämfört med Hadoop 1.x:

  • HDFS Federation - Horisontell skalbarhet för NameNode

  • NameNode hög tillgänglighet - NameNode är inte längre en enda felpunkt

  • GARN - Möjlighet att bearbeta terabyte och petabyte data som finns i HDFS med icke-MapReduce-applikationer som MPI, GIRAPH

  • Resource Manager - Delar upp de två huvudfunktionerna för överbelastad JobTracker (resurshantering och jobbschemaläggning / övervakning) i två separata demoner: en global Resource Manager och ApplicationMaster per applikation

Det finns ytterligare funktioner som Capacity Scheduler (Enable Multi-tenancy support in Hadoop), Data Snapshot, Support for Windows, NFS access, möjliggör ökad Adoption av Hadoop i branschen för att lösa Big Data-problem.

Hadoop 2.X Vs Hadoop 1.X

Låt oss göra en liten jämförelse och se på vilka sätt Hadoop 2.0 är bättre och skiljer sig från Hadoop 1.0

Varför är Hadoop 2 att föredra framför Hadoop 1.0?

Hadoop 2.0 erbjuder prestandaförbättringar som gynnar relaterad teknik i Hadoop-ekosystemet. Förutom de banbrytande funktionerna i HDFS och andra generationens arkitektur (YARN) finns det ännu fler och större anledningar till att föredra Hadoop 2 framför Hadoop 1.0:

  • Hadoop 2 har inte längre språkbegränsningar. Det betyder att ett brett utbud av proffs nu kan använda Hadoop.

  • Med Hadoop 2 övervinns hinder som brist på MapReduce-kodare.

  • 2 gånger snabbare än Hadoop 1.0

  • 2 gånger avkastningen med befintlig hårdvara.

  • Med YARN är applikationsprogrammeringsgränssnittet mycket mer öppet och flexibelt.

  • Hadoop 2 utökar möjligheterna att använda Hadoop i Big Data-projekt.

  • Med Hadoop 2 kan utvecklare nu utföra ett stort antal datakramningsuppgifter, bortom Hadoops tidigare omfattning av batchbehandling.

  • Erbjuder nya möjligheter för informationsansvariga och åtgärdar brister i tidigare versioner.

  • Den här nya versionen har den unika funktionen att köra flera arbetsbelastningar på samma Hadoop-kluster.

  • Hadoop är inte längre begränsat till en funktion. Dess applikation sträcker sig nu utöver HDFS och MapReduce.

Viktiga fördelar med garn

Vi är medvetna om att YARN är en andra generationens arkitektur, låt oss se vad som gör det så bra.

  • Skala

  • Nya programmeringsmodeller och tjänster

  • Förbättrad klusteranvändning

  • Rörlighet

  • Mycket mer än Java

  • Och många fler

Efterfrågan på Hadoop 2-färdigheter

Organisationer lanserar nu eller experimenterar med Hadoop 2. Följaktligen finns det ett behov av yrkesverksamma som är skickliga inom Hadoop 2. Många organisationer har redan börjat leta internt efter människor att arbeta med Hadoop. Det finns tydliga indikationer på att YARN ökar och så småningom kommer att ersätta efterfrågan på MapReduce-skicklighet.

Här är några synpunkter på den nuvarande och beräknade efterfrågan på Hadoop-färdigheter:

  • Enligt analytiker från Gartner är Hadoop 2 en viktig utveckling eftersom stora företag runt om i världen har funnit att Hadoop är en spelväxlare i sin Big Data-hantering.

  • Enligt Eric Kavanagh, från Bloor-gruppen, har Hadoop 2.0 fått dragkraft bland informationsarbetare som vill bryta Big Data.

  • Adoption av Hadoop 2.0 fortsätter att öka och går nu in i mognadsstadiet.

  • Organisationer är medvetna om fördelarna med garn och är glada över det.

Här är en ögonblicksbild av lediga tjänster för Hadoop 2.0 / YARN i Indeed.com

Vem flyttar till Hadoop 2 eller har redan gjort det?

Yahoo:

Yahoo! , ledaren inom allt Hadoop har implementerat YARN (0.23.x). Enligt Murthy behandlar Yahoos 35 000-nodskluster nu 130-150 jobb per dag jämfört med 50-60 före YARN.

När vi pratar om den fantastiska föreställningen citerar Murthy: 'När du har 2x över 35 000 till 40 000 noder, det är fenomenalt'. Han tillade också: 'Det är en ganska övertygande historia att berätta för en CIO att om du bara uppgraderar din programvara från Hadoop 1 till Hadoop 2, kommer du att se två gånger genomströmningsförbättringar i dina jobb.'

hur man avslutar i Java

eBay:

eBay har en av de största Hadoop-klusterna i branschen, där data finns i petabyte. De har också migrerat sina kluster till Hadoop 2.

Slutsats:

Eftersom Hadoop 2 är mogen och lättare att implementera övertygar de till och med skeptikerna och fler och fler organisationer migrerar till Hadoop 2.0. Det finns giltiga skäl att undvika 1.x-versionerna. Men med Hadoop 2 överväger även de otroende det eftersom det kan användas för ett stort antal användningsområden. Att lära dig Hadoop 2.0 och implementera den för att utföra beräkningar på Big Data, kommer du att öppna portarna för en tekniskt avancerad och ekonomiskt givande karriär.

Har du en fråga till oss? Vänligen nämna dem i kommentarfältet så återkommer vi till dig.

Relaterade inlägg:

Hur viktigt är Hadoop-träning?