HTML

A Big Data blogról

Big Data és Data Science az algoritmusoktól az adatvizualizáción át a gyakorlati alkalmazásokig


Az Amazon is támogatja az Impalát

Dátum:2013.12.13 ·  Komment: 1 komment  Címkék: Hadoop Cloudera

Mostantól az Amazon Elastic MapReduce  felhasználói is bevethetik a Cloudera SQL gyorsítóját az adataik lekérdezésére. Vigyázni kell azonban arra, hogy csak a Hadoop 2.0-át futtató virtuális gépek (AMI-k) számára érhető el a szolgáltatás. A bejelentéshez részeként…

 

Nem kell mindig Hadoop

Dátum:2013.10.09 ·  Komment: nincs  Címkék: Python Hadoop

Chris Stucchio blogbejegyezésre arról, hogy sok gyakorlati esetben a Hadoop helyett jobban használható  egy Python/Pandas vagy PostGreSQL alapú megközelítés. Csak az 5 terabájtot meghaladó adatmennyiségek esetében válik többé-kevésbé elkerülhetlenné a Hadoop, de ekkor sem…

 

Lambdoop Big Data alkalmazások fejlesztésére

Dátum:2013.09.05 ·  Komment: nincs  Címkék: Hadoop

A Lambdoop Java API használatával tetszőleges architetúrájú Big Data  alkalmazásokat lehet fejleszteni. A Lambdoop egyaránt támogatja a hagyományos batch, a real-time, és a Lamda Architektúra (hibrid) jellegű alkalmazásokat. lambdoop.com 

 

Nyílt forráskódú Hadoop menedzser a Netflixtől

Dátum:2013.06.21 ·  Komment: nincs  Címkék: Hadoop Netflix

A Genie nevű szoftver feladat- és erőforráskezelő szolgáltatásokat nyújt felhőben futó Hadoop fürtökhöz. A Genie szolgáltatásainak egy része Hadoop feladatok távoli végrehajtását és monitorozását segíti (Executive Services). A másik fontos részterület a Configuration…

 

Amazon Redshift és Hadoop/Hive összehasonlítás

Dátum:2013.02.20 ·  Komment: nincs  Címkék: Hadoop Hive RedShift

A Big Data technológiával foglalkozó Hapyrus startup cég készített egy rövid összehasonlítást a Redshift és a Hadoop/Hive páros teljesítményéről. A benchmark nem nevezhető ugyan tökéletesnek, például nem a legfrissebb Hive verziót használták hozzá, de mindenképp érdekes.…

 

Hadoop teljesítményhangolás a LinkedIn-nél

Dátum:2013.02.09 ·  Komment: nincs  Címkék: Hadoop LinkedIn

A következő prezentációt a LinkedIn egyik archiktektje, Allen Wittenauer tartotta az Intel számára arról, hogy érik el az igen magas CPU kihasználtságot Hadoop rendszereiknél. Hadoop Performance at LinkedIn from Allen Wittenauer

 

10 millió dollár tőkét kapott a Continuuty

Dátum:2013.01.22 ·  Komment: nincs  Címkék: Hadoop Startup Tőkepiac Felhő

Big Data App Platform Continuuity Raises $10M A cég alapítói között korábbi Teradata, Yahoo, Facebook and Microsoft mérnökök találhatóak. A fő terméke  az  AppFabric Big Data platform, amely lehetővé teszi a felhőben futó Hadoop alapú alkalmazások…

 

A SportingBet nem a Hadoop-ot választotta

Dátum:2013.01.20 ·  Komment: nincs  Címkék: Hadoop Esettanulmány

Érdekesség olyan cikket olvasni, ami kivételesen nem a Hadoop dialalmenetéről szól. Az online fogadásokkal foglalkozó SportingBetnél az évi 60 terabájtnyi monitorozási adat kezelésére a LogSpace megoldását választották a szokásos eszközök helyett. Az adatok forrása egyébként…

 

A Qubole Hive alapú felhőszolgáltatást kínál

Dátum:2013.01.16 ·  Komment: nincs  Címkék: Hadoop Startup Hive

A Facebook-nál szerzett Big Data tapasztalatokra alapozva indították el a cég ex-mérnökei a Qubole startupot 2012 közepén. A Qubole arra specializálódik, hogy a Hadoop adatainak lekérdezésére szolgáló Hive nyelvet könnyen használhatóvá tegye. A gigaom.com…

 

Hadoop platform mint felhőszolgáltatás a Netflixnél

Dátum:2013.01.11 ·  Komment: nincs  Címkék: Hadoop Pig Netflix Esettanulmány

A Netflix techblogjában jelent megy egy érdekes cikk arról, hogy az online videózás királyának számító Netflix milyen infrastuktúrát épített ki az évek során. Az összes fontos adatot az Amazon S3 felhőben futó tárhelyszolgáltatásán tartják. Ide kell érteni azt a több…

 

Python keretrendszerek Hadoophoz

Dátum:2013.01.08 ·  Komment: nincs  Címkék: Python Hadoop Szerszámosláda Cloudera

A Python programozás nyelv széles körben használatos adatfeldolgozási és elemzési feladatokhoz. A Cloudera blogja néhány olyan keretrendszert mutat be és hasonlít össze, amelyek segítségével Hadoop feladatok futtathatóak. A cikk a következő modulokat mutatja be: Hadoop…

 

Data Science a Netflix-nél

Dátum:2013.01.07 ·  Komment: nincs  Címkék: Python Hadoop Pig Esettanulmány Mozgókép Data science

Az Amazon november végén megrendezett AWS re:Invent konferencián a Netflix számolt be tapasztalatairól. A világ legismertebb videókölcsönzője  nagy felhasználója a Cassandra, Hadoop, Pig + Python, and Hive technológiáknak és persze az Amazon elasztikus felhőszolgáltatásainak.…

 

süti beállítások módosítása