HTML

A Big Data blogról

Big Data és Data Science az algoritmusoktól az adatvizualizáción át a gyakorlati alkalmazásokig


Adatáramlás az Apache Nifivel

Dátum:2015.01.06 ·  Komment: nincs  Címkék: Szerszámosláda

A Nifi segítségével webalapú grafikus felületen lehet adatáramlásokat létrehozni például STP, FTP, HTTP vagy HDFS jellegű adatforrások között. Jelenleg Apache inkubátor státuszban van.

 

Camus - adatok mozgatása Kafka és HDFS között

Dátum:2015.01.06 ·  Komment: nincs  Címkék: LinkedIn Szerszámosláda

 

Nyílt forráskódú Data Science eszközök a Cloudera-tól

Dátum:2013.03.26 ·  Komment: nincs  Címkék: Szerszámosláda Cloudera Data science

Az Apache licensz alatt elérhető  Cloudera ML egy Java könytár, amely az adatok előkészítésében és a modellek kiértékelésében nyújt hasznos segítséget. A Cloudera ML által támogatott első algoritmus a K-közép clusterezési eljárás. Az aktív fejlesztés alatt lévő…

 

Egyre jobbak a Python adatfeldolgozó eszközei

Dátum:2013.03.25 ·  Komment: nincs  Címkék: Python Szerszámosláda

Sok minden segíti azokat, akik  Pythonk környezetben szeretnék végezni adatelemzési feladataikat: Jól szervezett közösség:a  PyData, SciPy, EuroSciPy konferenciák és a NumFOCUS non-profit szervezet igen hasznosak Jól használható…

 

A Python Data Analysis könytára

Dátum:2013.03.05 ·  Komment: nincs  Címkék: R Python Szerszámosláda

A pandas csomag a Python nyelven adatelemzéseket végzők egyik leghasznosabb eszköze. A központi szerepet a DataFrame játszza, ami egy kétdimenziós, indexelhető adatstruktúra. A pandas sok tekintetben hasonlít az R nyelv olyan népszerű elemző moduljaihoz, mint a data.frame, a plyr…

 

Az R és a grafikonkészítés

Dátum:2013.02.03 ·  Komment: nincs  Címkék: R Szerszámosláda

Nathan Yau cikke néhány egyszerű példát mutat be grafikonok készítésére R környezetben. A példák az adatok beolvasásával kezdődnek, és egészen komplex, ám mégis néhány sor R kód segítségével előállítható ábrázolásokat is bemutatnak. via flowingdata.com

 

Graph-Tool könyvtár hálózati adatok elemzéséhez

Dátum:2013.01.31 ·  Komment: nincs  Címkék: Python Szerszámosláda

A graph-Tool segítségével Python környezetben végezhetünk hálózat szerkezetű adatokon (azaz gráfokon) elemzéseket. A graph-Tool eljárásai segítségével létrehozhatunk és módosíthatunk gráfokat, különböző jellemzőket rendelhetünk az egyes élekhez és csomópontokhoz…

 

Az R és a Python adatstruktúráinak összehasonlítása

Dátum:2013.01.23 ·  Komment: nincs  Címkék: R Python Szerszámosláda

A StatAlgo.com 2011-es írása néhány fontos különbséget mutat be a Python és az R adatkezelésében. A listában szerepelnek az elemi adattípusok működése, az értékadás különbözősége, és a  tömbök, listák és szótárak használatának sajátosságai. via statalgo.com

 

Nyílt forráskódú Big Data eszközök

Dátum:2013.01.20 ·  Komment: nincs  Címkék: Szerszámosláda Open Source

Az open source big data eszközöket bemutató ábrát készített a bigdata-startups.com: Az eredeti változat még jobb, mert ott az egyes cégek logói is kattinhatóak.

 

Adatvizualizáció R-ben

Dátum:2013.01.15 ·  Komment: nincs  Címkék: R Szerszámosláda Edukáció

A CodeSchool ingyenes tanfolyamán az R-ben történő ábra- és grafikonkészítés fogásait sajátíthatjuk el. Via codeschool.com

 

Python keretrendszerek Hadoophoz

Dátum:2013.01.08 ·  Komment: nincs  Címkék: Python Hadoop Szerszámosláda Cloudera

A Python programozás nyelv széles körben használatos adatfeldolgozási és elemzési feladatokhoz. A Cloudera blogja néhány olyan keretrendszert mutat be és hasonlít össze, amelyek segítségével Hadoop feladatok futtathatóak. A cikk a következő modulokat mutatja be: Hadoop…

 

A varázslatos Python és R

Dátum:2013.01.06 ·  Komment: nincs  Címkék: R Python Szerszámosláda

A két népszerű adatfeldolgozó nyelv közül melyik vajon a varázslatosabb? A Quant Pythonsta blog szerzője megpróbája  Python környezetben utánozni az R néhány egyedi szintaktikai megoldását. via wesmckinney.com

 

Ingyenes Data Science könyvek

Dátum:2013.01.02 ·  Komment: nincs  Címkék: Szerszámosláda Data science

A következő ingyenesen hozzáférhetőek könyvek hasznosak lehetnek a Data Science iránt érdeklődők számára: Mining of Massive datasets by Rajamaran, Leskovic & Ullman Bayesian Reasoning and Machine Learning by David Barber Information Theory, Inference, and Learning…

 

süti beállítások módosítása