A Python programozás nyelv széles körben használatos adatfeldolgozási és elemzési feladatokhoz. A Cloudera blogja néhány olyan keretrendszert mutat be és hasonlít össze, amelyek segítségével Hadoop feladatok futtathatóak.
A cikk a következő modulokat mutatja be:
- Hadoop Streaming
- mrjob
- dumbo
- hadoopy
- pydoop
A különböző modulok futási eredményei:
A szerző az egyes keretrendszerek képességeiről is készített egy tájékoztató jellegű jellegű táblázatot:
via cloudera.com