A LinkedIn adatelemzői tették közzé azt a DataFu névre hallgató igen praktikus Pig eljárásgyűjteményt, amelynek segítségével könnyen elvégezhető számos gyakran felmerülő statisztikai és adatbányászati feladat Hadoop adatokon.
A LinkedIn több népszerű funkciója (pl. Skills, People You May Know) is a DataFu-ra támaszkodik.
A nyílt forráskódú DataFu letölthető a GitHub-ről és egy levelezőlista is van hozzá, ahol az aktuális kérdéseket lehet megtárgyalni.