A Bit.ly linkmegosztó szolgáltatás elemzési műhelyéből származik az a csomag, ami néhány jó minőségú, nyilvánosan elérhető, kutatási célokra is alkalmas adatforrást tartalmaz.
A listában:
- Spam gyűjtemény
- Flickr taxonómiák
- Yahoo adatok
- Facebook információk
- Az Amazon AWS által kínált nyilvános adatok
- Arcfelismerési adatok
....és még sok minden más. Az adatok nem feltétlenül frissek, a Facebook-féle válogatás például 2005-ből származik, de ez például algoritmusok tesztelésénél önmagában nem jelent még problémát.
via bitly.com