Tout a tendance à devenir de plus en plus gros : grosses caisses, grosses basses, et gros bidou !
Mais le pire c’est la quantité de données dont les entreprises se servent qui devient tellement énorme que plus personne n’est capable de la traiter ou de la comprendre sans faire appelle à des outils d’apprentissage (IA).
C’est pour explorer, analyser et visualiser toute cette big data que Kangas a été développé. Il s’agit d’une lib en Python qui est capable de traiter des tableaux de données très volumineux en toute simplicité. Kangas propose également une interface pour visualiser au mieux les requêtes complexes que vous voulez mettre en place pour traiter ces données.
L’outil est très puissant, « scalable » comme on dit puisqu’on peut y stocker autant de données qu’on veut et ensuite y faire du tri, du filtrage, des regroupements, le tout en quelques secondes.
Kangas intègre également des fonctionnalités de traitement d’image et permet de visualiser, filtrer et associer des tags et des métadonnées à vos images, comme vous pouvez le voir ci-dessous :
Pour l’installer, vous devez faire un :
pip install kangas
(Il vous faudra peut-être également installer IPython… en tout cas, chez moi il l’a réclamé)
Puis importez la lib comme ceci dans votre code Python, en chargeant le datagrid (dans le code, il s’agit de données d’exemple) comme ceci :
import kangas as kg
# Load an existing DataGrid
dg = kg.read_datagrid("https://github.com/caleb-kaiser/kangas_examples/raw/master/coco-500.datagrid")
Et quand la source de données est chargée, on peut l’afficher comme ceci :
dg.show()
Votre navigateur ouvrira alors le Visualiseur de données de Kangas en local et vous pourrez naviguer dans vos Big Données super facilement.
Pratique non ?