Où trouver de l’Open Data ?

open data

Les données constituent la base de votre analyse statistique et la matière première du datascientist. Grâce aux différentes initiatives et projets visant à promouvoir le mouvement Open Data, de nombreux portails de publication de données ont vu le jour : le laboratoire BlueDsX vous donne ici plusieurs ressources utiles pour trouver des jeux de données qui soient à la fois :

  • pertinents et adaptés à votre sujet de recherche
  • de qualité : données récentes, , actualisées, avec peu de valeurs manquantes
  • de taille conséquente : des dataframes avec un nombre d’observations élevé

Par où commencer ?

Si vous cherchez des données c’est sans doute pour répondre à une problématique ou plus généralement une interrogation. Prendre le temps de réfléchir à la formulation de celle-ci est nécessaire pour mieux identifier les données requises pour réussir votre analyse et éviter, de fait,  de télécharger de nombreux dataframes inutiles. La question de départ est véritablement porteuse de sens et influe sur la manière de manipuler les données et de les interpréter. Lire la suite