Analyser et croiser ses données

ban3

Bonjour à tous!

En ce début de semaine, le laboratoire BlueDsX met à votre disposition un tutoriel complet, pour vous apprendre à croiser vous-même vos données et en déduire des informations pertinentes. Au programme, des grands classiques parmi les tests statistiques comme Fisher, Student, Wilcoxon et bien d’autres ! Vous apprendrez à :

  • Tester la corrélation et déterminer les forces de liaison entre  vos variables
  • Choisir des tests statistiques pertinents
  • Réaliser en un rien de temps une analyse descriptive globale de vos données

untitled_med_hr

Notes : Ce tutoriel nécessite l’installation du logiciel RStudio sur votre ordinateur. Vous pouvez le télécharger ici.

Cliquez ici pour commencer notre tutoriel sur l’analyse de données ! ATTENTION : si vous avez installé l’extension Adblock sur votre navigateur, désactivez le pour afficher correctement la page.

Eva Laude, laboratoire Blue DsX

Portail data : Quandl et son API

couv0-2 Quandl est un portail de données vous donnant accès gratuitement à plus de 5 millions de datasets de données financières, économiques ou sociales. Quandl vous propose aussi  une API  pour nourrir vos analyses de données et reporting. Simple d’utilisation, les APIs vous permettent d’automatiser le flux entrant de données de vos analyses pour que vos données financières soient automatiquement mises à jour dans votre logiciel de manipulation de données. Découvrez comment profiter de ces milliers de dataframes en suivant le guide !

Lire la suite

Les bases de données SQL et NoSQL

SL NO SLQ board

Depuis 20 ans, le langage SQL et les bases de données relationnelles (SGBD) sont des standards dans le monde du stockage et de la manipulation de données. Les fonctionnalités des bases de données SQL ont permis de s’adapter aux besoins des entreprises (comme, par exemple, l’intégrité des données et l’implémentation de transactions dans les applications de gestion). Ses outils matures du côté développement en font un outil indispensable pour tout développeurs. Lire la suite

Créer son application Shiny

Shinytitre

Le laboratoire BlueDsX vous propose un cours en ligne sur comment construire, pas à pas, votre première application Shiny !

Mais au fait, c’est quoi Shiny?

Shiny est un package du langage R, intégré au logiciel RStudio.  Il permet la réalisation de présentations statistiques intéractives ou plus généralement d’applications web , grâce à l’insertion de modules (ou widgets) cliquables. Shiny propose de nombreuses fonctionnalités et un haut niveau de personnalisation : au niveau le plus avancé, vous pourrez même créer vos propres dashboards de données! Pour voir les nombreuses possibilités de création que vous propose Shiny, rendez-vous ici.

Lire la suite

VIM – L’éditeur de texte puissant

VIM

Le laboratoire BlueDsX vous propose une présentation de VIM un des éditeurs de texte opensource les plus puissants au monde.

VIM (pour VI improved) est un des éditeurs de texte opensource. Il permet d’éditer du texte en profondeur en un minimum de commandes. Autre point fort, il tourne sur tous les OS : Linux, Windows, et Mac. Autant l’utiliser en toutes circonstances et sur tous les systèmes, cela vous évitera de perdre brusquement en productivité quand vous basculerez dans des environnements sans interface graphique. VIM nécessite un temps d’apprentissage avant d’être maitrisé et l’absence d’interface par défaut a tendance à rebuter un débutant. On est bien loin d’un Notepad++ en termes d’esthétisme ! Mais le jeu en vaut la chandelle.

Utiliser VIM, c’est gagner en   :

  • Performance : il permet d’effectuer beaucoup de modifications, parfois complexes, en un minimum de commandes
  • Confort : le mode command  évite les allers-retours clavier – souris  fatiguants répétitifs
  • Souplesse : il fonctionne sur tous les systèmes Unix  Vous trouvez ici un manuel de prise en main rapide et efficace dans le monde de VIM

Lire la suite

[TUTO] Vos premiers pas sur RStudio

Image1Eva Laude, Data Scientist au laboratoire BlueDsX vous propose un tutoriel pour accompagner vos premiers pas dans le langage R, grâce au logiciel d’analyse de données RStudio.

Devenu un incontournable dans le monde des datasciences et couramment utilisé dans la communauté scientifique, Rstudio, en plus de proposer une interface agréable, possède une communauté dynamique notamment en termes de création de ressources utiles (packages R, librairies, scripts).

Vous serez amené au cours de ce tutoriel à taper par vous-même les instructions en R pour mieux en assimiler la logique et renforcer votre mémorisation des commandes. Vous avez la possibilité de télécharger les jeux de données utilisés dans le cours afin de reproduire les exemples.
Cette formation étant actuellement en cours de développement, certaines modifications, comme le contenu ou l’organisation des chapitres peuvent avoir lieu. Si vous avez des suggestions ou si vous remarquez des incohérences, n’hésitez pas à nous en faire part !

Maintenant, à vous de jouer !
Suivez simplement ce lien (plus de 45 planches à votre disposition)  : tutoRstudio

elqude

 

Importer et nettoyer vos données

image 1

Dans ce billet, le laboratoire Blue DsX vous explique les étapes à suivre pour importer et modifier correctement vos données dans RStudio !

Après de longues heures de recherche sur Internet, vous trouvez enfin le jeu de données parfait (du moins, selon la description qui en était faite). Vous vous empressez de l’ouvrir dans RStudio et là, horreur : le nombre de variables ne correspond pas du tout au nombre de colonnes, la variable Pays est considérée mystérieusement comme une variable numérique, ou encore vous constatez des « trous » parmi les valeurs. Autant dire que votre dataframe n’est pas exploitable en état. On vous explique la démarche à suivre pour démarrer votre analyse dans les bonnes conditions ! Lire la suite