Les usages de l’IT Operations Analytics au travers du Design Thinking et Big Data

it-operations-analytics
Ce n’est un secret pour personne, il existe aujourd’hui un écosystème mature permettant d’exploiter les données massivement grâce à des outils comme hadoop, spark, flink, bases NoSQL, etc..  Malheureusement on constate que beaucoup de clients  éprouvent encore des difficultés à  identifier les usages big data en rapport avec leur activité.
La démarche, souvent initiée en entreprise pour contourner le problème, vise à installer un data lake et à ingérer des données  dans l’optique de les exploiter et de les  valoriser ensuite. Il va sans dire que cette façon de procéder génère des coûts d’infrastructure non négligeables qui ne seront pas forcément amortis…
Notre conviction :  tout projet big data doit être entrepris sous l’angle de l’innovation, c’est à dire conjuguer la pensée intuitive et analytique dans le but de balayer le champ des possibles et de rapidement valider/invalider les hypothèses formulées.
En s’appuyant sur une méthodologie issue du monde du Design, le Design Thinking, nous vous proposons d’explorer et d’identifier quels peuvent être vos usages centrés sur  l’ITOA (IT Operations Analytics) et l’analyse de logs.

Lire la suite

Où trouver de l’Open Data ?

open data

Les données constituent la base de votre analyse statistique et la matière première du datascientist. Grâce aux différentes initiatives et projets visant à promouvoir le mouvement Open Data, de nombreux portails de publication de données ont vu le jour : le laboratoire BlueDsX vous donne ici plusieurs ressources utiles pour trouver des jeux de données qui soient à la fois :

  • pertinents et adaptés à votre sujet de recherche
  • de qualité : données récentes, , actualisées, avec peu de valeurs manquantes
  • de taille conséquente : des dataframes avec un nombre d’observations élevé

Par où commencer ?

Si vous cherchez des données c’est sans doute pour répondre à une problématique ou plus généralement une interrogation. Prendre le temps de réfléchir à la formulation de celle-ci est nécessaire pour mieux identifier les données requises pour réussir votre analyse et éviter, de fait,  de télécharger de nombreux dataframes inutiles. La question de départ est véritablement porteuse de sens et influe sur la manière de manipuler les données et de les interpréter. Lire la suite

Le labo BlueDsX

business-et-innovation

Vous ne connaissez pas encore le laboratoire BlueDsX ?

Véritable générateur d’idées sur les thèmes porteurs du moment tels que le Big Data, les Data Sciences appliquées et la Cyber sécurité, le laboratoire de Blue Soft confie des projets novateurs à ses jeunes consultants et chercheurs. Ces équipes très innovantes accèdent au savoir-faire de l’entreprise au  travers des experts du groupe, dans l’idée de créer une dynamique d’innovation et de recherche.

Découvrez les projets BlueDsX !

Le laboratoire BlueDsx lance Bluelog

044121297-cyber-security-gears_0

Le laboratoire BlueDsx du groupe BlueSoft lance Bluelog : un projet R&D data sciences appliquées à la Cyber Sécurité (développement, recherches & état de l’art sur le sujet ).

Aujourd’hui, du fait de la complexité des attaques informatiques et de leur fréquence, les Responsables de la Sécurité des Systèmes d’information sont soumis à une forte pression et reconnaissent la nécessité d’un changement de modèle pour relever ces nouveaux défis.

Les systèmes de protection, qu’ils soient organisationnels (Computer Incident Response Team, méthode de gestion du patrimoine, gestion avancée des habilitations, campagnes de sensibilisation, mise en place d’équipes d’analyse des incidents avérés) ou périphériques (firewall, authentification…) ou encore heuristiques (systèmes experts, système de détection d’intrusion, Anti-Virus, SIEM…), sont débordés face à l’interprétation du volume d’informations à traiter.

De nouveaux axes de résolution de ce problème apparaissent au travers des data-sciences et de la puissance apportée par les technologies du Big Data : c’est l’objet du projet Bluelog.

Les paradigmes de data-science qui répondent le mieux à ces nouvelles problématiques semblent être le machine learning, le NLP (natural langage processing), la théorie des graphes, la théorie de l’information et des signaux (dont celle de la parcimonie), ainsi que la théorie des jeux.

Les acteurs directement concernés par la sécurité d’une organisation (entreprise, administration, association) disposeront d’un système identification de patterns d’attaque et de compromissions les aidant à produire de « bonnes » décisions et des actions corrélées à la réalité de leur environnement. Ce système doit intégrer une dimension temporelle complète : passé (Forensic), présent (under attack) et futur (prediction).

C’est l’objectif des travaux menés par les membres de BlueDsX, amorcés par Hamza Hessid et Eva Laude, rejoints en début d’année par Jeremiah Sam Benjamin.