Oracle, spécialiste historique de la donnée

Publié le dans seminar-past

Séminaire du Mastère Spécialisé Big Data de Télécom ParisTech du jeudi 7 janvier 2016.

Olivia Faucheux, Oracle Big Data Business Development Manager et Dario Vega, Oracle Principal Sales Consultant, sont venus présenter aux étudiants du Mastère Spécialisé® Big Data les principaux produits d’Oracle et introduire les problématiques spécifiques à l’Internet des objets.

Oracle est connu depuis 40 ans pour ses bases de données. Fournisseur historique d’une base de données relationnelle, l’entreprise propose aujourd’hui des solutions à la fois complètes et modulaires pour permettre la collecte, le traitement, l’analyse et le partage des informations structurées et non structurées, comme par exemple celles issues de l’internet des objets.

SI Oracle a mis au point une expertise sur les données structurée, la société a étendu son savoir-faire à tout type de données, pour faire en sorte que le capital numérique de toute entreprise puisse être valorisé. En effet si les données structurées servent à gérer l’activité des entreprises, les « nouvelles données », que l’on trouve très souvent à l’extérieur de l’entreprise, peuvent permettre de changer son activité de façon surprenante.

Quelques exemples de réalisations

Avant de livrer ses avions, un grand acteur de l’aéronautique européen en vérifie la conformité à la conception par des vols d’essai. Cette phase, nécessaire à leur certification de navigabilité, génère un volume croissant de données à analyser pour détecter les problèmes à corriger. On parle ici d’environ 6 000 capteurs, analysant plus de 600 000 paramètres, disposés sur les appareils effectuant chacun jusqu’à 6 vols d’essais par jour. Pour tenir le rythme des essais et respecter les délais de livraison, l’avionneur européen a mis en place l’infrastructure Big Data d’Oracle.

Un assureur italien a souhaité proposer à ses assurés des contrats de types « pay as you drive », adaptés à leur style de conduite. En partenariat avec une start-up, ils ont proposé un boitier connecté pour la voiture, qui collecte toutes les informations nécessaires à la réalisation d’un contrat d’assurance à la carte.
Autre secteur : celui de l’emploi avec Randstad, qui a cherché à optimiser la correspondance des offres et des demandes d’emploi, en proposant de nouveaux services comme l’analyse des bassins d’emploi.

Cette solution se veut un outil d’aide à la décision à destination des entreprises et des candidats. La solution cartographie les compétences correspondant à un besoin particulier sur un bassin d’emploi donné. Par exemple, une entreprise désireuse de s’implanter sur un territoire saura si les compétences nécessaires sont disponibles localement. L’outil Big Data du groupe Randstad France propose une analyse à la fois élargie et enrichie de l’offre et de la demande de travail.
Tous ces exemples s’appuient sur la plateforme d’Oracle « All Data Management » qui permet d’intégrer les données de différentes façons : batch, en flux, événementielle… Elle est associée à une plateforme analytique pour révéler leur valeur, pour prédire et pouvoir agir. Les résultats peuvent être fournis sous forme d’applications partagées, de tableaux de bord… et réinjectés dans le système.

Zoom sur le data management

Le modèle historique du datawarehouse , n’exploite pas toutes les données comme par exemple les fichiers de logs d’un site web, les données des partenaires et des réseaux sociaux, l’open data… Avec la solution d’Oracle, ces données externes sont placées dans un « data reservoir » qui va venir compléter le datawarehouse.
Oracle a fait l’acquisition de Sun Microsystems en 2010, un fabriquant de hardware, ce qui a permis à l’entreprise de proposer une « Big Data appliance », système intégré prêt à l’emploi combinant hardware et software. Ce cluster se configure en deux jours et on peut lui ajouter des nœuds supplémentaires en fonction des besoins néessaires.

L’open source au cœur

Le monde du Big Data reposant sur beaucoup de solutions libres, le choix d’Oracle a été de proposer sur ses appliances une distribution Hadoop déjà existante, en partenariat avec Cloudera. La partie analytics se fait également beaucoup avec R, qui est encapsulé pour industrialiser les performances.. Le programme Oracle Labs rassemble ce qui est fait en collaboration, entre autre, avec les universitaires.

Bien qu’éditeur, Oracle est également un contributeur important des communautés open source. Certains grands clients ne veulent pas investir sur l’open source car ils ont besoin d’un service support réactif : avec Oracle ils peuvent bénéficier de l’expertise open source et du service support.

Quand le Big Data transforme l’activité

La Caixa Banque est parti du constat que ses clients ne viennent plus dans ses agences, mais près de 4 millions d’entre eux utilisent l’application mobile de la banque depuis leurs téléphones portables. Oracle a donc mis en place une infrastructure complémentaire dans une appliance pour collecter les informations clients. Cela a permis, entre autre, d’envoyer des coupons de réduction géolocalisés de la part de partenaires de la banque, grâce à un moteur de recommandation auto apprenant. La banque étend ainsi son modèle économique en fournissant un push commercial auprès de différents clients : c’est un des exemples où les technologies Big Data permettent de gérer mais aussi de transformer l’activité.

Pour SFPark, une société qui gère des places de parking à San Francisco, l’enjeu était de pouvoir limiter les bouchons aux heures de pointe. Des capteurs placés sous les trottoirs des différents quartier de la ville ont permis de déterminer les quartiers les plus fréquentés selon les heures, puis d’installer des bornes de stationnement avec des prix plus attractifs sur les zones sous-utilisées afin d’y attirer les automobilistes. Les tarifs varient donc de 25 cents à 6  dollars de l’heure selon le jour, l’heure et l’emplacement, et cela peut même aller jusqu’à 18 dollars lors d’une grande manifestation sportive par exemple. Le taux d’occupation est régulé entre 60 et 80 %, de façon à garantir 15% de places libres à tout moment : ainsi les automobilistes passent deux fois moins de temps à trouver une place.

Quelles solutions pour les métiers ?

Les métiers veulent de plus en plus pouvoir accéder aux données et faire eux-mêmes leurs recherches. Mais comment analyser rapidement le Big Data alors que les données sont confuses et les outils complexes ? En effet on passe généralement 80% des efforts sur l’évaluation et la préparation des données, ce qui nécessite de faire appel à beaucoup de personnes, qui doivent être disponibles pour que les tâches s’enchainent…

Oracle propose pour cela Big Data Discovery, destiné à tout type d’utilisateur. C’est une nouvelle approche sur le sujet de la valorisation de la donnée, permettant à tous les utilisateurs d’une entreprise, d’accéder rapidement aux données brutes d’un cluster hadoop et d’ensaisir le potentiel. Mais également de transformer simplement cette donnée pour l’améliorer, d’en découvrir intuitivement la valeur et de la partager au plus grand nombre. Le tout dans une seule et unique application.

Internet des objets : enjeux et questionnements

Qu’est-ce que l’internet des objets ? Il y a plusieurs façons de l’aborder. On peut penser à la génération de grandes masses de données, à la maintenance prédictive, à un monde connecté où les objets se parlent entre eux. On peut évoquer Java, un langage couramment utilisé pour la programmation des objets connectés, et les objets eux-mêmes, leur design, leur coût.

Quand on pense à un capteur comme un compteur intelligent qui enverra un signal toutes les 10 minutes pour des millions de clients, se pose la question du stockage des données : combien d’années d’archives gardera-t-on ? On peut évoquer aussi les moyen de communication : certains capteurs communiquent en http, d’autres via le courant porteur, et à ce jour il n’y a pas d’accord global sur le protocole d’échange d’informations à utiliser.

La sécurité est également une question centrale, on peut même dire que la plupart des projets d’objets connectés sont d’abord basés sur la sécurité. En effet tant que l’on reste sur le réseau fermé d’une entreprise, les risques sont mineurs. Mais dès lors que l’objet est connecté au Web mondial, les risques de piratage existent.

Enfin une question de taille émerge : à qui appartiennent les données ? Ce sont maintenant les fabriquant de pneus qui insèrent eux-mêmes des capteurs dans leurs produits. Les constructeurs de moteurs ne vendent plus leurs moteurs mais des heures de vol selon une logique de maintenance. La question n’est pas de pouvoir corréler les données, mais de savoir à qui elles appartiennent, quel est leur niveau de confidentialité et mettre d’accord l’ensemble des acteurs. Les défis du Big Data sont donc loin de n’être que d’ordre technologique…

Pour conclure son intervention, Oracle a présenté et fait une brève démonstration de sa solution Oracle Internet Of Things Cloud Service pour illustrer, entre autre, la capacité :

  • à collecter les données des capteurs de manière sécurisée
  • à analyser ces données « time series » en temps réel
  • à intégrer ces données au reste du système d’information y compris le Big Data, sujet du séminaire de ce jour