Prédiction et Machine Learning avec R


Le « Machine Learning », ce terme que l’on entend partout, tout le monde en parle, tout le monde le veut, ça a l’air d’en faire rêver plus d’un ! Mais qu’est-ce que c’est au juste ? Pourquoi tant d’engouement ces dernières années pour cet « Apprentissage Automatique » ? Et puis, à quoi ça sert au juste ? En ai-je besoin pour mon entreprise ? Tant de questions autour d’un concept.
Qu’est-ce que le Machine Learning ?
Le Machine Learning (ML) est une branche de l’Intelligence Artificielle, pas celle où on imagine des robots diriger le monde, mais plutôt celle où une technologie permet aux machines (les ordinateurs) d’apprendre des données passées pour prédire l’avenir. Pas mal n’est-ce pas ?!
Et quel en est le principe ? Le principe derrière est tout simple et existe depuis 1886 créé par François Galton : Entraîner un modèle statistique (avec tout un tas de paramètres et de critères dont vous ne voulez pas forcément entendre parler si vous n’êtes pas data scientist) sur des données : ce qu’on appelle « l’apprentissage » et l’appliquer sur des nouvelles données : ce qu’on appelle « la prédiction ».
Mais puisque le concept existe depuis aussi longtemps, pourquoi cet effet de mode ces dernières années seulement ? Eh bien, trois révolutions se sont opérées en même temps et ont permis l’avènement du Machine Learning tel qu’on le connaît aujourd’hui :

  1. La puissance de calcul des nouveaux processeurs : Avec la miniaturisation et l’effet d’échelle de la production industrielle, la puissance de calcul disponible à prix constant n’a cessé de s’accroitre depuis l’avènement de l’informatique à un rythme exponentiel : x10 tous les 5,5 ans (Nordhaus). Les machines sont capables d’apprendre plus vite et pour beaucoup moins cher.
  2. L’émergence de grosses bases de données : Merci la digitalisation et toutes les données produites par les systèmes d’information. Il faut savoir que plus un modèle prédictif reçoit de données explicatives, plus il apprend et donc meilleures seront les prédictions. L’information numérisée est donc l’aliment de base d’un système de Machine Learning : leur volume n’a cessé de croitre (environ 43 trillons de gigabytes en 2020 selon IBM), et le coût de leur stockage est faible (~18€/To/mois)
  3. Le partage des connaissances : Il y a quelques décennies, seuls les grands de ce monde maîtrisaient les systèmes et les outils de traitement du Machine Learning : IBM, Intel et Oracle pour ne citer qu’eux. Aujourd’hui, les technologies sont disponibles gratuitement et pour tous grâce à l’Open source et les leaders du secteur partagent leur effort de R&D en open source. (Tensorflow partagé par Google en 2015, Prophet par Facebook en 2018 par exemple).
    Qu’est-ce que les prédictions peuvent apporter à mon business ?
    Quand on parle de prédictions, il s’agit d’estimer à un horizon donné, la probabilité d’un événement ou le niveau d’un indicateur en étudiant des données passées. C’est pour cela que le Machine Learning est applicable à tous les domaines : Prédictions de vente, de demande, d’affluence, de trafic, mais aussi de fraude, de publicité ciblée… et bien d’autres. Quel que soit le métier, tant qu’on a des données s’y rapportant, on peut faire du Machine Learning et prédire l’avenir ou plutôt
    estimer l’avenir avec un niveau de précision que l’on connait, qui peut être assez fin si on a beaucoup de données explicatives et si le processus est prévisible ou régulier. Ces prédictions permettent entre autres d’optimiser la gestion de l’entreprise entreprise, en prenant des décisions appuyées sur de meilleures anticipations.
    Quels outils choisir ?
    Du fait du développement récent de cette discipline et du foisonnement open source, de nombreux outils existent et prolifèrent : R, Python, H2O, DataIku, SAS, Matlab, Stata, SPSS, Java, Keras, Tensorflow… Et il est parfois difficile d’y voir clair.
    Ces outils ne sont pas comparables : chaque outil a ses applications. Concernant les prévisions dans une approche open source, gratuite (Licence GPL) et ouverte, 2 langages adaptés aux analyses statistiques et au Machine Learning se sont imposés : Python et R.
    Python est un langage de programmation plus généraliste, qui pourra être utilisé également pour d’autres tâche de programmation informatique. De fait, il est plutôt dédié à des utilisateurs disposant d’une orientation de programmeur. L’essor de Python est récent (2016) et il dispose de moins de bibliothèques d’algorithmes que R, mais il a su s’imposer en 3 ans comme un outil incontournable.
    R est un outil dédié initialement aux statisticiens qui existe depuis 1993 et dont le développement a été fortement accéléré dès les années 2000. Il dispose de la plus grande richesse fonctionnelle, est plus simple à utiliser pour un acteur statisticien ou métier mais son positionnement le rend plus complexe à industrialiser.
    Pourquoi choisir R ?
    Tout d’abord, nous considérons que l’aspect open source d’un outil de Machine Learning est un prérequis important car il prémunit contre les limitations des outils « propriétaires », dont le modèle de licence est souvent basé sur le volume de données ou la capacité du processeur, ce qui est un facteur extrêmement préjudiciable pour une activité qui a besoin d’une très grande puissance … mais très rarement. Ce qui guide naturellement vers l’utilisation de R ou Pyhon.
    Le choix entre R ou Python est un arbitrage lié à la richesse fonctionnelle (R disposant de plus d’algorithmes notamment sur les aspects de série temporelle), au caractère innovant (Python est actuellement plus actif en termes de développement) et au profil des utilisateurs (R convient mieux aux acteurs métier, là ou python correspond mieux aux attentes des développeurs informatiques).
    Se former avec Datasulting à La Mêlée ?

    Si vous souhaitez en savoir plus sur le Machine Learning avec R, Datasulting propose des formations régulières sur le sujet « Apprendre le Machine Learning avec R), soit en groupe, soit en entreprise par l’organisme de formation de La Mêlée. Retrouvez les formations ici ou téléchargez notre catalogue
Vous êtes ici : Accueil > Le Blog de La Mêlée > Prédiction et Machine Learning avec R

Dernières actualités

#

Pascal Boiron, rédacteur en chef de Mid E-News, nous a quitté

13 janvier 2020

Un ami nous a quitté Il était toujours là, à l’affut de l’information, prêt à prendre une photo, faire une interview, rédiger un article de sa plume fine et toujours remplie d’humour. Après des études de sciences politiques et de journalisme, il fut l’un des piliers des rédactions de plusieurs journaux nationaux IT ( Distributique,

#

Prédiction et Machine Learning avec R

9 janvier 2020

Le « Machine Learning », ce terme que l’on entend partout, tout le monde en parle, tout le monde le veut, ça a l’air d’en faire rêver plus d’un ! Mais qu’est-ce que c’est au juste ? Pourquoi tant d’engouement ces dernières années pour cet « Apprentissage Automatique » ? Et puis, à quoi ça

#

Retour sur la table ronde : Faut-il encore faire appel à des blogueurs et des influenceurs dans le tourisme? Et comment ?

12 décembre 2019

Ce 14 novembre, nous avons organisé une table ronde sur la thématique de « Faut-il encore faire appel à des blogueurs et des influenceurs dans le tourisme? Et comment ? ». Voici le compte rendu de cette table ronde où professionnels du tourisme et blogueurs/influenceurs ont donné leurs opinions. Intervenants: Jean Micoud: directeur général du CDT 31  Cyrielle

#

Retour sur l’événement « Rencontre avec le numérique »

3 décembre 2019

L’association la Mêlée a participé en tant que partenaire à l’événement « Rencontre avec le numérique » le 28 novembre dans le Bassin Muretain. Entrez dans l’ère du numérique Le Club des Entreprises du Muretain organisait une matinée spéciale numérique dans l’objectif d’apporter des solutions personnalisées aux entreprises du Bassin Muretain . Plus de 80 personnes étaient

#

Café innovation La Mêlée Montpellier, Datasulting et DPO consulting: Le Potentiel de la Donnée et le RGPD

29 novembre 2019

Une vingtaine de montpelliérains étaient présents le 21 novembre 2019 au premier café innovation de Datasulting en partenariat avec DPO Consulting et la Mêlée Montpellier autour d’un thème d’actualité : Le Potentiel de la Donnée et le RGPD qui s’est tenu dans les locaux du village by CA Languedoc à Montpellier. Après un échange café

#Zoom

Pascal Boiron, notre rédacteur en chef, nous a quitté

13 Janvier 2020

Pascal Boiron, notre rédacteur en chef, nous a quitté Il était toujours là, à l’affut de l’information, prêt à prendre une photo, faire une interview, rédiger un article de sa plume fine et toujours remplie dhumour. Après des études de sciences politiques et de journalisme, il fut l’un des piliers des rédactions de plusieurs journaux....

L’article Pascal Boiron, notre rédacteur en chef, nous a quitté est apparu en premier sur Mid E-News.

#Clinavenir

Clinavenir à la conquête des élus

2 Janvier 2020

Pour débuter 2020, Clinavenir – alliance de 9 cliniques Occitanes organise le 6 janvier une rencontre avec des élus locaux, dont Jean-Luc Moudenc, Maire de Toulouse, Brigitte Micouleau, Sénatrice  de la Haute-Garonne et Mickaël Nogal, député de Haute-Garonne. À l’occasion de la rentrée 2020, Clinavenir, alliance de 9 cliniques indépendantes d’Occitanie – Pasteur, Rive Gauche,....

L’article Clinavenir à la conquête des élus est apparu en premier sur Mid E-News.

#Ayehu

Des workflows IT finement pilotés avec Ayehu

2 Janvier 2020

En partenariat avec  Aujourd’hui, les outils d’orchestration gagnent en popularité pour aider les administrateurs à se dégager des opérations courantes et s’atteler à d’autres tâches comme les opérations DevOps. Ayehu vient justement alléger le travail des opérationnels grâce à l’automatisation des workflows IT. Selon une étude récente de Data Bridge Market Research, le marché de....

L’article Des workflows IT finement pilotés avec Ayehu est apparu en premier sur Mid E-News.

#Osmozis

Montpellier : Osmozis lève 4ME

2 Janvier 2020

Osmozis, opérateur monteplliérain de réseaux LoRaWan et WiFi multi-services dédiés aux campings et résidences de vacances en Europe, annonce la réalisation d’une levée de fonds de 4 millions d’euros. Cette levée de fonds a été réalisée dans le cadre d’un placement privé d’obligations convertibles en actions réalisé avec suppression du droit préférentiel de souscription auprès....

L’article Montpellier : Osmozis lève 4ME est apparu en premier sur Mid E-News.

#Microsoft

Cenareo retenu par Microsoft

2 Janvier 2020

En collaboration depuis plusieurs années avec Microsoft, Cenareo, acteur majeur de l’affichage dynamique, obtient le statut « Co-Sell Ready ». Cette collaboration va permettre à Cenareo d’accélérer l’adoption de sa solution d’affichage dynamique sur le marché. Celle-ci est destinée à rendre la communication sur écrans plus intelligente, en la contextualisant et en la rendant data-driven.....

L’article Cenareo retenu par Microsoft est apparu en premier sur Mid E-News.

previous arrow
next arrow
Slider

Partenaires de la Mêlée

Logo Invest in Andorra
carcassonne agglo
haute garonne
Logo Toulouse Métropole
Crédit Agricole 31
Groupe Cargo
ENSEEIHT
Sicoval
AEROSPACE_VALLEY
SFR
Green Tech
La Région Occitanie
SNCF
Meteo France
logo MPN
brune
logo quai des savoirs
logo village by ca
Slider