Prédiction et Machine Learning avec R


Le « Machine Learning », ce terme que l’on entend partout, tout le monde en parle, tout le monde le veut, ça a l’air d’en faire rêver plus d’un ! Mais qu’est-ce que c’est au juste ? Pourquoi tant d’engouement ces dernières années pour cet « Apprentissage Automatique » ? Et puis, à quoi ça sert au juste ? En ai-je besoin pour mon entreprise ? Tant de questions autour d’un concept.
Qu’est-ce que le Machine Learning ?
Le Machine Learning (ML) est une branche de l’Intelligence Artificielle, pas celle où on imagine des robots diriger le monde, mais plutôt celle où une technologie permet aux machines (les ordinateurs) d’apprendre des données passées pour prédire l’avenir. Pas mal n’est-ce pas ?!
Et quel en est le principe ? Le principe derrière est tout simple et existe depuis 1886 créé par François Galton : Entraîner un modèle statistique (avec tout un tas de paramètres et de critères dont vous ne voulez pas forcément entendre parler si vous n’êtes pas data scientist) sur des données : ce qu’on appelle « l’apprentissage » et l’appliquer sur des nouvelles données : ce qu’on appelle « la prédiction ».
Mais puisque le concept existe depuis aussi longtemps, pourquoi cet effet de mode ces dernières années seulement ? Eh bien, trois révolutions se sont opérées en même temps et ont permis l’avènement du Machine Learning tel qu’on le connaît aujourd’hui :

  1. La puissance de calcul des nouveaux processeurs : Avec la miniaturisation et l’effet d’échelle de la production industrielle, la puissance de calcul disponible à prix constant n’a cessé de s’accroitre depuis l’avènement de l’informatique à un rythme exponentiel : x10 tous les 5,5 ans (Nordhaus). Les machines sont capables d’apprendre plus vite et pour beaucoup moins cher.
  2. L’émergence de grosses bases de données : Merci la digitalisation et toutes les données produites par les systèmes d’information. Il faut savoir que plus un modèle prédictif reçoit de données explicatives, plus il apprend et donc meilleures seront les prédictions. L’information numérisée est donc l’aliment de base d’un système de Machine Learning : leur volume n’a cessé de croitre (environ 43 trillons de gigabytes en 2020 selon IBM), et le coût de leur stockage est faible (~18€/To/mois)
  3. Le partage des connaissances : Il y a quelques décennies, seuls les grands de ce monde maîtrisaient les systèmes et les outils de traitement du Machine Learning : IBM, Intel et Oracle pour ne citer qu’eux. Aujourd’hui, les technologies sont disponibles gratuitement et pour tous grâce à l’Open source et les leaders du secteur partagent leur effort de R&D en open source. (Tensorflow partagé par Google en 2015, Prophet par Facebook en 2018 par exemple).
    Qu’est-ce que les prédictions peuvent apporter à mon business ?
    Quand on parle de prédictions, il s’agit d’estimer à un horizon donné, la probabilité d’un événement ou le niveau d’un indicateur en étudiant des données passées. C’est pour cela que le Machine Learning est applicable à tous les domaines : Prédictions de vente, de demande, d’affluence, de trafic, mais aussi de fraude, de publicité ciblée… et bien d’autres. Quel que soit le métier, tant qu’on a des données s’y rapportant, on peut faire du Machine Learning et prédire l’avenir ou plutôt
    estimer l’avenir avec un niveau de précision que l’on connait, qui peut être assez fin si on a beaucoup de données explicatives et si le processus est prévisible ou régulier. Ces prédictions permettent entre autres d’optimiser la gestion de l’entreprise entreprise, en prenant des décisions appuyées sur de meilleures anticipations.
    Quels outils choisir ?
    Du fait du développement récent de cette discipline et du foisonnement open source, de nombreux outils existent et prolifèrent : R, Python, H2O, DataIku, SAS, Matlab, Stata, SPSS, Java, Keras, Tensorflow… Et il est parfois difficile d’y voir clair.
    Ces outils ne sont pas comparables : chaque outil a ses applications. Concernant les prévisions dans une approche open source, gratuite (Licence GPL) et ouverte, 2 langages adaptés aux analyses statistiques et au Machine Learning se sont imposés : Python et R.
    Python est un langage de programmation plus généraliste, qui pourra être utilisé également pour d’autres tâche de programmation informatique. De fait, il est plutôt dédié à des utilisateurs disposant d’une orientation de programmeur. L’essor de Python est récent (2016) et il dispose de moins de bibliothèques d’algorithmes que R, mais il a su s’imposer en 3 ans comme un outil incontournable.
    R est un outil dédié initialement aux statisticiens qui existe depuis 1993 et dont le développement a été fortement accéléré dès les années 2000. Il dispose de la plus grande richesse fonctionnelle, est plus simple à utiliser pour un acteur statisticien ou métier mais son positionnement le rend plus complexe à industrialiser.
    Pourquoi choisir R ?
    Tout d’abord, nous considérons que l’aspect open source d’un outil de Machine Learning est un prérequis important car il prémunit contre les limitations des outils « propriétaires », dont le modèle de licence est souvent basé sur le volume de données ou la capacité du processeur, ce qui est un facteur extrêmement préjudiciable pour une activité qui a besoin d’une très grande puissance … mais très rarement. Ce qui guide naturellement vers l’utilisation de R ou Pyhon.
    Le choix entre R ou Python est un arbitrage lié à la richesse fonctionnelle (R disposant de plus d’algorithmes notamment sur les aspects de série temporelle), au caractère innovant (Python est actuellement plus actif en termes de développement) et au profil des utilisateurs (R convient mieux aux acteurs métier, là ou python correspond mieux aux attentes des développeurs informatiques).
    Se former avec Datasulting à La Mêlée ?

    Si vous souhaitez en savoir plus sur le Machine Learning avec R, Datasulting propose des formations régulières sur le sujet « Apprendre le Machine Learning avec R), soit en groupe, soit en entreprise par l’organisme de formation de La Mêlée. Retrouvez les formations ici ou téléchargez notre catalogue
Vous êtes ici : Accueil > Le Blog de La Mêlée > Prédiction et Machine Learning avec R

Dernières actualités

Retour sur les piliers de la Mêlée – Novembre

#

Retour sur les piliers de la Mêlée – Novembre

16 novembre 2020

Transformation Numérique : L’un des enjeux pour la Mêlée sur ce volet, est de sensibiliser les PME et TPE à la transformation numérique. Au vu de l’urgence de la situation actuelle, la Mêlée met en place des webinaires en ligne gratuits, depuis le premier confinement. De plus, un drive dédié à la sensibilisation #TransfoNum a

6 bonnes raisons d’ouvrir un compte professionnel dans une néobanque

#

6 bonnes raisons d’ouvrir un compte professionnel dans une néobanque

17 juin 2020

La digitalisation des services bancaires est déjà bien entamée. À l’heure où les banques traditionnelles et les banques en ligne vous proposent des applications de plus en plus sophistiquées, un nouvel acteur apparaît dans le monde bancaire : les néobanques.  Le défi qu’elles prétendent relever ? Disrupter, bousculer le marché et les méthodes installées avec la promesse

3 points clés pour réussir son entrée dans la dématérialisation

#

3 points clés pour réussir son entrée dans la dématérialisation

19 mai 2020

Le passage à la dématérialisation en entreprise n’est pas si simple et demande une bonne organisation. Selon une étude mondiale réalisée par IDC, les problèmes de gestion des documents représentent une perte de 21 % de la productivité organisationnelle. Toutes les entreprises y sont confrontées au quotidien. Rappel des enjeux d’un projet de Dématérialisation Augmenter la visibilité

La Mêlée et Occitanie Data sont désormais partenaires !

#

La Mêlée et Occitanie Data sont désormais partenaires !

18 mai 2020

Le 21 avril dernier, le « 5 à 7 by La Mêlée : La donnée publique ou privée : comment la valoriser ? » a réuni près d’une quarantaine de participants. Cela a également été l’occasion pour Occitanie Data et La Mêlée de signer en live une convention de partenariat ! La data est une sujet désormais

Interview avec la commission etourisme, qui vient de lancer le podcast « le tourisme part en live »

#

Interview avec la commission etourisme, qui vient de lancer le podcast « le tourisme part en live »

18 mai 2020

Créée en 2015, relancée l’année dernière avec de nombreux événements à la clé, la commission e-tourisme de la Mêlée lance « le tourisme part en live » ! Dans cette série de podcasts, nous interrogeons des professionnels du tourisme et du e-tourisme qui partagent leur point de vue et leur expérience sur l’actualité. A qui s’adresse le podcast

Toulouse, la capitale French Tech qui monte en puissance

#Innovation

Toulouse, la capitale French Tech qui monte en puissance

17 Juin 2021

En partenariat avec . La French Tech Toulouse fête ses premières années d’existence en tant qu’association. Pour la suite, elle met en place plusieurs programmes afin d’accompagner les entreprises innovantes. Ses actions sont soutenues par l’État, la Région et la Métropole toulousaine. Avec le retour progressif à la vie normale, la French Tech Toulouse fait

L’article Toulouse, la capitale French Tech qui monte en puissance est apparu en premier sur Mid E-News.

Vers l’infini et au-delà : Le Cnes et Nubbo s’associent pour soutenir les start-up qui visent la Lune

#La Tech

Vers l’infini et au-delà : Le Cnes et Nubbo s’associent pour soutenir les start-up qui visent la Lune

17 Juin 2021

En partenariat avec . L’incubateur régional Nubbo et le Cnes lancent TechTheMoon, un programme destiné à soutenir les start-up qui veulent se lancer dans un projet lunaire. L’objectif est de permettre aux jeunes entrepreneurs d’innover et de partir à la conquête spatiale. Avec TechTheMoon, les start-up se lancent dans la conquête de la Lune. Ce

L’article Vers l’infini et au-delà : Le Cnes et Nubbo s’associent pour soutenir les start-up qui visent la Lune est apparu en premier sur Mid E-News.

La Mêlée réussit son année charnière

#Stratégies

La Mêlée réussit son année charnière

16 Juin 2021

L’association La Mêlée a tenu hier soir son Assemblée générale à Montpellier et en ligne. L’événement a été l’occasion de revenir sur l’année 2020, mais aussi sur les éventuels changements à venir au sein de l’association. Agilité et résilience « Nous avons vécu une année particulière au cours de laquelle beaucoup d’événements ont été annulés. Même

L’article La Mêlée réussit son année charnière est apparu en premier sur Mid E-News.

Déploiement de la fibre en Haute-Garonne : 13 nouvelles communes éligibles

#Transformation Digitale et Territoires

Déploiement de la fibre en Haute-Garonne : 13 nouvelles communes éligibles

16 Juin 2021

Fibre 31, l’entreprise délégataire de Haute-Garonne Numérique chargée de la construction et du déploiement de la fibre annonce l’éligibilité de 13 nouvelles communes : Bessières Gragnagues La Salvetat Saint-Gilles Lagadelle-sur-Lèze Léguevin Merville Montastruc-la-Conseillère Montberon Montesquieu-Volvestre Montréjeau Rieux-Volvestre Roquettes Saint-Genies Bellevue Les habitants et les entreprises peuvent dès à présent vérifier leur éligibilité et déclencher la procédure

L’article Déploiement de la fibre en Haute-Garonne : 13 nouvelles communes éligibles est apparu en premier sur Mid E-News.

Pau. Rezomee, la nouvelle plateforme pédagogique au service du public pour tout comprendre sur le réseau de chaleur

#Transformation Digitale et Territoires

Pau. Rezomee, la nouvelle plateforme pédagogique au service du public pour tout comprendre sur le réseau de chaleur

16 Juin 2021

À l’occasion de la mise en service des premiers sites raccordés au réseau de chaleur urbain palois, ENGIE Solutions annonçait le 17 mai dernier le lancement de Rezomee, une nouvelle plateforme développée pour sa filiale Pau Béarn Pyrénées Energies Services commune avec la Banque des Territoires, conçue à la fois pour faciliter le dialogue avec

L’article Pau. Rezomee, la nouvelle plateforme pédagogique au service du public pour tout comprendre sur le réseau de chaleur est apparu en premier sur Mid E-News.

previous arrow
next arrow

Partenaires de la Mêlée