Méthode

Nous sommes aujourd'hui en plein dans ce qu'on appelle la "Big Data Revolution", une époque où la production et la disponibilité de données et d’informations est absolument incomparable avec toute autre période de l'histoire humaine. Des données sont produites en tous lieux et en tout temps, y compris pendant les activités les plus banales de la vie quotidienne. Le monde de l’entreprise est de plus en plus conscient de l'importance de ces données et de la manière dont on peut en extraire des informations décisives.

Cependant, tirer le meilleur parti des données n'est pas affaire simple. Les données en elles-mêmes ne valent pas grande chose. Comme l'a dit le mathématicien Henri Poincaré il y a plus d'un siècle, "On fait la science avec des faits, comme on fait une maison avec des pierres : mais une accumulation de faits n'est pas plus une science qu'un tas de pierres n'est une maison". Afin de pouvoir exprimer tout leur potentiel, les données doivent être accompagnées d'un modèle approprié, c'est-à-dire d'un système qui théorise les relations entre les variables et leurs tendances. C'est lorsque les données matchent avec le modèle correct qu’émerge leur valeur réelle.


QUE SONT LES MODÈLES PRÉDICTIFS?

Ce qu’on appelle les "modèles prédictifs" est un ensemble de techniques qui tentent "d'interpréter" les données en y décelant régularités et tendances. À cette fin, l'utilisation des statistiques est fondamentale : dans presque tous les domaines les incertitudes guettent. Les techniques statistiques permettent de les gérer et de les quantifier. En outre, elles réussissent également à "extrapoler" les tendances, ce qui permet d'obtenir des prévisions. C’est précisément là que réside le but principal d’un modèle prédictif, à savoir tenter de prédire de manière rationnelle les grandeurs d'intérêt une fois que le domaine des variables en jeu a été décrit et modélisé.


TYPOLOGIES ET CHAMPS D’APPLICATION

Il existe de nombreux types de modèles prédictifs. Avec le besoin croissant dicté par une énorme production de données, nous assistons aujourd'hui à un développement continu de nouvelles techniques statistiques et d'algorithmes qui s’emploient face aux problématiques les plus variées. À la base de tout, il y a toujours la même besoin: la capacité de prédire une variable d'intérêt.

Supposons que nous devons gérer un entrepôt et ses stocks. Ce qui nous intéresse est peut être de connaître à l’avance quelle sera la demande d'un bien donné dans un avenir proche. Dans ce cas, ce qui pourrait être approprié est un modèle "régressif" capable de formaliser la demande en tant que fonction, selon certains paramètres, d'autres variables, telles que la période, les campagnes de marketing et d'autres facteurs encore.

Si par contre nous voulions prévoir le comportement d'un certain profil à partir de certaines informations disponibles, nous utiliserons alors des "modèles de classifications supervisées" grâce auxquels nous pourrons prévoir à temps à quelle catégorie appartient ce profil et mettre en place les actions les plus appropriées. De telles problématiques sont courantes dans l'entreprise. Par exemple, le phénomène de l’attrition ("churn"), la perte de certains clients au bénéfice de la concurrence. Comment est-il possible de cibler à temps ceux-là qui changeront de fournisseur afin de les fidéliser avec des offres appropriées? Si l’on dispose d’autres caractéristiques du profil d’un client, l’on pourra essayer de comprendre lesquelles seraient davantage en relation avec le phénomène en question. Des algorithmes tels que les Réseaux bayésiens, les réseaux neuronaux, les arbres de classification et bien d'autres permettent d'inférer et de prédire la catégorie d'un profil en apprenant à partir de cas connus.

Dans certaines circonstances, l’on pourrait être intéressé à comprendre si au sein d’une population donnée certains groupes avaient des caractéristiques similaires, afin de prévoir des comportements futurs. À cette fin, des "modèles de classification non supervisés" peuvent être appliqués. Des approches de ce genre se sont montrées extrêmement fructueuses dans le commerce électronique, où l’on cherche des groupes de consommateurs s'intéressant à des produits similaires : si les clients sont correctement caractérisés l’on pourra s’adresser à eux avec des offres publicitaires optimales. Parmi les techniques proposées à cette fin se trouvent les "k-Means", l'analyse par composants principaux et autres.

Il est très difficile de faire des prévisions,
notamment si elles concernent le futur
Niels Bohr

Ce site web utilise des cookies pour analyser son utilisation et permettre l’accès aux pages réservées. Nos cookies ne permettent pas d’identifier les utilisateurs. Les cookies sont enregistrés dans votre navigateur et sont utilisés pour personnaliser votre expérience sur notre site web. Continuer la navigation sans modifier vos préférences actuelles implique l’acceptation des cookies. Vous pouvez modifier vos préférences d’utilisation de cookies à tout moment.