La puissance de calcul des ordinateurs alliée à l’efficacité des scripts de machine learning nous permettent aujourd’hui d’aller plus loin dans l’analyse des données, par la modélisation mathématique des interactions entre les variables. On bascule ainsi du monde des statistiques vers celui des probabilités. Classification, régression, prédiction, extraction et ajout d’informations provenant de supports non structurés (documentation, mails, sites internet), traitement d’images pour le contrôle qualité … Les applications sont multiples et variées.

Au niveau des TPE/PME, l’usage le plus immédiat est le clustering (classification), via la segmentation clients, qui permet de différencier les stratégies commerciales ou de cibler la communication.

Pour répondre au besoin d’anticiper, les techniques d’apprentissage machine permettent aussi de réaliser une analyse prédictive, qui modélise l’activité pour estimer sa trajectoire. Les données de l’entreprise sont complétées par des jeux de données externes, relatives au marché. Schématiquement, si la société vend des parapluies, nous grefferons sur ses données commerciales des données météo. Tous types de données environnementales (météo, trafic routier, démographie) ou émotionnelles (issues des réseaux sociaux comme les like sur facebook, l’analyse textuelle des commentaires) peuvent être intégrées au modèle. En le complexifiant, on perd en lisibilité mais la prédiction est plus fiable.