Lorsqu'un nuage de points, c'est-à-dire une représentation
d'un jeu de couples de données (
y_1 et
x_1,
y_2 et
x_2, …,
y_n et
x_n), semble présenter une évolution affine, il est possible de
modéliser cette évolution par une courbe de tendance de la
forme d'une droite, en déterminant un coefficient directeur
a et une ordonnée à l'origine
b.
Cette modélisation, appelée régression linéaire, consiste
donc à exploiter des données connues pour obtenir une relation
simple
y~=~a \cdot x+b entre deux types de données. Cette
relation peut ensuite être utilisée pour estimer, à partir d'une
valeur
x, la donnée
y qui lui est associée, et inversement.