Lineare Regression

In diesem Modul werden die Konzepte der linearen Regression vorgestellt.

Die lineare Regression ist ein statistisches Verfahren, mit dem die Beziehung zwischen Variablen ermittelt wird. Bei der linearen Regression im Kontext von maschinellem Lernen wird die Beziehung zwischen Features und einem Label ermittelt.

Angenommen, wir möchten den Kraftstoffverbrauch eines Autos in Meilen pro Gallone auf Grundlage des Gewichts des Autos vorhersagen und haben den folgenden Datensatz:

Pfund in Tausend (Funktion) Meilen pro Gallone (Label)
3,5 18
3,69 15
3.44 18
3.43 16
4.34 15
4,42 14
2,37 24

Wenn wir diese Punkte in einem Diagramm darstellen, erhalten wir Folgendes:

Abbildung 1: Datenpunkte mit einem von links nach rechts abfallenden Trend.

Abbildung 1. Gewicht des Autos (in Pfund) im Vergleich zur Bewertung in Meilen pro Gallone. Je schwerer ein Auto ist, desto geringer ist in der Regel die Anzahl der Meilen, die es pro Gallone zurücklegen kann.

Wir könnten ein eigenes Modell erstellen, indem wir eine Linie durch die Punkte ziehen, die am besten passt:

Abbildung 2. Datenpunkte mit einer durch sie verlaufenden Best-Fit-Linie, die das Modell darstellt.

Abbildung 2. Eine Linie, die am besten durch die Daten aus der vorherigen Abbildung passt.

Lineare Regressionsgleichung

In algebraischer Hinsicht wird das Modell als $ y = mx + b $ definiert, wobei

  • $ y $ ist der Wert, den wir vorhersagen möchten, nämlich Meilen pro Gallone.
  • $ m $ ist die Steigung der Geraden.
  • $ x $ ist das Gewicht in Pfund – unser Eingabewert.
  • $ b $ ist der Y-Achsenabschnitt.

In ML wird die Gleichung für ein lineares Regressionsmodell so geschrieben:

$$ y' = b + w_1x_1 $$

Dabei gilt:

  • $ y' $ ist das vorhergesagte Label, also die Ausgabe.
  • $ b $ ist der Bias des Modells. Der Bias entspricht dem y-Achsenabschnitt in der algebraischen Gleichung für eine Linie. In ML wird der Bias manchmal auch als $ w_0 $ bezeichnet. Der Bias ist ein Parameter des Modells und wird während des Trainings berechnet.
  • $ w_1 $ ist das Gewicht des Merkmals. Die Gewichtung entspricht der Steigung $ m $ in der algebraischen Gleichung für eine Gerade. Die Gewichtung ist ein Parameter des Modells und wird während des Trainings berechnet.
  • $ x_1 $ ist ein Feature – die Eingabe.

Während des Trainings berechnet das Modell das Gewicht und den Bias, die das beste Modell ergeben.

Abbildung 3: Die Gleichung y' = b + w1x1, wobei jede Komponente mit ihrem Zweck versehen ist.

Abbildung 3. Mathematische Darstellung eines linearen Modells.

In unserem Beispiel würden wir das Gewicht und den Bias aus der von uns gezeichneten Linie berechnen. Der Bias beträgt 34 (wo die Linie die y-Achse schneidet) und die Gewichtung –4,6 (die Steigung der Linie). Das Modell würde als $ y' = 34 + (-4.6)(x_1) $ definiert und könnte für Vorhersagen verwendet werden. Mit diesem Modell würde ein 1.814 kg schweres Auto beispielsweise einen geschätzten Kraftstoffverbrauch von 6,6 km pro Liter haben.

Abbildung 4: Dieselbe Grafik wie in Abbildung 2, in der der Punkt (4, 15,6) hervorgehoben ist.

Abbildung 4. Mit dem Modell wird für ein 1.800 kg schweres Auto eine Kraftstoffeffizienz von 6,6 km/l prognostiziert.

Modelle mit mehreren Funktionen

Im Beispiel in diesem Abschnitt wird nur ein Merkmal verwendet, nämlich das Gewicht des Autos. Ein komplexeres Modell kann jedoch auf mehreren Merkmalen basieren, die jeweils ein separates Gewicht ($ w_1 $, $ w_2 $ usw.) haben. Ein Modell, das auf fünf Features basiert, würde beispielsweise so geschrieben:

$ y' = b + w_1x_1 + w_2x_2 + w_3x_3 + w_4x_4 + w_5x_5 $

Ein Modell, das den Kraftstoffverbrauch vorhersagt, könnte beispielsweise zusätzlich die folgenden Merkmale verwenden:

  • Hubraum
  • Beschleunigung
  • Anzahl der Zylinder
  • Pferdestärke

Dieses Modell würde so geschrieben:

Abbildung 5: Lineare Regressionsgleichung mit fünf Merkmalen.

Abbildung 5. Ein Modell mit fünf Features zur Vorhersage der Meilen pro Gallone eines Autos.

Wenn wir einige dieser zusätzlichen Funktionen grafisch darstellen, sehen wir, dass sie auch in einem linearen Verhältnis zum Label „Meilen pro Gallone“ stehen:

Abbildung 6: Hubraum in Kubikzentimetern im Vergleich zu Meilen pro Gallone mit einer negativen linearen Beziehung.

Abbildung 6. Hubraum eines Autos in Kubikzentimetern und die Angabe in Meilen pro Gallone. Je größer der Motor eines Autos ist, desto geringer ist in der Regel der Kraftstoffverbrauch pro Kilometer.

Abbildung 7. Die Beschleunigung von 0 auf 60 mph in Sekunden wird im Diagramm gegen die Meilen pro Gallone aufgetragen. Es ist ein positiver linearer Zusammenhang zu erkennen.

Abbildung 7. Die Beschleunigung eines Autos und sein Kraftstoffverbrauch in Kilometern pro Liter. Je länger die Beschleunigung eines Autos dauert, desto höher ist in der Regel der Kraftstoffverbrauch in Litern pro 100 Kilometer.

Übung: Wissen testen

Welche Teile der linearen Regressionsgleichung werden während des Trainings aktualisiert?
Bias und Gewichte
Während des Trainings aktualisiert das Modell den Bias und die Gewichte.
Die Vorhersage
Vorhersagen werden während des Trainings nicht aktualisiert.
Die Featurewerte
Featurewerte sind Teil des Datasets und werden daher während des Trainings nicht aktualisiert.