Testen Sie Ihr Wissen
Mit Sammlungen den Überblick behalten Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.
Mit den folgenden Fragen können Sie Ihr Verständnis der wichtigsten ML-Konzepte festigen.
Prognosekraft
Bei überwachten ML-Modellen werden Datasets mit Labels verwendet. Das Modell lernt, das Label anhand der Features vorherzusagen. Allerdings hat nicht jedes Merkmal in einem Datensatz eine Vorhersagekraft. In einigen Fällen sind nur wenige Merkmale als Prädiktoren für das Label geeignet. Verwenden Sie im folgenden Dataset „price“ als Label und die übrigen Spalten als Features.
Welche drei Merkmale sind Ihrer Meinung nach die größten Preisfaktoren für ein Auto?
Marke_Modell, Jahr, Meilen
Marke/Modell, Baujahr und Kilometerstand eines Autos sind wahrscheinlich die stärksten Indikatoren für den Preis.
Farbe, Höhe, Marke_Modell
Die Höhe und Farbe eines Autos sind keine guten Indikatoren für den Preis eines Autos.
Meilen, Getriebe, Marke_Modell.
Das Getriebe ist kein wichtiger Preisfaktor.
Reifengröße, Radstand, Jahr.
Reifengröße und Radstand sind keine guten Indikatoren für den Preis eines Autos.
Supervisiertes und unüberwachtes Lernen
Je nach Problem verwenden Sie entweder einen überwachten oder einen unüberwachten Ansatz. Wenn Sie beispielsweise den Wert oder die Kategorie, die Sie vorhersagen möchten, bereits kennen, sollten Sie die Methode des überwachten Lernens verwenden. Wenn Sie jedoch wissen möchten, ob Ihr Datensatz Segmentierungen oder Gruppierungen ähnlicher Beispiele enthält, sollten Sie sich für das unüberwachte Lernen entscheiden.
Angenommen, Sie haben einen Datensatz mit Nutzern einer Online-Shopping-Website, der die folgenden Spalten enthält:
Wenn Sie die Arten von Nutzern kennenlernen möchten, die die Website besuchen, würden Sie dann die Methode des überwachten oder des unüberwachten Lernens verwenden?
Unüberwachtes Lernen
Da wir möchten, dass das Modell Gruppen ähnlicher Kunden clustert, verwenden wir das unbeaufsichtigte Lernen. Nachdem das Modell die Nutzer in Cluster unterteilt hat, erstellen wir eigene Namen für jeden Cluster, z. B. „Rabattjäger“, „Schnäppchenjäger“, „Surfer“, „Treue Kunden“ und „Umherschweifende“.
Supervised Learning, weil ich vorhersagen möchte, zu welcher Klasse ein Nutzer gehört.
Beim überwachten Lernen muss das Dataset das Label enthalten, das Sie vorhersagen möchten. Im Datensatz gibt es kein Label, das sich auf eine Nutzerkategorie bezieht.
Angenommen, Sie haben einen Datensatz zur Energienutzung für Haushalte mit den folgenden Spalten:
Welche Art von ML würden Sie verwenden, um die pro Jahr verbrauchten Kilowattstunden für ein neu gebautes Haus vorherzusagen?
Überwachtes Lernen
Beim überwachten Lernen werden mit Labels versehene Beispiele verwendet. In diesem Datensatz wäre „verbrauchte Kilowattstunden pro Jahr“ das Label, da dies der Wert ist, den das Modell vorhersagen soll. Die Features wären „Quadratmeter“, „Standort“ und „Baujahr“.
Unüberwachtes Lernen
Beim unüberwachten Lernen werden keine Labels verwendet. In diesem Beispiel wäre „verbrauchte Kilowattstunden pro Jahr“ das Label, da dies der Wert ist, den das Modell vorhersagen soll.
Angenommen, Sie haben einen Flugdatensatz mit den folgenden Spalten:
Wenn Sie die Kosten für ein Flugticket vorhersagen möchten, würden Sie Regression oder Klassifizierung verwenden?
Regression
Die Ausgabe eines Regressionsmodells ist ein numerischer Wert.
Klassifizierung
Die Ausgabe eines Klassifizierungsmodells ist ein diskreter Wert, in der Regel ein Wort. In diesem Fall ist der Preis für ein Flugticket ein numerischer Wert.
Könnten Sie anhand des Datensatzes ein Klassifizierungsmodell trainieren, um die Kosten eines Flugtickets als „hoch“, „durchschnittlich“ oder „niedrig“ zu klassifizieren?
Ja, aber wir müssen zuerst die numerischen Werte in der Spalte airplane_ticket_cost
in kategorische Werte umwandeln.
Es ist möglich, aus dem Datensatz ein Klassifizierungsmodell zu erstellen. Das könnte dann folgendermaßen aussehen:
- Ermitteln Sie die durchschnittlichen Kosten für ein Ticket vom Abflughafen zum Zielflughafen.
- Legen Sie die Grenzwerte für „hoch“, „durchschnittlich“ und „niedrig“ fest.
- Vergleicht die prognostizierten Kosten mit den Grenzwerten und gibt die Kategorie aus, in die der Wert fällt.
Nein. Es ist nicht möglich, ein Klassifizierungsmodell zu erstellen. Die airplane_ticket_cost
-Werte sind numerisch, nicht kategorisch.
Mit ein wenig Arbeit könnten Sie ein Klassifizierungsmodell erstellen.
Nein. Klassifizierungsmodelle prognostizieren nur zwei Kategorien, z. B. spam
oder not_spam
. Dieses Modell muss drei Kategorien vorhersagen.
Klassifizierungsmodelle können mehrere Kategorien vorhersagen. Sie werden als Klassifizierungsmodelle mit mehreren Klassen bezeichnet.
Training und Bewertung
Nachdem wir ein Modell trainiert haben, bewerten wir es mit einem Dataset mit gekennzeichneten Beispielen und vergleichen den vorhergesagten Wert des Modells mit dem tatsächlichen Wert des Labels.
Wählen Sie die beiden besten Antworten für die Frage aus.
Was könnten Sie tun, um die Vorhersagen des Modells zu verbessern, wenn sie weit von der Realität entfernt sind?
Trainieren Sie das Modell neu, verwenden Sie dabei aber nur die Features, die Ihrer Meinung nach die größte Vorhersagekraft für das Label haben.
Wenn Sie das Modell mit weniger, aber aussagekräftigeren Features neu trainieren, kann das zu einem Modell mit besseren Vorhersagen führen.
Sie können ein Modell, dessen Vorhersagen weit von der Realität entfernt sind, nicht korrigieren.
Es ist möglich, ein Modell zu korrigieren, dessen Vorhersagen nicht korrekt sind. Die meisten Modelle erfordern mehrere Trainingsrunden, bis sie nützliche Vorhersagen treffen.
Trainieren Sie das Modell mit einem größeren und vielfältigeren Dataset neu.
Mit Modellen, die mit Datasets mit mehr Beispielen und einem breiteren Wertebereich trainiert wurden, lassen sich bessere Vorhersagen treffen, da das Modell eine bessere generalisierte Lösung für die Beziehung zwischen den Merkmalen und dem Label hat.
Probieren Sie einen anderen Trainingsansatz aus. Wenn Sie beispielsweise einen überwachten Ansatz verwendet haben, versuchen Sie es mit einem unüberwachten Ansatz.
Ein anderer Trainingsansatz würde nicht zu besseren Vorhersagen führen.
Sie sind jetzt bereit für den nächsten Schritt auf Ihrem Weg zur ML:
People + AI Guidebook Hier finden Sie eine Reihe von Methoden, Best Practices und Beispielen, die von Google-Mitarbeitern, Branchenexperten und akademischen Forschern zur Verwendung von ML präsentiert wurden.
Problembeschreibung Wenn Sie nach einem praxiserprobten Ansatz zum Erstellen von ML-Modellen suchen und dabei häufige Fallstricke vermeiden möchten.
Crashkurs „Maschinelles Lernen“ Wenn Sie bereit sind, mehr über ML zu erfahren, und dabei einen detaillierten und praktischen Ansatz bevorzugen.
Sofern nicht anders angegeben, sind die Inhalte dieser Seite unter der Creative Commons Attribution 4.0 License und Codebeispiele unter der Apache 2.0 License lizenziert. Weitere Informationen finden Sie in den Websiterichtlinien von Google Developers. Java ist eine eingetragene Marke von Oracle und/oder seinen Partnern.
Zuletzt aktualisiert: 2025-07-27 (UTC).
[null,null,["Zuletzt aktualisiert: 2025-07-27 (UTC)."],[[["\u003cp\u003eThis page tests your understanding of core machine learning (ML) concepts through interactive questions.\u003c/p\u003e\n"],["\u003cp\u003eIt covers fundamental ML topics such as predictive power of features, supervised and unsupervised learning, and model training and evaluation.\u003c/p\u003e\n"],["\u003cp\u003eYou'll learn how to choose the right ML approach for different problems and assess the effectiveness of a trained model.\u003c/p\u003e\n"],["\u003cp\u003eLinks to further resources are provided to deepen your understanding of ML and its practical applications.\u003c/p\u003e\n"]]],[],null,["\u003cbr /\u003e\n\nThe following questions help you solidify your understanding of core ML concepts.\n\nPredictive power\n\nSupervised ML models are trained using datasets with labeled examples. The model\nlearns how to predict the label from the features. However, not every feature in\na dataset has predictive power. In some instances, only a few features act as\npredictors of the label. In the dataset below, use price as the label\nand the remaining columns as the features.\n\nWhich three features do you think are likely the greatest predictors for a car's price? \nMake_model, year, miles. \nA car's make/model, year, and miles are likely to be among the strongest predictors for its price. \nColor, height, make_model. \nA car's height and color are not strong predictors for a car's price. \nMiles, gearbox, make_model. \nThe gearbox isn't a main predictor of price. \nTire_size, wheel_base, year. \nTire size and wheel base aren't strong predictors for a car's price.\n\nSupervised and unsupervised learning\n\nBased on the problem, you'll use either a supervised or unsupervised approach.\nFor example, if you know beforehand the value or category you want to predict,\nyou'd use supervised learning. However, if you wanted to learn if your dataset\ncontains any segmentations or groupings of related examples, you'd use\nunsupervised learning.\n\nSuppose you had a dataset of users for an online shopping website, and it contained the following columns:\n\nIf you wanted to understand the types of users that visit the site, would you use supervised or unsupervised learning? \nUnsupervised learning. \nBecause we want the model to cluster groups of related customers, we'd use unsupervised learning. After the model clustered the users, we'd create our own names for each cluster, for example, \"discount seekers,\" \"deal hunters,\" \"surfers,\" \"loyal,\" and \"wanderers.\" \nSupervised learning because I'm trying to predict which class a user belongs to. \nIn supervised learning, the dataset must contain the label you're trying to predict. In the dataset, there is no label that refers to a category of user.\n\nSuppose you had an energy usage dataset for homes with the following columns:\n\nWhat type of ML would you use to predict the kilowatt hours used per year for a newly constructed house? \nSupervised learning. \nSupervised learning trains on labeled examples. In this dataset \"kilowatt hours used per year\" would be the label because this is the value you want the model to predict. The features would be \"square footage,\" \"location,\" and \"year built.\" \nUnsupervised learning. \nUnsupervised learning uses unlabeled examples. In this example, \"kilowatt hours used per year\" would be the label because this is the value you want the model to predict.\n\nSuppose you had a flight dataset with the following columns:\n\nIf you wanted to predict the cost of an airplane ticket, would you use regression or classification? \nRegression \nA regression model's output is a numeric value. \nClassification \nA classification model's output is a discrete value, normally a word. In this case, the cost of an airplane ticket is a numeric value. \nBased on the dataset, could you train a classification model to classify the cost of an airplane ticket as \"high,\" \"average,\" or \"low\"? \nYes, but we'd first need to convert the numeric values in the `airplane_ticket_cost` column to categorical values. \nIt's possible to create a classification model from the dataset. You would do something like the following:\n\n1. Find the average cost of a ticket from the departure airport to the destination airport.\n2. Determine the thresholds that would constitute \"high,\" \"average,\" and \"low\".\n3. Compare the predicted cost to the thresholds and output the category the value falls within. \nNo. It's not possible to create a classification model. The `airplane_ticket_cost` values are numeric not categorical. \nWith a little bit of work, you could create a classification model. \nNo. Classification models only predict two categories, like `spam` or `not_spam`. This model would need to predict three categories. \nClassification models can predict multiple categories. They're called multiclass classification models.\n\nTraining and evaluating\n\nAfter we've trained a model, we evaluate it by using a dataset with labeled examples\nand compare the model's predicted value to the label's actual value.\n\nSelect the two best answers for the question. \nIf the model's predictions are far off, what might you do to make them better? \nRetrain the model, but use only the features you believe have the strongest predictive power for the label. \nRetraining the model with fewer features, but that have more predictive power, can produce a model that makes better predictions. \nYou can't fix a model whose predictions are far off. \nIt's possible to fix a model whose predictions are off. Most models require multiple rounds of training until they make useful predictions. \nRetrain the model using a larger and more diverse dataset. \nModels trained on datasets with more examples and a wider range of values can produce better predictions because the model has a better generalized solution for the relationship between the features and the label. \nTry a different training approach. For example, if you used a supervised approach, try an unsupervised approach. \nA different training approach would not produce better predictions.\n\nYou're now ready to take the next step in your ML journey:\n\n- [People + AI Guidebook](https://pair.withgoogle.com/guidebook/). If you're\n looking for a set of methods, best practices and examples presented by\n Googlers, industry experts, and academic research for using ML.\n\n- [Problem Framing](/machine-learning/problem-framing). If you're looking for\n a field-tested approach for creating ML models and avoiding common pitfalls\n along the way.\n\n- [Machine Learning Crash Course](/machine-learning/crash-course). If you're\n ready for an in-depth and hands-on approach to learning more about ML."]]