Verifica le tue conoscenze
Mantieni tutto organizzato con le raccolte Salva e classifica i contenuti in base alle tue preferenze.
Le seguenti domande ti aiutano a consolidare la tua comprensione dei concetti fondamentali dell'apprendimento automatico.
Efficacia predittiva
I modelli ML supervisionati vengono addestrati utilizzando set di dati con esempi etichettati. Il modello impara a prevedere l'etichetta dalle caratteristiche. Tuttavia, non tutte le funzionalità di un set di dati hanno un potere predittivo. In alcuni casi, solo alcune funzionalità fungono da predittori dell'etichetta. Nel set di dati riportato di seguito, utilizza il prezzo come etichetta e le colonne rimanenti come caratteristiche.
Quali tre caratteristiche ritieni siano probabilmente i migliori indicatori del prezzo di un'auto?
Make_model, year, miles.
La marca/il modello, l'anno e i chilometri di un'auto sono probabilmente tra i fattori di previsione più importanti per il suo prezzo.
Color, height, make_model.
L'altezza e il colore di un'auto non sono fattori di previsione molto affidabili per il prezzo.
Miles, gearbox, make_model.
La trasmissione non è un fattore di previsione principale del prezzo.
Misure_pneumatici, passo, anno.
La misura degli pneumatici e la distanza tra le ruote non sono fattori di previsione affidabili del prezzo di un'auto.
Apprendimento supervisionato e non supervisionato
A seconda del problema, utilizzerai un approccio supervisionato o non supervisionato. Ad esempio, se conosci in anticipo il valore o la categoria che vuoi prevedere, utilizzerai l'apprendimento supervisionato. Tuttavia, se vuoi sapere se il tuo set di dati contiene segmentazioni o raggruppamenti di esempi correlati, devi utilizzare l'apprendimento non supervisionato.
Supponiamo di avere un set di dati di utenti per un sito web di shopping online contenente le seguenti colonne:
Se volessi comprendere i tipi di utenti che visitano il sito, utilizzeresti l'apprendimento supervisionato o non supervisionato?
Apprendimento non supervisionato.
Poiché vogliamo che il modello raggruppi gruppi di clienti correlati, utilizzeremo l'apprendimento non supervisionato. Dopo che il modello ha raggruppato gli utenti, abbiamo creato i nostri nomi per ogni cluster, ad esempio, "cercatori di sconti", "cacciatori di offerte", "surfisti", "clienti fedeli" e "vagabondi".
Apprendimento supervisionato perché sto cercando di prevedere a quale classe appartiene un utente.
Nell'apprendimento supervisionato, il set di dati deve contenere l'etichetta che stai tentando di prevedere. Nel set di dati non è presente un'etichetta che rimandi a una categoria di utenti.
Supponiamo di avere un set di dati sul consumo energetico delle case con le seguenti colonne:
Quale tipo di ML useresti per prevedere i kilowattora utilizzati ogni anno per una casa di nuova costruzione?
Apprendimento supervisionato.
L'apprendimento supervisionato si basa su esempi etichettati. In questo set di dati, "kilowattora utilizzati all'anno" è l'etichetta perché è il valore che vuoi che il modello preveda. Le funzionalità saranno "superficie in metri quadrati", "posizione" e "anno di costruzione".
Apprendimento non supervisionato.
L'apprendimento non supervisionato utilizza esempi non etichettati. In questo esempio, "kilowattora utilizzati all'anno" è l'etichetta perché è il valore che vuoi che il modello preveda.
Supponiamo di avere un set di dati sui voli con le seguenti colonne:
Se volessi prevedere il costo di un biglietto aereo, useresti la regressione o la classificazione?
Regressione
L'output di un modello di regressione è un valore numerico.
Classificazione
L'output di un modello di classificazione è un valore discreto, solitamente una parola. In questo caso, il costo di un biglietto aereo è un valore numerico.
In base al set di dati, puoi addestrare un modello di classificazione per classificare il costo di un biglietto aereo come "alto", "medio" o "basso"?
Sì, ma prima dobbiamo convertire i valori numerici nella colonna airplane_ticket_cost
in valori categorici.
È possibile creare un modello di classificazione dal set di dati. Dovresti eseguire una procedura simile alla seguente:
- Trova il costo medio di un biglietto dall'aeroporto di partenza all'aeroporto di destinazione.
- Determina le soglie che rappresentano "alto", "medio" e "basso".
- Confronta il costo previsto con le soglie e visualizza la categoria in cui rientra il valore.
No. Non è possibile creare un modello di classificazione. I valori airplane_ticket_cost
sono numerici e non categorici.
Con un po' di impegno, puoi creare un modello di classificazione.
No. I modelli di classificazione prevedono solo due categorie, ad esempio spam
o not_spam
. Questo modello dovrebbe prevedere tre categorie.
I modelli di classificazione possono prevedere più categorie. Sono chiamati modelli di classificazione multiclasse.
Addestramento e valutazione
Dopo aver addestrato un modello, lo valutiamo utilizzando un set di dati con esempi etichettati e confrontiamo il valore previsto del modello con il valore effettivo dell'etichetta.
Seleziona le due risposte migliori per la domanda.
Se le previsioni del modello sono molto lontane dalla realtà, cosa puoi fare per migliorarle?
Addestra di nuovo il modello, ma utilizza solo le funzionalità che ritieni abbiano la maggiore capacità predittiva per l'etichetta.
L'addestramento nuovamente del modello con meno funzionalità, ma con una maggiore capacità predittiva, può produrre un modello che fa previsioni migliori.
Non puoi correggere un modello le cui previsioni sono molto lontane.
È possibile correggere un modello le cui previsioni non sono corrette. La maggior parte dei modelli richiede più cicli di addestramento prima di poter fare previsioni utili.
Addestra di nuovo il modello utilizzando un set di dati più grande e diversificato.
I modelli addestrati su set di dati con più esempi e una gamma più ampia di valori possono produrre previsioni migliori perché il modello ha una soluzione generalizzata migliore per la relazione tra le funzionalità e l'etichetta.
Prova un approccio di addestramento diverso. Ad esempio, se hai utilizzato un approccio supervisionato, prova un approccio non supervisionato.
Un approccio di addestramento diverso non produrrebbe previsioni migliori.
Ora puoi fare il passo successivo nel tuo percorso di ML:
People + AI Guidebook. Se stai cercando un insieme di metodi, best practice ed esempi presentati da Googler, esperti del settore e ricercatori accademici per l'utilizzo del machine learning.
Problem Framing. Se stai cercando un approccio testato sul campo per creare modelli ML ed evitare i problemi comuni lungo il percorso.
Machine Learning Crash Course. Se sei pronto per un approccio pratico e approfondito per scoprire di più sul machine learning.
Salvo quando diversamente specificato, i contenuti di questa pagina sono concessi in base alla licenza Creative Commons Attribution 4.0, mentre gli esempi di codice sono concessi in base alla licenza Apache 2.0. Per ulteriori dettagli, consulta le norme del sito di Google Developers. Java è un marchio registrato di Oracle e/o delle sue consociate.
Ultimo aggiornamento 2025-07-27 UTC.
[null,null,["Ultimo aggiornamento 2025-07-27 UTC."],[[["\u003cp\u003eThis page tests your understanding of core machine learning (ML) concepts through interactive questions.\u003c/p\u003e\n"],["\u003cp\u003eIt covers fundamental ML topics such as predictive power of features, supervised and unsupervised learning, and model training and evaluation.\u003c/p\u003e\n"],["\u003cp\u003eYou'll learn how to choose the right ML approach for different problems and assess the effectiveness of a trained model.\u003c/p\u003e\n"],["\u003cp\u003eLinks to further resources are provided to deepen your understanding of ML and its practical applications.\u003c/p\u003e\n"]]],[],null,["# Test Your Understanding\n\n\u003cbr /\u003e\n\nThe following questions help you solidify your understanding of core ML concepts.\n\nPredictive power\n----------------\n\nSupervised ML models are trained using datasets with labeled examples. The model\nlearns how to predict the label from the features. However, not every feature in\na dataset has predictive power. In some instances, only a few features act as\npredictors of the label. In the dataset below, use price as the label\nand the remaining columns as the features.\n\nWhich three features do you think are likely the greatest predictors for a car's price? \nMake_model, year, miles. \nA car's make/model, year, and miles are likely to be among the strongest predictors for its price. \nColor, height, make_model. \nA car's height and color are not strong predictors for a car's price. \nMiles, gearbox, make_model. \nThe gearbox isn't a main predictor of price. \nTire_size, wheel_base, year. \nTire size and wheel base aren't strong predictors for a car's price.\n\nSupervised and unsupervised learning\n------------------------------------\n\nBased on the problem, you'll use either a supervised or unsupervised approach.\nFor example, if you know beforehand the value or category you want to predict,\nyou'd use supervised learning. However, if you wanted to learn if your dataset\ncontains any segmentations or groupings of related examples, you'd use\nunsupervised learning.\n\nSuppose you had a dataset of users for an online shopping website, and it contained the following columns:\n\nIf you wanted to understand the types of users that visit the site, would you use supervised or unsupervised learning? \nUnsupervised learning. \nBecause we want the model to cluster groups of related customers, we'd use unsupervised learning. After the model clustered the users, we'd create our own names for each cluster, for example, \"discount seekers,\" \"deal hunters,\" \"surfers,\" \"loyal,\" and \"wanderers.\" \nSupervised learning because I'm trying to predict which class a user belongs to. \nIn supervised learning, the dataset must contain the label you're trying to predict. In the dataset, there is no label that refers to a category of user.\n\nSuppose you had an energy usage dataset for homes with the following columns:\n\nWhat type of ML would you use to predict the kilowatt hours used per year for a newly constructed house? \nSupervised learning. \nSupervised learning trains on labeled examples. In this dataset \"kilowatt hours used per year\" would be the label because this is the value you want the model to predict. The features would be \"square footage,\" \"location,\" and \"year built.\" \nUnsupervised learning. \nUnsupervised learning uses unlabeled examples. In this example, \"kilowatt hours used per year\" would be the label because this is the value you want the model to predict.\n\nSuppose you had a flight dataset with the following columns:\n\nIf you wanted to predict the cost of an airplane ticket, would you use regression or classification? \nRegression \nA regression model's output is a numeric value. \nClassification \nA classification model's output is a discrete value, normally a word. In this case, the cost of an airplane ticket is a numeric value. \nBased on the dataset, could you train a classification model to classify the cost of an airplane ticket as \"high,\" \"average,\" or \"low\"? \nYes, but we'd first need to convert the numeric values in the `airplane_ticket_cost` column to categorical values. \nIt's possible to create a classification model from the dataset. You would do something like the following:\n\n1. Find the average cost of a ticket from the departure airport to the destination airport.\n2. Determine the thresholds that would constitute \"high,\" \"average,\" and \"low\".\n3. Compare the predicted cost to the thresholds and output the category the value falls within. \nNo. It's not possible to create a classification model. The `airplane_ticket_cost` values are numeric not categorical. \nWith a little bit of work, you could create a classification model. \nNo. Classification models only predict two categories, like `spam` or `not_spam`. This model would need to predict three categories. \nClassification models can predict multiple categories. They're called multiclass classification models.\n\nTraining and evaluating\n-----------------------\n\nAfter we've trained a model, we evaluate it by using a dataset with labeled examples\nand compare the model's predicted value to the label's actual value.\n\nSelect the two best answers for the question. \nIf the model's predictions are far off, what might you do to make them better? \nRetrain the model, but use only the features you believe have the strongest predictive power for the label. \nRetraining the model with fewer features, but that have more predictive power, can produce a model that makes better predictions. \nYou can't fix a model whose predictions are far off. \nIt's possible to fix a model whose predictions are off. Most models require multiple rounds of training until they make useful predictions. \nRetrain the model using a larger and more diverse dataset. \nModels trained on datasets with more examples and a wider range of values can produce better predictions because the model has a better generalized solution for the relationship between the features and the label. \nTry a different training approach. For example, if you used a supervised approach, try an unsupervised approach. \nA different training approach would not produce better predictions.\n\nYou're now ready to take the next step in your ML journey:\n\n- [People + AI Guidebook](https://pair.withgoogle.com/guidebook/). If you're\n looking for a set of methods, best practices and examples presented by\n Googlers, industry experts, and academic research for using ML.\n\n- [Problem Framing](/machine-learning/problem-framing). If you're looking for\n a field-tested approach for creating ML models and avoiding common pitfalls\n along the way.\n\n- [Machine Learning Crash Course](/machine-learning/crash-course). If you're\n ready for an in-depth and hands-on approach to learning more about ML."]]