درک خود را آزمایش کنید
با مجموعهها، منظم بمانید ذخیره و طبقهبندی محتوا براساس اولویتهای شما.
سوالات زیر به شما کمک می کند تا درک خود را از مفاهیم اصلی ML تقویت کنید.
قدرت پیش بینی
مدلهای ML نظارت شده با استفاده از مجموعههای داده با نمونههای برچسبگذاری شده آموزش داده میشوند. مدل یاد می گیرد که چگونه برچسب را از روی ویژگی ها پیش بینی کند. با این حال، هر ویژگی در یک مجموعه داده قدرت پیش بینی ندارد. در برخی موارد، تنها چند ویژگی به عنوان پیشبینیکننده برچسب عمل میکنند. در مجموعه داده زیر، از قیمت به عنوان برچسب و از ستون های باقی مانده به عنوان ویژگی استفاده کنید.

به نظر شما کدام سه ویژگی احتمالاً بهترین پیش بینی کننده برای قیمت خودرو هستند؟
Make_model، سال، مایل.
ساخت/مدل خودرو، سال و مایلها احتمالاً از قویترین پیشبینیکنندهها برای قیمت آن هستند.
رنگ، قد، ساخت_مدل.
ارتفاع و رنگ یک خودرو پیش بینی کننده قوی برای قیمت خودرو نیست.
میل گیربکس make_model.
گیربکس پیش بینی کننده اصلی قیمت نیست.
سایز لاستیک، فاصله محور، سال.
اندازه لاستیک و پایه چرخ ها پیش بینی کننده قوی برای قیمت خودرو نیستند.
یادگیری تحت نظارت و بدون نظارت
بر اساس مشکل، از یک رویکرد نظارت شده یا بدون نظارت استفاده خواهید کرد. برای مثال، اگر از قبل مقدار یا دستهای را که میخواهید پیشبینی کنید، میدانید، از یادگیری نظارت شده استفاده میکنید. با این حال، اگر میخواهید بدانید که آیا مجموعه داده شما حاوی هر گونه بخشبندی یا گروهبندی نمونههای مرتبط است، از یادگیری بدون نظارت استفاده میکنید.
فرض کنید مجموعه داده ای از کاربران برای یک وب سایت خرید آنلاین دارید و شامل ستون های زیر است:

اگر بخواهید انواع کاربرانی که از سایت بازدید می کنند را درک کنید، آیا از یادگیری نظارت شده یا بدون نظارت استفاده می کنید؟
یادگیری بدون نظارت
از آنجایی که میخواهیم مدل گروههایی از مشتریان مرتبط را خوشهبندی کند، از یادگیری بدون نظارت استفاده میکنیم. پس از اینکه مدل کاربران را خوشهبندی کرد، نامهای خود را برای هر خوشه ایجاد میکنیم، بهعنوان مثال، «جویندگان تخفیف»، «شکارچیان معامله»، «موجگردها»، «وفادار» و «سرگردان».
یادگیری تحت نظارت زیرا من سعی می کنم پیش بینی کنم که یک کاربر به کدام کلاس تعلق دارد.
در یادگیری تحت نظارت، مجموعه داده باید حاوی برچسبی باشد که میخواهید پیشبینی کنید. در مجموعه داده، هیچ برچسبی وجود ندارد که به دسته ای از کاربران اشاره کند.
فرض کنید یک مجموعه داده مصرف انرژی برای خانه ها با ستون های زیر دارید:

از چه نوع ML برای پیش بینی کیلووات ساعت مصرف شده در سال برای یک خانه تازه ساخته استفاده می کنید؟
یادگیری تحت نظارت
آموزش های تحت نظارت بر روی نمونه های برچسب گذاری شده. در این مجموعه داده "کیلووات ساعت استفاده شده در سال" برچسب است زیرا این مقداری است که شما می خواهید مدل پیش بینی کند. ویژگیها «فیلم مربع»، «مکان» و «سال ساخت» خواهند بود.
یادگیری بدون نظارت
یادگیری بدون نظارت از نمونه های بدون برچسب استفاده می کند. در این مثال، "کیلووات ساعت مصرف شده در سال" برچسب خواهد بود زیرا این مقداری است که شما می خواهید مدل پیش بینی کند.
فرض کنید یک مجموعه داده پرواز با ستون های زیر دارید:

اگر بخواهید هزینه بلیط هواپیما را پیش بینی کنید، از رگرسیون یا طبقه بندی استفاده می کنید؟
رگرسیون
خروجی یک مدل رگرسیون یک مقدار عددی است.
طبقه بندی
خروجی یک مدل طبقه بندی یک مقدار گسسته است، معمولاً یک کلمه. در این حالت هزینه بلیط هواپیما یک مقدار عددی است.
بر اساس مجموعه داده، آیا می توانید یک مدل طبقه بندی برای طبقه بندی هزینه بلیط هواپیما به عنوان "بالا"، "متوسط" یا "کم" آموزش دهید؟
بله، اما ابتدا باید مقادیر عددی موجود در ستون airplane_ticket_cost
را به مقادیر طبقهای تبدیل کنیم.
امکان ایجاد یک مدل طبقه بندی از مجموعه داده وجود دارد. شما کاری شبیه به زیر انجام می دهید:
- میانگین هزینه بلیط از فرودگاه مبدا تا فرودگاه مقصد را بیابید.
- آستانه هایی را تعیین کنید که «بالا»، «متوسط» و «کم» را تشکیل می دهند.
- هزینه پیشبینیشده را با آستانهها مقایسه کنید و دستهای را که ارزش در آن قرار میگیرد تولید کنید.
خیر. امکان ایجاد مدل طبقه بندی وجود ندارد. airplane_ticket_cost
عددی هستند نه دسته بندی.
با کمی کار، می توانید یک مدل طبقه بندی ایجاد کنید.
خیر. مدلهای طبقهبندی فقط دو دسته را پیشبینی میکنند، مانند spam
یا not_spam
. این مدل نیاز به پیشبینی سه دسته دارد.
مدل های طبقه بندی می توانند چندین دسته را پیش بینی کنند. به آنها مدل های طبقه بندی چند طبقه می گویند.
آموزش و ارزیابی
پس از آموزش یک مدل، آن را با استفاده از یک مجموعه داده با نمونه های برچسب دار ارزیابی می کنیم و مقدار پیش بینی شده مدل را با مقدار واقعی برچسب مقایسه می کنیم.
دو بهترین پاسخ را برای سوال انتخاب کنید.
اگر پیشبینیهای مدل دور از دسترس هستند، برای بهتر کردن آنها چه کاری میتوانید انجام دهید؟
مدل را مجدداً آموزش دهید، اما فقط از ویژگی هایی استفاده کنید که معتقدید قوی ترین قدرت پیش بینی را برای برچسب دارند.
بازآموزی مدل با ویژگی های کمتر، اما دارای قدرت پیش بینی بیشتر، می تواند مدلی تولید کند که پیش بینی های بهتری انجام دهد.
شما نمی توانید مدلی را که پیش بینی هایش دور از ذهن است درست کنید.
اصلاح مدلی که پیشبینیهای آن غیرفعال است، امکانپذیر است. بیشتر مدل ها به چندین دوره آموزشی نیاز دارند تا زمانی که پیش بینی های مفیدی انجام دهند.
مدل را با استفاده از مجموعه داده های بزرگتر و متنوع تر آموزش دهید.
مدلهایی که بر روی مجموعه دادهها با مثالهای بیشتر و طیف وسیعتری از مقادیر آموزش داده شدهاند، میتوانند پیشبینیهای بهتری ایجاد کنند، زیرا مدل راهحل تعمیمیافتهتری برای رابطه بین ویژگیها و برچسب دارد.
یک رویکرد آموزشی متفاوت را امتحان کنید. به عنوان مثال، اگر از یک رویکرد نظارت شده استفاده می کنید، یک رویکرد بدون نظارت را امتحان کنید.
یک رویکرد آموزشی متفاوت، پیشبینیهای بهتری ایجاد نمیکند.
اکنون برای برداشتن گام بعدی در سفر ML خود آماده هستید:
کتاب راهنمای افراد + هوش مصنوعی . اگر به دنبال مجموعهای از روشها، بهترین شیوهها و مثالهای ارائهشده توسط کارمندان Google، کارشناسان صنعت، و تحقیقات دانشگاهی برای استفاده از ML هستید.
قاب بندی مشکل . اگر به دنبال یک روش آزمایش شده در زمینه برای ایجاد مدل های ML و اجتناب از مشکلات رایج در طول مسیر هستید.
دوره تصادف یادگیری ماشین . اگر برای یک رویکرد عمیق و عملی برای یادگیری بیشتر در مورد ML آماده هستید.
جز در مواردی که غیر از این ذکر شده باشد،محتوای این صفحه تحت مجوز Creative Commons Attribution 4.0 License است. نمونه کدها نیز دارای مجوز Apache 2.0 License است. برای اطلاع از جزئیات، به خطمشیهای سایت Google Developers مراجعه کنید. جاوا علامت تجاری ثبتشده Oracle و/یا شرکتهای وابسته به آن است.
تاریخ آخرین بهروزرسانی 2025-07-29 بهوقت ساعت هماهنگ جهانی.
[null,null,["تاریخ آخرین بهروزرسانی 2025-07-29 بهوقت ساعت هماهنگ جهانی."],[[["\u003cp\u003eThis page tests your understanding of core machine learning (ML) concepts through interactive questions.\u003c/p\u003e\n"],["\u003cp\u003eIt covers fundamental ML topics such as predictive power of features, supervised and unsupervised learning, and model training and evaluation.\u003c/p\u003e\n"],["\u003cp\u003eYou'll learn how to choose the right ML approach for different problems and assess the effectiveness of a trained model.\u003c/p\u003e\n"],["\u003cp\u003eLinks to further resources are provided to deepen your understanding of ML and its practical applications.\u003c/p\u003e\n"]]],[],null,["\u003cbr /\u003e\n\nThe following questions help you solidify your understanding of core ML concepts.\n\nPredictive power\n\nSupervised ML models are trained using datasets with labeled examples. The model\nlearns how to predict the label from the features. However, not every feature in\na dataset has predictive power. In some instances, only a few features act as\npredictors of the label. In the dataset below, use price as the label\nand the remaining columns as the features.\n\nWhich three features do you think are likely the greatest predictors for a car's price? \nMake_model, year, miles. \nA car's make/model, year, and miles are likely to be among the strongest predictors for its price. \nColor, height, make_model. \nA car's height and color are not strong predictors for a car's price. \nMiles, gearbox, make_model. \nThe gearbox isn't a main predictor of price. \nTire_size, wheel_base, year. \nTire size and wheel base aren't strong predictors for a car's price.\n\nSupervised and unsupervised learning\n\nBased on the problem, you'll use either a supervised or unsupervised approach.\nFor example, if you know beforehand the value or category you want to predict,\nyou'd use supervised learning. However, if you wanted to learn if your dataset\ncontains any segmentations or groupings of related examples, you'd use\nunsupervised learning.\n\nSuppose you had a dataset of users for an online shopping website, and it contained the following columns:\n\nIf you wanted to understand the types of users that visit the site, would you use supervised or unsupervised learning? \nUnsupervised learning. \nBecause we want the model to cluster groups of related customers, we'd use unsupervised learning. After the model clustered the users, we'd create our own names for each cluster, for example, \"discount seekers,\" \"deal hunters,\" \"surfers,\" \"loyal,\" and \"wanderers.\" \nSupervised learning because I'm trying to predict which class a user belongs to. \nIn supervised learning, the dataset must contain the label you're trying to predict. In the dataset, there is no label that refers to a category of user.\n\nSuppose you had an energy usage dataset for homes with the following columns:\n\nWhat type of ML would you use to predict the kilowatt hours used per year for a newly constructed house? \nSupervised learning. \nSupervised learning trains on labeled examples. In this dataset \"kilowatt hours used per year\" would be the label because this is the value you want the model to predict. The features would be \"square footage,\" \"location,\" and \"year built.\" \nUnsupervised learning. \nUnsupervised learning uses unlabeled examples. In this example, \"kilowatt hours used per year\" would be the label because this is the value you want the model to predict.\n\nSuppose you had a flight dataset with the following columns:\n\nIf you wanted to predict the cost of an airplane ticket, would you use regression or classification? \nRegression \nA regression model's output is a numeric value. \nClassification \nA classification model's output is a discrete value, normally a word. In this case, the cost of an airplane ticket is a numeric value. \nBased on the dataset, could you train a classification model to classify the cost of an airplane ticket as \"high,\" \"average,\" or \"low\"? \nYes, but we'd first need to convert the numeric values in the `airplane_ticket_cost` column to categorical values. \nIt's possible to create a classification model from the dataset. You would do something like the following:\n\n1. Find the average cost of a ticket from the departure airport to the destination airport.\n2. Determine the thresholds that would constitute \"high,\" \"average,\" and \"low\".\n3. Compare the predicted cost to the thresholds and output the category the value falls within. \nNo. It's not possible to create a classification model. The `airplane_ticket_cost` values are numeric not categorical. \nWith a little bit of work, you could create a classification model. \nNo. Classification models only predict two categories, like `spam` or `not_spam`. This model would need to predict three categories. \nClassification models can predict multiple categories. They're called multiclass classification models.\n\nTraining and evaluating\n\nAfter we've trained a model, we evaluate it by using a dataset with labeled examples\nand compare the model's predicted value to the label's actual value.\n\nSelect the two best answers for the question. \nIf the model's predictions are far off, what might you do to make them better? \nRetrain the model, but use only the features you believe have the strongest predictive power for the label. \nRetraining the model with fewer features, but that have more predictive power, can produce a model that makes better predictions. \nYou can't fix a model whose predictions are far off. \nIt's possible to fix a model whose predictions are off. Most models require multiple rounds of training until they make useful predictions. \nRetrain the model using a larger and more diverse dataset. \nModels trained on datasets with more examples and a wider range of values can produce better predictions because the model has a better generalized solution for the relationship between the features and the label. \nTry a different training approach. For example, if you used a supervised approach, try an unsupervised approach. \nA different training approach would not produce better predictions.\n\nYou're now ready to take the next step in your ML journey:\n\n- [People + AI Guidebook](https://pair.withgoogle.com/guidebook/). If you're\n looking for a set of methods, best practices and examples presented by\n Googlers, industry experts, and academic research for using ML.\n\n- [Problem Framing](/machine-learning/problem-framing). If you're looking for\n a field-tested approach for creating ML models and avoiding common pitfalls\n along the way.\n\n- [Machine Learning Crash Course](/machine-learning/crash-course). If you're\n ready for an in-depth and hands-on approach to learning more about ML."]]