با مجموعهها، منظم بمانید ذخیره و طبقهبندی محتوا براساس اولویتهای شما.
برای خوشه بندی داده های خود، این مراحل را دنبال می کنید:
داده ها را آماده کنید.
معیار تشابه ایجاد کنید
اجرای الگوریتم خوشه بندی
نتایج را تفسیر کنید و خوشه بندی خود را تنظیم کنید.
این صفحه به طور خلاصه مراحل را معرفی می کند. در بخش های بعدی به عمق خواهیم پرداخت.
داده ها را آماده کنید
مانند هر مشکل ML، شما باید قبل از آموزش یا تنظیم دقیق یک مدل بر روی آن داده، داده های ویژگی را عادی، مقیاس و تبدیل کنید. علاوه بر این، قبل از خوشه بندی، بررسی کنید که داده های آماده شده به شما امکان می دهد شباهت بین مثال ها را دقیقا محاسبه کنید.
معیار تشابه ایجاد کنید
قبل از اینکه یک الگوریتم خوشهبندی بتواند دادهها را گروهبندی کند، باید بداند که جفتهای مثال چقدر شبیه هم هستند. میتوانید شباهت بین مثالها را با ایجاد یک متریک شباهت، که مستلزم درک دقیق دادههایتان است، کمی کنید.
اجرای الگوریتم خوشه بندی
یک الگوریتم خوشه بندی از متریک شباهت برای خوشه بندی داده ها استفاده می کند. این دوره از k-means استفاده می کند.
نتایج را تفسیر و تنظیم کنید
از آنجایی که خوشهبندی یک «حقیقت» پایهای را ایجاد نمیکند یا شامل آن نمیشود که بتوانید برونداد را تأیید کنید، مهم است که نتیجه را بر اساس انتظارات خود در سطح خوشه و سطح نمونه بررسی کنید. اگر نتیجه عجیب یا بی کیفیت به نظر می رسد، سه مرحله قبلی را آزمایش کنید. به تکرار ادامه دهید تا کیفیت خروجی نیاز شما را برآورده کند.
تاریخ آخرین بهروزرسانی 2025-02-25 بهوقت ساعت هماهنگ جهانی.
[[["درک آسان","easyToUnderstand","thumb-up"],["مشکلم را برطرف کرد","solvedMyProblem","thumb-up"],["غیره","otherUp","thumb-up"]],[["اطلاعاتی که نیاز دارم وجود ندارد","missingTheInformationINeed","thumb-down"],["بیشازحد پیچیده/ مراحل بسیار زیاد","tooComplicatedTooManySteps","thumb-down"],["قدیمی","outOfDate","thumb-down"],["مشکل ترجمه","translationIssue","thumb-down"],["مشکل کد / نمونهها","samplesCodeIssue","thumb-down"],["غیره","otherDown","thumb-down"]],["تاریخ آخرین بهروزرسانی 2025-02-25 بهوقت ساعت هماهنگ جهانی."],[[["\u003cp\u003eData needs to be prepared through normalization, scaling, and transformation before using it for clustering.\u003c/p\u003e\n"],["\u003cp\u003eA similarity metric is crucial for clustering algorithms as it quantifies how similar data points are to each other.\u003c/p\u003e\n"],["\u003cp\u003eThe k-means algorithm is employed in this course to group data based on the defined similarity metric.\u003c/p\u003e\n"],["\u003cp\u003eEvaluating and adjusting clustering outcomes is an iterative process involving reviewing cluster quality and individual data point assignments.\u003c/p\u003e\n"]]],[],null,["\u003cbr /\u003e\n\nTo cluster your data, you'll follow these steps:\n\n1. Prepare data.\n2. Create similarity metric.\n3. Run clustering algorithm.\n4. Interpret results and adjust your clustering.\n\nThis page briefly introduces the steps. We'll go into depth in subsequent\nsections.\n\nPrepare data\n\nAs with any ML problem, you must normalize, scale, and transform feature data\nbefore training or fine-tuning a model on that data. In addition, before\nclustering, check that the prepared data lets you accurately calculate\nsimilarity between examples.\n| **Review:** For a review of data transformation, see [Working with numerical data](/machine-learning/crash-course/numerical-data) from Machine Learning Crash Course.\n\nCreate similarity metric\n\nBefore a clustering algorithm can group data, it needs to know how similar\npairs of examples are. You can quantify the similarity between examples by\ncreating a similarity metric, which requires a careful understanding of your\ndata.\n\nRun clustering algorithm\n\nA clustering algorithm uses the similarity metric to cluster data.\nThis course uses k-means.\n\nInterpret results and adjust\n\nBecause clustering doesn't produce or include a ground \"truth\" against which you\ncan verify the output, it's important to check the result against your\nexpectations at both the cluster level and the example level. If the result\nlooks odd or low-quality, experiment with the previous three steps. Continue\niterating until the quality of the output meets your needs."]]