با مجموعهها، منظم بمانید ذخیره و طبقهبندی محتوا براساس اولویتهای شما.
الگوریتم های طبقه بندی متن در قلب انواع سیستم های نرم افزاری قرار دارند که داده های متنی را در مقیاس پردازش می کنند. نرم افزار ایمیل از طبقه بندی متن برای تعیین اینکه آیا نامه های دریافتی به صندوق ورودی ارسال می شود یا در پوشه هرزنامه فیلتر می شود، استفاده می کند. انجمن های گفتگو از طبقه بندی متن برای تعیین اینکه آیا نظرات باید به عنوان نامناسب پرچم گذاری شوند یا خیر استفاده می کنند.
اینها دو نمونه از طبقهبندی موضوع هستند که یک سند متنی را به یکی از مجموعههای از پیش تعریفشده موضوعات دستهبندی میکنند. در بسیاری از مسائل طبقه بندی موضوع، این دسته بندی عمدتاً بر اساس کلمات کلیدی در متن است.
شکل 1: طبقه بندی موضوع برای پرچم گذاری ایمیل های هرزنامه دریافتی استفاده می شود که در یک پوشه اسپم فیلتر می شوند.
یکی دیگر از انواع رایج طبقه بندی متن، تحلیل احساسات است که هدف آن شناسایی قطبیت محتوای متن است: نوع عقیده ای که بیان می کند. این میتواند به شکل رتبهبندی باینری پسندیدن/نپسندیدن، یا مجموعهای از گزینههای جزئیتر، مانند رتبهبندی ستاره از ۱ تا ۵ باشد. نمونههایی از تحلیل احساسات شامل تجزیه و تحلیل پستهای توییتر برای تعیین اینکه آیا مردم فیلم پلنگ سیاه را دوست داشتهاند یا خیر، باشد. برون یابی نظر عموم مردم در مورد برند جدیدی از کفش های نایک از بررسی های Walmart.
این راهنما چند روش کلیدی یادگیری ماشینی را برای حل مشکلات طبقه بندی متن به شما آموزش می دهد. در اینجا چیزی است که یاد خواهید گرفت:
گردش کار سطح بالا و سرتاسر برای حل مشکلات طبقه بندی متن با استفاده از یادگیری ماشین
نحوه انتخاب مدل مناسب برای مشکل طبقه بندی متن
چگونه با استفاده از TensorFlow مدل مورد نظر خود را پیاده سازی کنید
گردش کار طبقه بندی متن
در اینجا یک نمای کلی در سطح بالا از گردش کار مورد استفاده برای حل مشکلات یادگیری ماشین آمده است:
تاریخ آخرین بهروزرسانی 2024-10-26 بهوقت ساعت هماهنگ جهانی.
[null,null,["تاریخ آخرین بهروزرسانی 2024-10-26 بهوقت ساعت هماهنگ جهانی."],[[["\u003cp\u003eText classification algorithms are widely used to categorize text data, with applications like spam filtering and content moderation.\u003c/p\u003e\n"],["\u003cp\u003eTopic classification and sentiment analysis are two common types of text classification, focusing on categorizing text into predefined topics and identifying the sentiment expressed, respectively.\u003c/p\u003e\n"],["\u003cp\u003eThis guide provides a comprehensive workflow for solving text classification problems using machine learning, including data gathering, exploration, preparation, model building, training, evaluation, hyperparameter tuning, and deployment.\u003c/p\u003e\n"],["\u003cp\u003eChoosing the right machine learning model is crucial for effective text classification and is discussed in detail within the guide.\u003c/p\u003e\n"],["\u003cp\u003eTensorFlow is used to implement the chosen model for practical application in text classification tasks.\u003c/p\u003e\n"]]],[],null,["Text classification algorithms are at the heart of a variety of software\nsystems that process text data at scale. Email software uses text classification\nto determine whether incoming mail is sent to the inbox or filtered into the\nspam folder. Discussion forums use text classification to determine whether\ncomments should be flagged as inappropriate.\n\nThese are two examples of topic classification, categorizing a text document\ninto one of a predefined set of topics. In many topic classification problems,\nthis categorization is based primarily on keywords in the text.\n\n**Figure 1: Topic classification is used to flag incoming spam emails, which\nare filtered into a spam folder.**\n\nAnother common type of text classification is ***sentiment analysis***, whose\ngoal is to identify the polarity of text content: the type of opinion it\nexpresses. This can take the form of a binary like/dislike rating, or a more\ngranular set of options, such as a star rating from 1 to 5. Examples of\nsentiment analysis include analyzing Twitter posts to determine if people\nliked the Black Panther movie, or extrapolating the general public's opinion\nof a new brand of Nike shoes from Walmart reviews.\n\nThis guide will teach you some key machine learning best practices for solving\ntext classification problems. Here's what you'll learn:\n\n- The high-level, end-to-end workflow for solving text classification problems using machine learning\n- How to choose the right model for your text classification problem\n- How to implement your model of choice using TensorFlow\n\nText Classification Workflow\n\nHere's a high-level overview of the workflow used to solve machine learning problems:\n\n- [Step 1: Gather Data](/machine-learning/guides/text-classification/step-1)\n- [Step 2: Explore Your Data](/machine-learning/guides/text-classification/step-2)\n- *[Step 2.5: Choose a Model\\*](/machine-learning/guides/text-classification/step-2-5)*\n- [Step 3: Prepare Your Data](/machine-learning/guides/text-classification/step-3)\n- [Step 4: Build, Train, and Evaluate Your Model](/machine-learning/guides/text-classification/step-4)\n- [Step 5: Tune Hyperparameters](/machine-learning/guides/text-classification/step-5)\n- [Step 6: Deploy Your Model](/machine-learning/guides/text-classification/step-6)\n\n**Figure 2: Workflow for solving machine learning problems**\n| \"Choose a model\" is not a formal step of the traditional machine learning workflow; however, selecting an appropriate model for your problem is a critical task that clarifies and simplifies the work in the steps that follow.\n\nThe following sections explain each step in detail, and how to implement them for text data."]]