텍스트 분류 알고리즘은 텍스트 데이터를 대규모로 처리하는 다양한 소프트웨어 시스템의 핵심입니다. 이메일 소프트웨어는 텍스트 분류를 사용하여 수신 메일이 받은편지함으로 전송되는지 스팸 폴더로 필터링되는지 확인합니다. 토론 포럼은 텍스트 분류를 사용하여 부적절한 댓글로 신고해야 하는지 판단합니다.
다음은 텍스트 문서를 사전 정의된 주제 집합 중 하나로 분류하는 주제 분류의 두 가지 예입니다. 많은 주제 분류 문제에서 이 분류는 주로 텍스트의 키워드를 기반으로 합니다.
그림 1: 주제 분류를 사용하면 수신 스팸 이메일을 신고하여 스팸 폴더로 필터링합니다.
또 다른 일반적인 텍스트 분류 유형은 감정 분석으로, 텍스트 콘텐츠의 양극성, 즉 콘텐츠가 표현하는 의견의 유형을 파악하는 것이 목표입니다. 이는 바이너리 좋아요/싫어요 평점 또는 1~5까지의 별표 평점 등 더 세분화된 옵션의 형태를 취할 수 있습니다. 감정 분석의 예로는 트위터 게시물을 분석하여 사람들이 블랙 팬서 영화를 좋아했는지 확인하거나, 월마트 리뷰에서 신제품 Nike 신발에 대한 일반 대중의 의견을 추정한 경우를 들 수 있습니다.
이 가이드에서는 텍스트 분류 문제를 해결하기 위한 몇 가지 주요 머신러닝 권장사항을 설명합니다. 학습할 내용은 다음과 같습니다.
[[["이해하기 쉬움","easyToUnderstand","thumb-up"],["문제가 해결됨","solvedMyProblem","thumb-up"],["기타","otherUp","thumb-up"]],[["필요한 정보가 없음","missingTheInformationINeed","thumb-down"],["너무 복잡함/단계 수가 너무 많음","tooComplicatedTooManySteps","thumb-down"],["오래됨","outOfDate","thumb-down"],["번역 문제","translationIssue","thumb-down"],["샘플/코드 문제","samplesCodeIssue","thumb-down"],["기타","otherDown","thumb-down"]],["최종 업데이트: 2022-09-27(UTC)"],[[["\u003cp\u003eText classification algorithms are widely used to categorize text data, with applications like spam filtering and content moderation.\u003c/p\u003e\n"],["\u003cp\u003eTopic classification and sentiment analysis are two common types of text classification, focusing on categorizing text into predefined topics and identifying the sentiment expressed, respectively.\u003c/p\u003e\n"],["\u003cp\u003eThis guide provides a comprehensive workflow for solving text classification problems using machine learning, including data gathering, exploration, preparation, model building, training, evaluation, hyperparameter tuning, and deployment.\u003c/p\u003e\n"],["\u003cp\u003eChoosing the right machine learning model is crucial for effective text classification and is discussed in detail within the guide.\u003c/p\u003e\n"],["\u003cp\u003eTensorFlow is used to implement the chosen model for practical application in text classification tasks.\u003c/p\u003e\n"]]],[],null,["Text classification algorithms are at the heart of a variety of software\nsystems that process text data at scale. Email software uses text classification\nto determine whether incoming mail is sent to the inbox or filtered into the\nspam folder. Discussion forums use text classification to determine whether\ncomments should be flagged as inappropriate.\n\nThese are two examples of topic classification, categorizing a text document\ninto one of a predefined set of topics. In many topic classification problems,\nthis categorization is based primarily on keywords in the text.\n\n**Figure 1: Topic classification is used to flag incoming spam emails, which\nare filtered into a spam folder.**\n\nAnother common type of text classification is ***sentiment analysis***, whose\ngoal is to identify the polarity of text content: the type of opinion it\nexpresses. This can take the form of a binary like/dislike rating, or a more\ngranular set of options, such as a star rating from 1 to 5. Examples of\nsentiment analysis include analyzing Twitter posts to determine if people\nliked the Black Panther movie, or extrapolating the general public's opinion\nof a new brand of Nike shoes from Walmart reviews.\n\nThis guide will teach you some key machine learning best practices for solving\ntext classification problems. Here's what you'll learn:\n\n- The high-level, end-to-end workflow for solving text classification problems using machine learning\n- How to choose the right model for your text classification problem\n- How to implement your model of choice using TensorFlow\n\nText Classification Workflow\n\nHere's a high-level overview of the workflow used to solve machine learning problems:\n\n- [Step 1: Gather Data](/machine-learning/guides/text-classification/step-1)\n- [Step 2: Explore Your Data](/machine-learning/guides/text-classification/step-2)\n- *[Step 2.5: Choose a Model\\*](/machine-learning/guides/text-classification/step-2-5)*\n- [Step 3: Prepare Your Data](/machine-learning/guides/text-classification/step-3)\n- [Step 4: Build, Train, and Evaluate Your Model](/machine-learning/guides/text-classification/step-4)\n- [Step 5: Tune Hyperparameters](/machine-learning/guides/text-classification/step-5)\n- [Step 6: Deploy Your Model](/machine-learning/guides/text-classification/step-6)\n\n**Figure 2: Workflow for solving machine learning problems**\n| \"Choose a model\" is not a formal step of the traditional machine learning workflow; however, selecting an appropriate model for your problem is a critical task that clarifies and simplifies the work in the steps that follow.\n\nThe following sections explain each step in detail, and how to implement them for text data."]]