Mantenha tudo organizado com as coleções Salve e categorize o conteúdo com base nas suas preferências.
Os algoritmos de classificação de texto são essenciais em vários sistemas de software que processam dados de texto em escala. O software de e-mail usa a classificação de texto para determinar se os e-mails recebidos são enviados para a Caixa de entrada ou filtrados na pasta de spam. Os fóruns de discussão usam a classificação de texto para determinar se os comentários devem ser sinalizados como inadequados.
Veja dois exemplos de classificação de tópicos, categorizando um documento de texto em um de um conjunto predefinido de temas. Em muitos problemas de classificação de tópicos, essa categorização é baseada principalmente em palavras-chave no texto.
Figura 1: a classificação de tópicos é usada para sinalizar e-mails de spam recebidos, que são filtrados em uma pasta de spam.
Outro tipo comum de classificação de texto é a análise de sentimento. O objetivo é identificar a polaridade do conteúdo de texto: o tipo de opinião que ele expressa. Isso pode assumir a forma de uma classificação binária de "Gostei"/"Não gostei" ou um conjunto de opções mais granular, como uma nota de 1 a 5. Exemplos de análise de sentimento incluem a análise de postagens do Twitter para determinar se as pessoas gostaram do filme da Pantera Negra ou extrapolar a opinião do público em geral sobre uma nova marca de calçados Nike nas avaliações do Walmart.
Veja neste guia algumas práticas recomendadas para o aprendizado de máquina importantes para resolver problemas de classificação de texto. Dessa forma, você será capaz de:
O fluxo de trabalho completo de alto nível para resolver problemas de classificação de texto usando machine learning
Como escolher o modelo certo para seu problema de classificação de texto
Como implementar o modelo escolhido usando o TensorFlow.
Fluxo de trabalho de classificação de texto
Confira uma visão geral de alto nível do fluxo de trabalho usado para resolver problemas de machine learning:
[[["Fácil de entender","easyToUnderstand","thumb-up"],["Meu problema foi resolvido","solvedMyProblem","thumb-up"],["Outro","otherUp","thumb-up"]],[["Não contém as informações de que eu preciso","missingTheInformationINeed","thumb-down"],["Muito complicado / etapas demais","tooComplicatedTooManySteps","thumb-down"],["Desatualizado","outOfDate","thumb-down"],["Problema na tradução","translationIssue","thumb-down"],["Problema com as amostras / o código","samplesCodeIssue","thumb-down"],["Outro","otherDown","thumb-down"]],["Última atualização 2022-09-27 UTC."],[[["\u003cp\u003eText classification algorithms are widely used to categorize text data, with applications like spam filtering and content moderation.\u003c/p\u003e\n"],["\u003cp\u003eTopic classification and sentiment analysis are two common types of text classification, focusing on categorizing text into predefined topics and identifying the sentiment expressed, respectively.\u003c/p\u003e\n"],["\u003cp\u003eThis guide provides a comprehensive workflow for solving text classification problems using machine learning, including data gathering, exploration, preparation, model building, training, evaluation, hyperparameter tuning, and deployment.\u003c/p\u003e\n"],["\u003cp\u003eChoosing the right machine learning model is crucial for effective text classification and is discussed in detail within the guide.\u003c/p\u003e\n"],["\u003cp\u003eTensorFlow is used to implement the chosen model for practical application in text classification tasks.\u003c/p\u003e\n"]]],[],null,["# Introduction\n\nText classification algorithms are at the heart of a variety of software\nsystems that process text data at scale. Email software uses text classification\nto determine whether incoming mail is sent to the inbox or filtered into the\nspam folder. Discussion forums use text classification to determine whether\ncomments should be flagged as inappropriate.\n\nThese are two examples of topic classification, categorizing a text document\ninto one of a predefined set of topics. In many topic classification problems,\nthis categorization is based primarily on keywords in the text.\n\n**Figure 1: Topic classification is used to flag incoming spam emails, which\nare filtered into a spam folder.**\n\nAnother common type of text classification is ***sentiment analysis***, whose\ngoal is to identify the polarity of text content: the type of opinion it\nexpresses. This can take the form of a binary like/dislike rating, or a more\ngranular set of options, such as a star rating from 1 to 5. Examples of\nsentiment analysis include analyzing Twitter posts to determine if people\nliked the Black Panther movie, or extrapolating the general public's opinion\nof a new brand of Nike shoes from Walmart reviews.\n\nThis guide will teach you some key machine learning best practices for solving\ntext classification problems. Here's what you'll learn:\n\n- The high-level, end-to-end workflow for solving text classification problems using machine learning\n- How to choose the right model for your text classification problem\n- How to implement your model of choice using TensorFlow\n\nText Classification Workflow\n----------------------------\n\nHere's a high-level overview of the workflow used to solve machine learning problems:\n\n- [Step 1: Gather Data](/machine-learning/guides/text-classification/step-1)\n- [Step 2: Explore Your Data](/machine-learning/guides/text-classification/step-2)\n- *[Step 2.5: Choose a Model\\*](/machine-learning/guides/text-classification/step-2-5)*\n- [Step 3: Prepare Your Data](/machine-learning/guides/text-classification/step-3)\n- [Step 4: Build, Train, and Evaluate Your Model](/machine-learning/guides/text-classification/step-4)\n- [Step 5: Tune Hyperparameters](/machine-learning/guides/text-classification/step-5)\n- [Step 6: Deploy Your Model](/machine-learning/guides/text-classification/step-6)\n\n**Figure 2: Workflow for solving machine learning problems**\n| \"Choose a model\" is not a formal step of the traditional machine learning workflow; however, selecting an appropriate model for your problem is a critical task that clarifies and simplifies the work in the steps that follow.\n\nThe following sections explain each step in detail, and how to implement them for text data."]]