La clasificación de texto es un problema fundamental del aprendizaje automático con aplicaciones en varios productos. En esta guía, dividimos el flujo de trabajo de clasificación de texto en varios pasos. Para cada paso, sugerimos un enfoque personalizado basado en las características de tu conjunto de datos específico. En particular, con la proporción entre la cantidad de muestras y la cantidad de palabras por muestra, sugerimos un tipo de modelo que te acerque rápidamente al mejor rendimiento. Los demás pasos se diseñan en función de esta elección. Esperamos que, con esta guía, el código complementario y el diagrama de flujo, puedas aprender, comprender y obtener una primera solución rápida para tu problema de clasificación de texto.
Conclusión
Salvo que se indique lo contrario, el contenido de esta página está sujeto a la licencia Atribución 4.0 de Creative Commons, y los ejemplos de código están sujetos a la licencia Apache 2.0. Para obtener más información, consulta las políticas del sitio de Google Developers. Java es una marca registrada de Oracle o sus afiliados.
Última actualización: 2025-07-27 (UTC)
[null,null,["Última actualización: 2025-07-27 (UTC)"],[[["\u003cp\u003eThis guide provides a structured workflow for text classification, breaking it down into manageable steps tailored to your dataset's characteristics.\u003c/p\u003e\n"],["\u003cp\u003eModel selection is guided by the ratio of samples to words per sample, helping you quickly identify a suitable model for optimal performance.\u003c/p\u003e\n"],["\u003cp\u003eThe guide includes code and a flowchart to facilitate learning, understanding, and implementing a first-cut solution for your text classification problem.\u003c/p\u003e\n"]]],[],null,["Text classification is a fundamental machine learning problem with applications\nacross various products. In this guide, we have broken down the text\nclassification workflow into several steps. For each step, we have suggested a\ncustomized approach based on the characteristics of your specific dataset. In\nparticular, using the ratio of number of samples to the number of words per\nsample, we suggest a model type that gets you closer to the best performance\nquickly. The other steps are engineered around this choice. We hope that\nfollowing the guide, the\n[accompanying code](https://github.com/google/eng-edu/tree/master/ml/guides/text_classification),\nand the\n[flowchart](/machine-learning/guides/text-classification/step-2-5#figure-5)\nwill help you learn, understand, and get a swift first-cut solution to your text\nclassification problem."]]