Klasyfikacja tekstu to podstawowy problem uczenia maszynowego, który znajduje zastosowanie w różnych usługach. W tym przewodniku podzieliliśmy proces klasyfikacji tekstu na kilka etapów. W przypadku każdego kroku proponujemy dostosowane podejście oparte na charakterystyce Twojego zbioru danych. W szczególności, korzystając z stosunku liczby próbek do liczby słów w próbce, sugerujemy typ modelu, który szybko zbliży Cię do najlepszej wydajności. Pozostałe kroki są dostosowane do tego wyboru. Mamy nadzieję, że dzięki temu przewodnikowi, kodowi towarzyszącemu i schematowi blokowemu szybko poznasz, zrozumiesz i uzyskasz pierwsze rozwiązanie problemu klasyfikacji tekstu.
Podsumowanie
O ile nie stwierdzono inaczej, treść tej strony jest objęta licencją Creative Commons – uznanie autorstwa 4.0, a fragmenty kodu są dostępne na licencji Apache 2.0. Szczegółowe informacje na ten temat zawierają zasady dotyczące witryny Google Developers. Java jest zastrzeżonym znakiem towarowym firmy Oracle i jej podmiotów stowarzyszonych.
Ostatnia aktualizacja: 2025-07-27 UTC.
[null,null,["Ostatnia aktualizacja: 2025-07-27 UTC."],[[["\u003cp\u003eThis guide provides a structured workflow for text classification, breaking it down into manageable steps tailored to your dataset's characteristics.\u003c/p\u003e\n"],["\u003cp\u003eModel selection is guided by the ratio of samples to words per sample, helping you quickly identify a suitable model for optimal performance.\u003c/p\u003e\n"],["\u003cp\u003eThe guide includes code and a flowchart to facilitate learning, understanding, and implementing a first-cut solution for your text classification problem.\u003c/p\u003e\n"]]],[],null,["Text classification is a fundamental machine learning problem with applications\nacross various products. In this guide, we have broken down the text\nclassification workflow into several steps. For each step, we have suggested a\ncustomized approach based on the characteristics of your specific dataset. In\nparticular, using the ratio of number of samples to the number of words per\nsample, we suggest a model type that gets you closer to the best performance\nquickly. The other steps are engineered around this choice. We hope that\nfollowing the guide, the\n[accompanying code](https://github.com/google/eng-edu/tree/master/ml/guides/text_classification),\nand the\n[flowchart](/machine-learning/guides/text-classification/step-2-5#figure-5)\nwill help you learn, understand, and get a swift first-cut solution to your text\nclassification problem."]]