テキスト分類は、さまざまなプロダクトで応用されている基本的な ML の問題です。このガイドでは、テキスト分類ワークフローを複数のステップに分割しています。各ステップでは、特定のデータセットの特性に基づいてカスタマイズされたアプローチを提案しています。特に、サンプル数とサンプルあたりの単語数の比率を使用して、最適なパフォーマンスにすばやく近づけるモデルタイプを提案します。他の手順はこの選択に基づいて設計されています。このガイド、付属のコード、フローチャートに沿って進めることで、テキスト分類の問題について学び、理解し、迅速に最初の解決策を得られることを願っています。
まとめ
特に記載のない限り、このページのコンテンツはクリエイティブ・コモンズの表示 4.0 ライセンスにより使用許諾されます。コードサンプルは Apache 2.0 ライセンスにより使用許諾されます。詳しくは、Google Developers サイトのポリシーをご覧ください。Java は Oracle および関連会社の登録商標です。
最終更新日 2025-07-27 UTC。
[null,null,["最終更新日 2025-07-27 UTC。"],[[["\u003cp\u003eThis guide provides a structured workflow for text classification, breaking it down into manageable steps tailored to your dataset's characteristics.\u003c/p\u003e\n"],["\u003cp\u003eModel selection is guided by the ratio of samples to words per sample, helping you quickly identify a suitable model for optimal performance.\u003c/p\u003e\n"],["\u003cp\u003eThe guide includes code and a flowchart to facilitate learning, understanding, and implementing a first-cut solution for your text classification problem.\u003c/p\u003e\n"]]],[],null,["# Conclusion\n\nText classification is a fundamental machine learning problem with applications\nacross various products. In this guide, we have broken down the text\nclassification workflow into several steps. For each step, we have suggested a\ncustomized approach based on the characteristics of your specific dataset. In\nparticular, using the ratio of number of samples to the number of words per\nsample, we suggest a model type that gets you closer to the best performance\nquickly. The other steps are engineered around this choice. We hope that\nfollowing the guide, the\n[accompanying code](https://github.com/google/eng-edu/tree/master/ml/guides/text_classification),\nand the\n[flowchart](/machine-learning/guides/text-classification/step-2-5#figure-5)\nwill help you learn, understand, and get a swift first-cut solution to your text\nclassification problem."]]