頻率限制

頻率限制會控管您在特定時間範圍內可向 Gemini API 發出的要求數量。這些限制有助於維持公平使用原則、防範濫用行為,以及確保所有使用者都能享有良好的系統效能。

速率限制的運作方式

頻率限制通常會從三個面向進行測量:

  • 每分鐘要求數 (RPM)
  • 每分鐘權杖數 (輸入) (TPM)
  • 每日要求數 (RPD)

系統會根據各項限制評估您的用量,如果超過任何限制,就會觸發速率限制錯誤。舉例來說,如果 RPM 上限為 20,即使您未超過 TPM 或其他限制,在一分鐘內提出 21 個要求仍會導致錯誤。

頻率限制適用於專案,而非 API 金鑰。

系統會在太平洋時間午夜重設每日要求數 (RPD) 配額。

限制會因使用的模型而異,部分限制僅適用於特定模型。舉例來說,每分鐘圖像數 (IPM) 只會針對可生成圖像的模型 (Imagen 3) 計算,但概念上與每分鐘權杖數 (TPM) 類似。其他模型可能設有每日符記數上限 (TPD)。

實驗和預先發布版模型的速率限制較嚴格。

用量層級

頻率限制與專案的使用層級相關。隨著 API 使用量和支出增加,您可以選擇升級至較高的級別,享有更高的速率限制。

第 2 級和第 3 級的資格條件,是根據連結至專案的帳單帳戶,在 Google Cloud 服務 (包括但不限於 Gemini API) 的累計總支出而定。

級別 資格條件
免費 適用國家/地區的使用者
級別 1 連結至專案的帳單帳戶
級別 2 總支出:超過 $250 美元,且成功付款至少 30 天
階層 3 總支出:超過 $1,000 美元,且成功付款至少 30 天

要求升級時,系統會執行額外檢查,一般而言,只要符合上述資格條件,升級要求通常就會獲得核准。但少數情況下,審查程序中發現的其他因素可能會導致升級要求遭拒。

這個系統有助於維護 Gemini API 平台安全和完整性,確保所有使用者都能安心使用。

標準 API 頻率限制

下表列出所有標準 Gemini API 呼叫的速率限制。

免費方案

模型 RPM TPM RPD
文字輸出模型
Gemini 2.5 Pro 5 250,000 100
Gemini 2.5 Flash 10 250,000 250
Gemini 2.5 Flash-Lite 15 250,000 1,000
Gemini 2.0 Flash 15 1,000,000 200
Gemini 2.0 Flash-Lite 30 1,000,000 200
Live API
Gemini 2.5 Flash Live 3 個工作階段 1,000,000 *
Gemini 2.5 Flash 預先發布版原生音訊對話方塊 1 次 25,000 5
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog 1 次 10,000 5
Gemini 2.0 Flash Live 3 個工作階段 1,000,000 *
多模態生成模型
Gemini 2.5 Flash 預先發布版 TTS 3 10,000 15
Gemini 2.0 Flash 預覽圖片生成功能 10 200,000 100
其他模型
Gemma 3 和 3n 30 15,000 14,400
Gemini Embedding 100 30,000 1,000
已淘汰的模型
Gemini 1.5 Flash (已淘汰) 15 250,000 50
Gemini 1.5 Flash-8B (已淘汰) 15 250,000 50

級別 1

模型 RPM TPM RPD 批次排隊權杖
文字輸出模型
Gemini 2.5 Pro 150 2,000,000 10,000 5,000,000
Gemini 2.5 Flash 1,000 1,000,000 10,000 3,000,000
Gemini 2.5 Flash-Lite 4,000 4,000,000 * 10,000,000
Gemini 2.0 Flash 2,000 4,000,000 * 10,000,000
Gemini 2.0 Flash-Lite 4,000 4,000,000 * 10,000,000
Live API
Gemini 2.5 Flash Live 50 個工作階段 4,000,000 * *
Gemini 2.5 Flash 預先發布版原生音訊對話方塊 3 個工作階段 50,000 次 50 *
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog 1 次 25,000 50 *
Gemini 2.0 Flash Live 50 個工作階段 4,000,000 * *
多模態生成模型
Gemini 2.5 Flash 預先發布版 TTS 10 10,000 100 *
Gemini 2.5 Pro 預先發布版 TTS 10 10,000 50 *
Gemini 2.5 Flash 預覽圖片生成 500 500,000 2,000 *
Gemini 2.0 Flash 預覽圖片生成功能 1,000 1,000,000 10,000 *
Imagen 4 Standard/Fast 10 * 70 *
Imagen 4 Ultra 5 * 30 *
Imagen 3 20 * * *
Veo 3 2 * 10 *
Veo 3 Fast 2 * 10 *
Veo 2 2 * 50 *
其他模型
Gemma 3 和 3n 30 15,000 14,400 *
Gemini Embedding 3,000 1,000,000 * *
已淘汰的模型
Gemini 1.5 Flash (已淘汰) 2,000 4,000,000 * *
Gemini 1.5 Flash-8B (已淘汰) 4,000 4,000,000 * *
Gemini 1.5 Pro (已淘汰) 1,000 4,000,000 * *

級別 2

模型 RPM TPM RPD 批次排隊權杖
文字輸出模型
Gemini 2.5 Pro 1,000 5,000,000 50,000 次 500,000,000
Gemini 2.5 Flash 2,000 3,000,000 100,000 400,000,000
Gemini 2.5 Flash-Lite 10,000 10,000,000 * 500,000,000
Gemini 2.0 Flash 10,000 10,000,000 * 1,000,000,000
Gemini 2.0 Flash-Lite 20,000 10,000,000 * 1,000,000,000
Live API
Gemini 2.5 Flash Live 1,000 個工作階段 10,000,000 * *
Gemini 2.5 Flash 預先發布版原生音訊對話方塊 100 個工作階段 1,000,000 * *
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog 1 次 25,000 50 *
Gemini 2.0 Flash Live 1,000 個工作階段 10,000,000 * *
多模態生成模型
Gemini 2.5 Flash 預先發布版 TTS 1,000 100,000 10,000 *
Gemini 2.5 Pro 預先發布版 TTS 100 25,000 1,000 *
Gemini 2.5 Flash 預覽圖片生成 2,000 1,500,000 50,000 次 *
Gemini 2.0 Flash 預覽圖片生成功能 2,000 3,000,000 100,000 *
Imagen 4 Standard/Fast 15 * 1000 *
Imagen 4 Ultra 10 * 400 *
Imagen 3 20 * * *
Veo 3 4 * 50 *
Veo 3 Fast 4 * 50 *
Veo 2 2 * 50 *
其他模型
Gemma 3 和 3n 30 15,000 14,400 *
Gemini Embedding 5,000 5,000,000 * *
已淘汰的模型
Gemini 1.5 Flash (已淘汰) 2,000 4,000,000 * *
Gemini 1.5 Flash-8B (已淘汰) 4,000 4,000,000 * *
Gemini 1.5 Pro (已淘汰) 1,000 4,000,000 * *

階層 3

模型 RPM TPM RPD 批次排隊權杖
文字輸出模型
Gemini 2.5 Pro 2,000 8,000,000 * 1,000,000,000
Gemini 2.5 Flash 10,000 8,000,000 * 1,000,000,000
Gemini 2.5 Flash-Lite 30,000 30,000,000 * 1,000,000,000
Gemini 2.0 Flash 30,000 30,000,000 * 5,000,000,000
Gemini 2.0 Flash-Lite 30,000 30,000,000 * 5,000,000,000
Live API
Gemini 2.5 Flash Live 1,000 個工作階段 10,000,000 * *
Gemini 2.5 Flash 預先發布版原生音訊對話方塊 100 個工作階段 1,000,000 * *
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog 1 次 25,000 50 *
Gemini 2.0 Flash Live 1,000 個工作階段 10,000,000 * *
多模態生成模型
Gemini 2.5 Flash 預先發布版 TTS 1,000 1,000,000 * *
Gemini 2.5 Pro 預先發布版 TTS 100 1,000,000 * *
Gemini 2.5 Flash 預覽圖片生成 5,000 5,000,000 * *
Gemini 2.0 Flash 預覽圖片生成功能 5,000 5,000,000 * *
Imagen 4 Standard/Fast 20 * 15,000 *
Imagen 4 Ultra 15 * 5,000 *
Imagen 3 20 * * *
Veo 3 10 * 500 *
Veo 3 Fast 10 * 500 *
Veo 2 2 * 50 *
其他模型
Gemma 3 和 3n 30 15,000 14,400 *
Gemini Embedding 10,000 10,000,000 * *
已淘汰的模型
Gemini 1.5 Flash (已淘汰) 2,000 4,000,000 * *
Gemini 1.5 Flash-8B (已淘汰) 4,000 4,000,000 * *
Gemini 1.5 Pro (已淘汰) 1,000 4,000,000 * *

我們無法保證一定會達到指定的速率限制,實際容量可能有所不同。

批次模式的頻率限制

批次模式要求有自己的速率限制,與非批次模式 API 呼叫不同。

  • 並行批次要求:100 個
  • 輸入檔案大小上限:2 GB
  • 檔案儲存空間上限:20 GB
  • 每個模型排入佇列的權杖數:速率限制表格中的「批次排入佇列的權杖數」欄,列出特定模型所有有效批次工作可排入佇列的權杖數上限,用於批次處理。請參閱標準 API 使用頻率限制表

如何升級至下一個等級

Gemini API 會使用 Cloud Billing 處理所有帳單服務。如要從免費方案改用付費方案,請先為 Google Cloud 專案啟用 Cloud Billing。

專案符合指定條件後,即可升級至下一個級別。如要申請升級,請按照下列步驟操作:

  • 前往 AI Studio 的「API 金鑰」頁面。
  • 找出要升級的專案,然後按一下「升級」。只有符合下一層級資格的專案,才會顯示「升級」選項。

通過快速驗證後,專案就會升級至下一個層級。

要求提高速率限制

每個模型變體都有相關聯的速率限制 (每分鐘要求數,RPM)。如要進一步瞭解這些頻率限制,請參閱「Gemini 模型」一文。

申請提高付費層級的速率限制

我們無法保證會提高速率限制,但會盡力審查您的要求。