ขีดจำกัดอัตรา

การจำกัดอัตราจะควบคุมจำนวนคำขอที่คุณส่งไปยัง Gemini API ภายในกรอบเวลาที่กำหนด ขีดจำกัดเหล่านี้ช่วยรักษาการใช้งานที่เป็นธรรม ป้องกันการละเมิด และช่วยรักษาประสิทธิภาพของระบบสำหรับผู้ใช้ทุกคน

วิธีการทำงานของขีดจำกัดอัตรา

โดยปกติแล้ว ระบบจะวัดขีดจำกัดอัตราใน 3 มิติ ดังนี้

  • คำขอต่อนาที (RPM)
  • โทเค็นต่อนาที (อินพุต) (TPM)
  • คำขอต่อวัน (RPD)

ระบบจะประเมินการใช้งานของคุณเทียบกับขีดจํากัดแต่ละรายการ และการใช้งานเกินขีดจํากัดใดก็ตามจะ ทําให้เกิดข้อผิดพลาดเกี่ยวกับอัตราการจำกัด เช่น หากขีดจำกัด RPM ของคุณคือ 20 การส่งคำขอ 21 รายการภายใน 1 นาทีจะทำให้เกิดข้อผิดพลาด แม้ว่าคุณจะยังไม่เกินขีดจำกัด TPM หรือขีดจำกัดอื่นๆ ก็ตาม

ระบบจะใช้การจำกัดอัตราต่อโปรเจ็กต์ ไม่ใช่ต่อคีย์ API

โควต้าคำขอต่อวัน (RPD) จะรีเซ็ตตอนเที่ยงคืนตามเวลาแปซิฟิก

ขีดจำกัดจะแตกต่างกันไปขึ้นอยู่กับโมเดลที่ใช้ และขีดจำกัดบางอย่างจะใช้ได้กับโมเดลที่เฉพาะเจาะจงเท่านั้น ตัวอย่างเช่น ระบบจะคำนวณรูปภาพต่อนาที (IPM) สำหรับโมเดลที่สร้างรูปภาพได้ (Imagen 3) เท่านั้น แต่ในเชิงแนวคิดแล้วจะคล้ายกับ TPM โมเดลอื่นๆ อาจมีขีดจำกัดโทเค็นต่อวัน (TPD)

โมเดลทดลองและโมเดลเวอร์ชันตัวอย่างจะมีขีดจำกัดอัตราที่เข้มงวดกว่า

ระดับการใช้งาน

โควต้าจะเชื่อมโยงกับระดับการใช้งานของโปรเจ็กต์ เมื่อการใช้งาน API และค่าใช้จ่ายเพิ่มขึ้น คุณจะมีตัวเลือกในการอัปเกรดเป็นระดับที่สูงขึ้นพร้อมขีดจำกัดอัตราที่เพิ่มขึ้น

การมีสิทธิ์สำหรับระดับที่ 2 และ 3 จะพิจารณาจากค่าใช้จ่ายสะสมทั้งหมด ในบริการของ Google Cloud (รวมถึงแต่ไม่จำกัดเพียง Gemini API) สำหรับ บัญชีการเรียกเก็บเงินที่ลิงก์กับโปรเจ็กต์ของคุณ

ระดับ คุณสมบัติ
ฟรี ผู้ใช้ในประเทศที่มีสิทธิ์
ระดับ 1 บัญชีสำหรับการเรียกเก็บเงินที่ลิงก์กับโปรเจ็กต์
ระดับ 2 การใช้จ่ายทั้งหมด: มากกว่า $250 และอย่างน้อย 30 วันนับตั้งแต่การชำระเงินสำเร็จ
ระดับ 3 การใช้จ่ายทั้งหมด: มากกว่า $1,000 และอย่างน้อย 30 วันนับตั้งแต่การชำระเงินสำเร็จ

เมื่อคุณขออัปเกรด ระบบป้องกันการละเมิดอัตโนมัติของเราจะทำการตรวจสอบเพิ่มเติม แม้ว่าการมีคุณสมบัติตรงตามเกณฑ์การมีสิทธิ์ที่ระบุไว้โดยทั่วไปจะเพียงพอต่อการอนุมัติ แต่ในบางกรณีที่พบได้ไม่บ่อยนัก คำขออัปเกรดอาจถูกปฏิเสธโดยอิงตามปัจจัยอื่นๆ ที่พบในกระบวนการตรวจสอบ

ระบบนี้ช่วยรักษาความปลอดภัยและความสมบูรณ์ของแพลตฟอร์ม Gemini API สำหรับผู้ใช้ทุกคน

ขีดจำกัดอัตรา API มาตรฐาน

ตารางต่อไปนี้แสดงขีดจํากัดอัตราสําหรับการเรียก Gemini API มาตรฐานทั้งหมด

รุ่นฟรี

รุ่น RPM TPM RPD
โมเดลข้อความออก
Gemini 2.5 Pro 5 250,000 100
Gemini 2.5 Flash 10 250,000 250
Gemini 2.5 Flash-Lite 15 250,000 1,000
Gemini 2.0 Flash 15 1,000,000 200
Gemini 2.0 Flash-Lite 30 1,000,000 200
Live API
Gemini 2.5 Flash Live 3 เซสชัน 1,000,000 *
กล่องโต้ตอบเสียงดั้งเดิมของ Gemini 2.5 Flash (เวอร์ชันตัวอย่าง) 1 ครั้ง 25,000 5
กล่องโต้ตอบการคิดด้วยเสียงแบบเนทีฟของ Gemini 2.5 Flash Experimental 1 ครั้ง 10,000 5
Gemini 2.0 Flash Live 3 เซสชัน 1,000,000 *
โมเดลการสร้างแบบหลายโมดัล
TTS ของ Gemini 2.5 Flash (เวอร์ชันตัวอย่าง) 3 10,000 15
การสร้างรูปภาพด้วย Gemini 2.0 Flash (เวอร์ชันตัวอย่าง) 10 200,000 100
รุ่นอื่นๆ
Gemma 3 และ 3n 30 15,000 14,400
การฝัง Gemini 100 30,000 1,000
โมเดลที่เลิกใช้งาน
Gemini 1.5 Flash (เลิกใช้งานแล้ว) 15 250,000 50
Gemini 1.5 Flash-8B (เลิกใช้งานแล้ว) 15 250,000 50

ระดับ 1

รุ่น RPM TPM RPD โทเค็นที่จัดคิวแบบกลุ่ม
โมเดลข้อความออก
Gemini 2.5 Pro 150 2,000,000 10,000 5,000,000
Gemini 2.5 Flash 1,000 1,000,000 10,000 3,000,000
Gemini 2.5 Flash-Lite 4,000 4,000,000 * 10,000,000
Gemini 2.0 Flash 2,000 4,000,000 * 10,000,000
Gemini 2.0 Flash-Lite 4,000 4,000,000 * 10,000,000
Live API
Gemini 2.5 Flash Live 50 เซสชัน 4,000,000 * *
กล่องโต้ตอบเสียงดั้งเดิมของ Gemini 2.5 Flash (เวอร์ชันตัวอย่าง) 3 เซสชัน 50,000 50 *
กล่องโต้ตอบการคิดด้วยเสียงแบบเนทีฟของ Gemini 2.5 Flash Experimental 1 ครั้ง 25,000 50 *
Gemini 2.0 Flash Live 50 เซสชัน 4,000,000 * *
โมเดลการสร้างแบบหลายโมดัล
TTS ของ Gemini 2.5 Flash (เวอร์ชันตัวอย่าง) 10 10,000 100 *
TTS ของ Gemini 2.5 Pro (เวอร์ชันตัวอย่าง) 10 10,000 50 *
การสร้างรูปภาพด้วย Gemini 2.0 Flash (เวอร์ชันตัวอย่าง) 1,000 1,000,000 10,000 *
Imagen 4 Standard/Fast 10 * 70 *
Imagen 4 Ultra 5 * 30 *
Imagen 3 20 * * *
Veo 3 2 * 10 *
Veo 3 Fast 2 * 10 *
Veo 2 2 * 50 *
รุ่นอื่นๆ
Gemma 3 และ 3n 30 15,000 14,400 *
การฝัง Gemini 3,000 1,000,000 * *
โมเดลที่เลิกใช้งาน
Gemini 1.5 Flash (เลิกใช้งานแล้ว) 2,000 4,000,000 * *
Gemini 1.5 Flash-8B (เลิกใช้งานแล้ว) 4,000 4,000,000 * *
Gemini 1.5 Pro (เลิกใช้งานแล้ว) 1,000 4,000,000 * *

ระดับ 2

รุ่น RPM TPM RPD โทเค็นที่จัดคิวแบบกลุ่ม
โมเดลข้อความออก
Gemini 2.5 Pro 1,000 5,000,000 50,000 500,000,000
Gemini 2.5 Flash 2,000 3,000,000 100,000 400,000,000
Gemini 2.5 Flash-Lite 10,000 10,000,000 * 500,000,000
Gemini 2.0 Flash 10,000 10,000,000 * 1,000,000,000
Gemini 2.0 Flash-Lite 20,000 10,000,000 * 1,000,000,000
Live API
Gemini 2.5 Flash Live 1,000 เซสชัน 10,000,000 * *
กล่องโต้ตอบเสียงดั้งเดิมของ Gemini 2.5 Flash (เวอร์ชันตัวอย่าง) 100 เซสชัน 1,000,000 * *
กล่องโต้ตอบการคิดด้วยเสียงแบบเนทีฟของ Gemini 2.5 Flash Experimental 1 ครั้ง 25,000 50 *
Gemini 2.0 Flash Live 1,000 เซสชัน 10,000,000 * *
โมเดลการสร้างแบบหลายโมดัล
TTS ของ Gemini 2.5 Flash (เวอร์ชันตัวอย่าง) 1,000 100,000 10,000 *
TTS ของ Gemini 2.5 Pro (เวอร์ชันตัวอย่าง) 100 25,000 1,000 *
การสร้างรูปภาพด้วย Gemini 2.0 Flash (เวอร์ชันตัวอย่าง) 2,000 3,000,000 100,000 *
Imagen 4 Standard/Fast 15 * 1000 *
Imagen 4 Ultra 10 * 400 *
Imagen 3 20 * * *
Veo 3 4 * 50 *
Veo 3 Fast 4 * 50 *
Veo 2 2 * 50 *
รุ่นอื่นๆ
Gemma 3 และ 3n 30 15,000 14,400 *
การฝัง Gemini 5,000 5,000,000 * *
โมเดลที่เลิกใช้งาน
Gemini 1.5 Flash (เลิกใช้งานแล้ว) 2,000 4,000,000 * *
Gemini 1.5 Flash-8B (เลิกใช้งานแล้ว) 4,000 4,000,000 * *
Gemini 1.5 Pro (เลิกใช้งานแล้ว) 1,000 4,000,000 * *

ระดับ 3

รุ่น RPM TPM RPD โทเค็นที่จัดคิวแบบกลุ่ม
โมเดลข้อความออก
Gemini 2.5 Pro 2,000 8,000,000 * 1,000,000,000
Gemini 2.5 Flash 10,000 8,000,000 * 1,000,000,000
Gemini 2.5 Flash-Lite 30,000 30,000,000 * 1,000,000,000
Gemini 2.0 Flash 30,000 30,000,000 * 5,000,000,000
Gemini 2.0 Flash-Lite 30,000 30,000,000 * 5,000,000,000
Live API
Gemini 2.5 Flash Live 1,000 เซสชัน 10,000,000 * *
กล่องโต้ตอบเสียงดั้งเดิมของ Gemini 2.5 Flash (เวอร์ชันตัวอย่าง) 100 เซสชัน 1,000,000 * *
กล่องโต้ตอบการคิดด้วยเสียงแบบเนทีฟของ Gemini 2.5 Flash Experimental 1 ครั้ง 25,000 50 *
Gemini 2.0 Flash Live 1,000 เซสชัน 10,000,000 * *
โมเดลการสร้างแบบหลายโมดัล
TTS ของ Gemini 2.5 Flash (เวอร์ชันตัวอย่าง) 1,000 1,000,000 * *
TTS ของ Gemini 2.5 Pro (เวอร์ชันตัวอย่าง) 100 1,000,000 * *
การสร้างรูปภาพด้วย Gemini 2.0 Flash (เวอร์ชันตัวอย่าง) 5,000 5,000,000 * *
Imagen 4 Standard/Fast 20 * 15,000 *
Imagen 4 Ultra 15 * 5,000 *
Imagen 3 20 * * *
Veo 3 10 * 500 *
Veo 3 Fast 10 * 500 *
Veo 2 2 * 50 *
รุ่นอื่นๆ
Gemma 3 และ 3n 30 15,000 14,400 *
การฝัง Gemini 10,000 10,000,000 * *
โมเดลที่เลิกใช้งาน
Gemini 1.5 Flash (เลิกใช้งานแล้ว) 2,000 4,000,000 * *
Gemini 1.5 Flash-8B (เลิกใช้งานแล้ว) 4,000 4,000,000 * *
Gemini 1.5 Pro (เลิกใช้งานแล้ว) 1,000 4,000,000 * *

ระบบไม่รับประกันขีดจำกัดอัตราที่ระบุ และความจุจริงอาจแตกต่างกันไป

ขีดจำกัดอัตราคำขอในโหมดเป็นกลุ่ม

คำขอโหมดกลุ่มจะขึ้นอยู่กับขีดจำกัดอัตราของตัวเอง ซึ่งแยกจากการเรียก API ในโหมดที่ไม่ใช่กลุ่ม

  • คำขอแบบกลุ่มพร้อมกัน: 100
  • ขีดจำกัดขนาดไฟล์อินพุต: 2 GB
  • ขีดจำกัดพื้นที่เก็บไฟล์: 20 GB
  • โทเค็นที่จัดคิวต่อโมเดล: คอลัมน์โทเค็นที่จัดคิวแบบกลุ่มใน ตารางโควต้าจะแสดงจำนวนโทเค็นสูงสุดที่จัดคิวได้ สำหรับการประมวลผลแบบกลุ่มในงานแบบกลุ่มที่ใช้งานอยู่ทั้งหมดสำหรับโมเดลที่กำหนด ดูได้ในตารางขีดจำกัดอัตรา API มาตรฐาน

วิธีอัปเกรดเป็นระดับถัดไป

Gemini API ใช้การเรียกเก็บเงินใน Cloud สำหรับบริการเรียกเก็บเงินทั้งหมด หากต้องการเปลี่ยนจาก ระดับฟรีเป็นระดับแบบชำระเงิน คุณต้องเปิดใช้การเรียกเก็บเงินในระบบคลาวด์สำหรับโปรเจ็กต์ Google Cloud ก่อน

เมื่อโปรเจ็กต์ของคุณเป็นไปตามเกณฑ์ที่ระบุแล้ว โปรเจ็กต์จะมีสิทธิ์ อัปเกรดเป็นระดับถัดไป หากต้องการขออัปเกรด ให้ทำตามขั้นตอนต่อไปนี้

หลังจากตรวจสอบอย่างรวดเร็วแล้ว ระบบจะอัปเกรดโปรเจ็กต์เป็นระดับถัดไป

ขอเพิ่มขีดจำกัดอัตรา

โมเดลแต่ละรูปแบบจะมีขีดจำกัดอัตราที่เชื่อมโยงกัน (คำขอต่อนาที หรือ RPM) ดูรายละเอียดเกี่ยวกับขีดจำกัดอัตราดังกล่าวได้ที่โมเดล Gemini

ขอเพิ่มขีดจำกัดอัตราของระดับแบบชำระเงิน

เราไม่รับประกันว่าจะเพิ่มขีดจำกัดอัตราได้ แต่จะพยายามอย่างเต็มที่ เพื่อตรวจสอบคำขอของคุณ