ขีดจำกัดอัตรา

การจำกัดอัตราจะควบคุมจำนวนคำขอที่คุณส่งไปยัง Gemini API ภายในกรอบเวลาที่กำหนด ขีดจำกัดเหล่านี้ช่วยรักษาการใช้งานที่เป็นธรรม ป้องกันการละเมิด และช่วยรักษาประสิทธิภาพของระบบสำหรับผู้ใช้ทุกคน

วิธีการทำงานของขีดจำกัดอัตรา

โดยปกติแล้ว ระบบจะวัดขีดจำกัดอัตราใน 3 มิติ ดังนี้

คำขอต่อนาที (RPM)
โทเค็นต่อนาที (อินพุต) (TPM)
คำขอต่อวัน (RPD)

ระบบจะประเมินการใช้งานของคุณเทียบกับขีดจํากัดแต่ละรายการ และการใช้งานเกินขีดจํากัดใดก็ตามจะ ทําให้เกิดข้อผิดพลาดเกี่ยวกับอัตราการจำกัด เช่น หากขีดจำกัด RPM ของคุณคือ 20 การส่งคำขอ 21 รายการภายใน 1 นาทีจะทำให้เกิดข้อผิดพลาด แม้ว่าคุณจะยังไม่เกินขีดจำกัด TPM หรือขีดจำกัดอื่นๆ ก็ตาม

ระบบจะใช้การจำกัดอัตราต่อโปรเจ็กต์ ไม่ใช่ต่อคีย์ API

โควต้าคำขอต่อวัน (RPD) จะรีเซ็ตตอนเที่ยงคืนตามเวลาแปซิฟิก

ขีดจำกัดจะแตกต่างกันไปขึ้นอยู่กับโมเดลที่ใช้ และขีดจำกัดบางอย่างจะใช้ได้กับโมเดลที่เฉพาะเจาะจงเท่านั้น ตัวอย่างเช่น ระบบจะคำนวณรูปภาพต่อนาที (IPM) สำหรับโมเดลที่สร้างรูปภาพได้ (Imagen 3) เท่านั้น แต่ในเชิงแนวคิดแล้วจะคล้ายกับ TPM โมเดลอื่นๆ อาจมีขีดจำกัดโทเค็นต่อวัน (TPD)

โมเดลทดลองและโมเดลเวอร์ชันตัวอย่างจะมีขีดจำกัดอัตราที่เข้มงวดกว่า

ระดับการใช้งาน

โควต้าจะเชื่อมโยงกับระดับการใช้งานของโปรเจ็กต์ เมื่อการใช้งาน API และค่าใช้จ่ายเพิ่มขึ้น คุณจะมีตัวเลือกในการอัปเกรดเป็นระดับที่สูงขึ้นพร้อมขีดจำกัดอัตราที่เพิ่มขึ้น

การมีสิทธิ์สำหรับระดับที่ 2 และ 3 จะพิจารณาจากค่าใช้จ่ายสะสมทั้งหมด ในบริการของ Google Cloud (รวมถึงแต่ไม่จำกัดเพียง Gemini API) สำหรับ บัญชีการเรียกเก็บเงินที่ลิงก์กับโปรเจ็กต์ของคุณ

ระดับ	คุณสมบัติ
ฟรี	ผู้ใช้ในประเทศที่มีสิทธิ์
ระดับ 1	บัญชีสำหรับการเรียกเก็บเงินที่ลิงก์กับโปรเจ็กต์
ระดับ 2	การใช้จ่ายทั้งหมด: มากกว่า $250 และอย่างน้อย 30 วันนับตั้งแต่การชำระเงินสำเร็จ
ระดับ 3	การใช้จ่ายทั้งหมด: มากกว่า $1,000 และอย่างน้อย 30 วันนับตั้งแต่การชำระเงินสำเร็จ

เมื่อคุณขออัปเกรด ระบบป้องกันการละเมิดอัตโนมัติของเราจะทำการตรวจสอบเพิ่มเติม แม้ว่าการมีคุณสมบัติตรงตามเกณฑ์การมีสิทธิ์ที่ระบุไว้โดยทั่วไปจะเพียงพอต่อการอนุมัติ แต่ในบางกรณีที่พบได้ไม่บ่อยนัก คำขออัปเกรดอาจถูกปฏิเสธโดยอิงตามปัจจัยอื่นๆ ที่พบในกระบวนการตรวจสอบ

ระบบนี้ช่วยรักษาความปลอดภัยและความสมบูรณ์ของแพลตฟอร์ม Gemini API สำหรับผู้ใช้ทุกคน

ขีดจำกัดอัตรา API มาตรฐาน

ตารางต่อไปนี้แสดงขีดจํากัดอัตราสําหรับการเรียก Gemini API มาตรฐานทั้งหมด

รุ่นฟรี

รุ่น	RPM	TPM	RPD
โมเดลข้อความออก
Gemini 2.5 Pro	5	250,000	100
Gemini 2.5 Flash	10	250,000	250
Gemini 2.5 Flash-Lite	15	250,000	1,000
Gemini 2.0 Flash	15	1,000,000	200
Gemini 2.0 Flash-Lite	30	1,000,000	200
Live API
Gemini 2.5 Flash Live	3 เซสชัน	1,000,000	*
กล่องโต้ตอบเสียงดั้งเดิมของ Gemini 2.5 Flash (เวอร์ชันตัวอย่าง)	1 ครั้ง	25,000	5
กล่องโต้ตอบการคิดด้วยเสียงแบบเนทีฟของ Gemini 2.5 Flash Experimental	1 ครั้ง	10,000	5
Gemini 2.0 Flash Live	3 เซสชัน	1,000,000	*
โมเดลการสร้างแบบหลายโมดัล
TTS ของ Gemini 2.5 Flash (เวอร์ชันตัวอย่าง)	3	10,000	15
การสร้างรูปภาพด้วย Gemini 2.0 Flash (เวอร์ชันตัวอย่าง)	10	200,000	100
รุ่นอื่นๆ
Gemma 3 และ 3n	30	15,000	14,400
การฝัง Gemini	100	30,000	1,000
โมเดลที่เลิกใช้งาน
Gemini 1.5 Flash (เลิกใช้งานแล้ว)	15	250,000	50
Gemini 1.5 Flash-8B (เลิกใช้งานแล้ว)	15	250,000	50

ระดับ 1

รุ่น	RPM	TPM	RPD	โทเค็นที่จัดคิวแบบกลุ่ม
โมเดลข้อความออก
Gemini 2.5 Pro	150	2,000,000	10,000	5,000,000
Gemini 2.5 Flash	1,000	1,000,000	10,000	3,000,000
Gemini 2.5 Flash-Lite	4,000	4,000,000	*	10,000,000
Gemini 2.0 Flash	2,000	4,000,000	*	10,000,000
Gemini 2.0 Flash-Lite	4,000	4,000,000	*	10,000,000
Live API
Gemini 2.5 Flash Live	50 เซสชัน	4,000,000	*	*
กล่องโต้ตอบเสียงดั้งเดิมของ Gemini 2.5 Flash (เวอร์ชันตัวอย่าง)	3 เซสชัน	50,000	50	*
กล่องโต้ตอบการคิดด้วยเสียงแบบเนทีฟของ Gemini 2.5 Flash Experimental	1 ครั้ง	25,000	50	*
Gemini 2.0 Flash Live	50 เซสชัน	4,000,000	*	*
โมเดลการสร้างแบบหลายโมดัล
TTS ของ Gemini 2.5 Flash (เวอร์ชันตัวอย่าง)	10	10,000	100	*
TTS ของ Gemini 2.5 Pro (เวอร์ชันตัวอย่าง)	10	10,000	50	*
การสร้างรูปภาพด้วย Gemini 2.0 Flash (เวอร์ชันตัวอย่าง)	1,000	1,000,000	10,000	*
Imagen 4 Standard/Fast	10	*	70	*
Imagen 4 Ultra	5	*	30	*
Imagen 3	20	*	*	*
Veo 3	2	*	10	*
Veo 3 Fast	2	*	10	*
Veo 2	2	*	50	*
รุ่นอื่นๆ
Gemma 3 และ 3n	30	15,000	14,400	*
การฝัง Gemini	3,000	1,000,000	*	*
โมเดลที่เลิกใช้งาน
Gemini 1.5 Flash (เลิกใช้งานแล้ว)	2,000	4,000,000	*	*
Gemini 1.5 Flash-8B (เลิกใช้งานแล้ว)	4,000	4,000,000	*	*
Gemini 1.5 Pro (เลิกใช้งานแล้ว)	1,000	4,000,000	*	*

ระดับ 2

รุ่น	RPM	TPM	RPD	โทเค็นที่จัดคิวแบบกลุ่ม
โมเดลข้อความออก
Gemini 2.5 Pro	1,000	5,000,000	50,000	500,000,000
Gemini 2.5 Flash	2,000	3,000,000	100,000	400,000,000
Gemini 2.5 Flash-Lite	10,000	10,000,000	*	500,000,000
Gemini 2.0 Flash	10,000	10,000,000	*	1,000,000,000
Gemini 2.0 Flash-Lite	20,000	10,000,000	*	1,000,000,000
Live API
Gemini 2.5 Flash Live	1,000 เซสชัน	10,000,000	*	*
กล่องโต้ตอบเสียงดั้งเดิมของ Gemini 2.5 Flash (เวอร์ชันตัวอย่าง)	100 เซสชัน	1,000,000	*	*
กล่องโต้ตอบการคิดด้วยเสียงแบบเนทีฟของ Gemini 2.5 Flash Experimental	1 ครั้ง	25,000	50	*
Gemini 2.0 Flash Live	1,000 เซสชัน	10,000,000	*	*
โมเดลการสร้างแบบหลายโมดัล
TTS ของ Gemini 2.5 Flash (เวอร์ชันตัวอย่าง)	1,000	100,000	10,000	*
TTS ของ Gemini 2.5 Pro (เวอร์ชันตัวอย่าง)	100	25,000	1,000	*
การสร้างรูปภาพด้วย Gemini 2.0 Flash (เวอร์ชันตัวอย่าง)	2,000	3,000,000	100,000	*
Imagen 4 Standard/Fast	15	*	1000	*
Imagen 4 Ultra	10	*	400	*
Imagen 3	20	*	*	*
Veo 3	4	*	50	*
Veo 3 Fast	4	*	50	*
Veo 2	2	*	50	*
รุ่นอื่นๆ
Gemma 3 และ 3n	30	15,000	14,400	*
การฝัง Gemini	5,000	5,000,000	*	*
โมเดลที่เลิกใช้งาน
Gemini 1.5 Flash (เลิกใช้งานแล้ว)	2,000	4,000,000	*	*
Gemini 1.5 Flash-8B (เลิกใช้งานแล้ว)	4,000	4,000,000	*	*
Gemini 1.5 Pro (เลิกใช้งานแล้ว)	1,000	4,000,000	*	*

ระดับ 3

รุ่น	RPM	TPM	RPD	โทเค็นที่จัดคิวแบบกลุ่ม
โมเดลข้อความออก
Gemini 2.5 Pro	2,000	8,000,000	*	1,000,000,000
Gemini 2.5 Flash	10,000	8,000,000	*	1,000,000,000
Gemini 2.5 Flash-Lite	30,000	30,000,000	*	1,000,000,000
Gemini 2.0 Flash	30,000	30,000,000	*	5,000,000,000
Gemini 2.0 Flash-Lite	30,000	30,000,000	*	5,000,000,000
Live API
Gemini 2.5 Flash Live	1,000 เซสชัน	10,000,000	*	*
กล่องโต้ตอบเสียงดั้งเดิมของ Gemini 2.5 Flash (เวอร์ชันตัวอย่าง)	100 เซสชัน	1,000,000	*	*
กล่องโต้ตอบการคิดด้วยเสียงแบบเนทีฟของ Gemini 2.5 Flash Experimental	1 ครั้ง	25,000	50	*
Gemini 2.0 Flash Live	1,000 เซสชัน	10,000,000	*	*
โมเดลการสร้างแบบหลายโมดัล
TTS ของ Gemini 2.5 Flash (เวอร์ชันตัวอย่าง)	1,000	1,000,000	*	*
TTS ของ Gemini 2.5 Pro (เวอร์ชันตัวอย่าง)	100	1,000,000	*	*
การสร้างรูปภาพด้วย Gemini 2.0 Flash (เวอร์ชันตัวอย่าง)	5,000	5,000,000	*	*
Imagen 4 Standard/Fast	20	*	15,000	*
Imagen 4 Ultra	15	*	5,000	*
Imagen 3	20	*	*	*
Veo 3	10	*	500	*
Veo 3 Fast	10	*	500	*
Veo 2	2	*	50	*
รุ่นอื่นๆ
Gemma 3 และ 3n	30	15,000	14,400	*
การฝัง Gemini	10,000	10,000,000	*	*
โมเดลที่เลิกใช้งาน
Gemini 1.5 Flash (เลิกใช้งานแล้ว)	2,000	4,000,000	*	*
Gemini 1.5 Flash-8B (เลิกใช้งานแล้ว)	4,000	4,000,000	*	*
Gemini 1.5 Pro (เลิกใช้งานแล้ว)	1,000	4,000,000	*	*

ระบบไม่รับประกันขีดจำกัดอัตราที่ระบุ และความจุจริงอาจแตกต่างกันไป

ขีดจำกัดอัตราคำขอในโหมดเป็นกลุ่ม

คำขอโหมดกลุ่มจะขึ้นอยู่กับขีดจำกัดอัตราของตัวเอง ซึ่งแยกจากการเรียก API ในโหมดที่ไม่ใช่กลุ่ม

คำขอแบบกลุ่มพร้อมกัน: 100
ขีดจำกัดขนาดไฟล์อินพุต: 2 GB
ขีดจำกัดพื้นที่เก็บไฟล์: 20 GB
โทเค็นที่จัดคิวต่อโมเดล: คอลัมน์โทเค็นที่จัดคิวแบบกลุ่มใน ตารางโควต้าจะแสดงจำนวนโทเค็นสูงสุดที่จัดคิวได้ สำหรับการประมวลผลแบบกลุ่มในงานแบบกลุ่มที่ใช้งานอยู่ทั้งหมดสำหรับโมเดลที่กำหนด ดูได้ในตารางขีดจำกัดอัตรา API มาตรฐาน

วิธีอัปเกรดเป็นระดับถัดไป

Gemini API ใช้การเรียกเก็บเงินใน Cloud สำหรับบริการเรียกเก็บเงินทั้งหมด หากต้องการเปลี่ยนจาก ระดับฟรีเป็นระดับแบบชำระเงิน คุณต้องเปิดใช้การเรียกเก็บเงินในระบบคลาวด์สำหรับโปรเจ็กต์ Google Cloud ก่อน

เมื่อโปรเจ็กต์ของคุณเป็นไปตามเกณฑ์ที่ระบุแล้ว โปรเจ็กต์จะมีสิทธิ์ อัปเกรดเป็นระดับถัดไป หากต้องการขออัปเกรด ให้ทำตามขั้นตอนต่อไปนี้

ไปที่หน้าคีย์ API ใน AI Studio
ค้นหาโปรเจ็กต์ที่ต้องการอัปเกรด แล้วคลิก "อัปเกรด" ตัวเลือก "อัปเกรด" จะแสดงเฉพาะโปรเจ็กต์ที่มีคุณสมบัติตรงตามการมีสิทธิ์ในระดับถัดไป

หลังจากตรวจสอบอย่างรวดเร็วแล้ว ระบบจะอัปเกรดโปรเจ็กต์เป็นระดับถัดไป

ขอเพิ่มขีดจำกัดอัตรา

โมเดลแต่ละรูปแบบจะมีขีดจำกัดอัตราที่เชื่อมโยงกัน (คำขอต่อนาที หรือ RPM) ดูรายละเอียดเกี่ยวกับขีดจำกัดอัตราดังกล่าวได้ที่โมเดล Gemini

ขอเพิ่มขีดจำกัดอัตราของระดับแบบชำระเงิน

เราไม่รับประกันว่าจะเพิ่มขีดจำกัดอัตราได้ แต่จะพยายามอย่างเต็มที่ เพื่อตรวจสอบคำขอของคุณ