หน้านี้ได้รับการแปลโดย Cloud Translation API

ระบบ ML การผลิต: คำถามที่ควรถาม

บทเรียนนี้มุ่งเน้นที่คำถามที่คุณควรถามเกี่ยวกับข้อมูลและโมเดลในระบบเวอร์ชันที่ใช้งานจริง

ฟีเจอร์แต่ละอย่างมีประโยชน์ไหม

คุณควรตรวจสอบโมเดลอย่างต่อเนื่องเพื่อนำฟีเจอร์ที่มีส่วนช่วยน้อยหรือไม่ช่วยเลยต่อความสามารถในการคาดการณ์ของโมเดลออก หากข้อมูลอินพุตสำหรับฟีเจอร์นั้นเปลี่ยนแปลงอย่างฉับพลัน ลักษณะการทํางานของโมเดลก็อาจเปลี่ยนแปลงอย่างฉับพลันด้วยในลักษณะที่ไม่พึงประสงค์

และลองพิจารณาคำถามที่เกี่ยวข้องต่อไปนี้ด้วย

ประโยชน์ของฟีเจอร์นั้นคุ้มค่ากับค่าใช้จ่ายในการรวมหรือไม่

การเพิ่มฟีเจอร์อื่นๆ ลงในโมเดลเป็นสิ่งที่น่าดึงดูดใจเสมอ ตัวอย่างเช่น สมมติว่าคุณพบฟีเจอร์ใหม่ที่การใส่ฟีเจอร์นี้เข้าไปทําให้การคาดการณ์ของโมเดลดีขึ้นเล็กน้อย การคาดการณ์ที่ดีขึ้นเล็กน้อยดูดีกว่าการคาดการณ์ที่แย่ลงเล็กน้อยอย่างแน่นอน แต่ฟีเจอร์เพิ่มเติมก็เพิ่มภาระการดูแลรักษาด้วย

แหล่งข้อมูลของคุณเชื่อถือได้ไหม

คำถามที่ควรถามเกี่ยวกับความน่าเชื่อถือของข้อมูลที่คุณป้อน

สัญญาณจะพร้อมใช้งานเสมอหรือมาจากแหล่งที่มาที่ไม่เชื่อถือได้ เช่น
- สัญญาณมาจากเซิร์ฟเวอร์ที่ขัดข้องเนื่องจากมีภาระงานมากหรือไม่
- สัญญาณมาจากผู้ใช้ที่ลาพักร้อนทุกเดือนสิงหาคมใช่ไหม
ระบบที่คำนวณข้อมูลอินพุตของโมเดลมีการเปลี่ยนแปลงไหม หากใช่ ให้ทำดังนี้
- บ่อยแค่ไหน
- คุณจะทำอย่างไรเมื่อระบบดังกล่าวมีการเปลี่ยนแปลง

ลองสร้างสําเนาข้อมูลที่คุณได้รับจากกระบวนการต้นทางของคุณเอง จากนั้นให้เลื่อนข้อมูลต้นทางไปยังเวอร์ชันถัดไปก็ต่อเมื่อคุณแน่ใจว่าปลอดภัยแล้ว

โมเดลของคุณเป็นส่วนหนึ่งของลูปการตอบกลับหรือไม่

บางครั้งโมเดลอาจส่งผลต่อข้อมูลการฝึกของตนเอง ตัวอย่างเช่น ผลลัพธ์จากโมเดลบางรายการจะกลายเป็นฟีเจอร์อินพุต (โดยตรงหรือโดยอ้อม) ของโมเดลเดียวกันนั้น

บางครั้งโมเดลหนึ่งอาจส่งผลต่อโมเดลอื่น ตัวอย่างเช่น ลองพิจารณา 2 รูปแบบในการคาดการณ์ราคาหุ้น ดังนี้

โมเดล ก ซึ่งเป็นโมเดลการคาดการณ์ที่ไม่ดี
รูปแบบ ข.

เนื่องจากโมเดล ก มีข้อบกพร่อง จึงตัดสินใจซื้อหุ้นในหุ้น ข โดยไม่ได้ตั้งใจ การซื้อเหล่านั้นทำให้ราคาของหุ้น X เพิ่มขึ้น โมเดล ข. ใช้ราคาของหุ้น ก. เป็นฟีเจอร์อินพุต ดังนั้นโมเดล ข. จึงอาจสรุปค่าของหุ้น ก. ผิดพลาดได้ ดังนั้น โมเดล ข จึงสามารถซื้อหรือขายหุ้นของหุ้น X ตามลักษณะการทำงานที่ผิดพลาดของโมเดล ก ในทางกลับกัน ลักษณะการทํางานของโมเดล ข. อาจส่งผลต่อโมเดล ก. ซึ่งอาจทริกเกอร์ความคลั่งไคล้ดอกทิวลิปหรือราคาหุ้นของบริษัท ก. ลดลง

แบบฝึกหัด: ทดสอบความเข้าใจ

โมเดลใดต่อไปนี้ 3 รายการที่อาจมีลูปความคิดเห็น

โมเดลการคาดการณ์การเข้าชมที่คาดการณ์ความแออัดที่ทางออกของทางหลวงใกล้ชายหาดโดยใช้ขนาดฝูงชนที่ชายหาดเป็นหนึ่งในฟีเจอร์

ผู้มาเที่ยวทะเลบางรายมีแนวโน้มที่จะวางแผนการเดินทางตามการคาดการณ์การเข้าชม หากมีผู้คนจำนวนมากที่ชายหาดและคาดว่าการจราจรจะหนาแน่น ผู้คนจํานวนมากอาจเปลี่ยนแผนการเดินทาง ซึ่งอาจทําให้จำนวนผู้มาเที่ยวชายหาดลดลง ส่งผลให้การคาดการณ์การเข้าชมลดลง ซึ่งอาจทําให้จำนวนผู้มาเที่ยวเพิ่มขึ้น และวงจรนี้ก็จะวนซ้ำ

รูปแบบการแนะนำหนังสือซึ่งจะแนะนำนวนิยายที่ผู้ใช้อาจชอบโดยอิงจากความนิยม (เช่น จำนวนครั้งที่มีการซื้อหนังสือ)

การแนะนำหนังสือมีแนวโน้มที่จะกระตุ้นการซื้อ และยอดขายที่เพิ่มขึ้นเหล่านี้จะส่งกลับไปยังโมเดลเป็นอินพุต ซึ่งทำให้ระบบมีแนวโน้มที่จะแนะนำหนังสือเล่มเดิมเหล่านี้ในอนาคต

รูปแบบการจัดอันดับมหาวิทยาลัยที่ประเมินโรงเรียนบางส่วนตามการคัดเลือก โดยพิจารณาจากเปอร์เซ็นต์ของนักเรียนที่สมัครและได้รับคัดเลือก

การจัดอันดับของโมเดลอาจกระตุ้นความสนใจเพิ่มเติมให้กับโรงเรียนที่ได้รับการจัดอันดับสูงสุด ซึ่งจะเพิ่มจำนวนใบสมัครที่ได้รับ หากโรงเรียนเหล่านี้ยังคงรับนักเรียนในจำนวนเดิมต่อไป ความเลือกสรรจะเพิ่มขึ้น (เปอร์เซ็นต์ของนักเรียนที่ได้รับการรับเข้าจะลดลง) ซึ่งจะช่วยเพิ่มอันดับของโรงเรียนเหล่านี้ ซึ่งจะยิ่งทำให้ผู้มีโอกาสเป็นนักเรียนสนใจมากขึ้น และอื่นๆ

โมเดลผลการเลือกตั้งที่คาดการณ์ผู้ชนะในการเลือกตั้งนายกเทศมนตรีโดยการสํารวจผู้ลงคะแนนเสียง 2% หลังจากปิดการสำรวจแล้ว

หากโมเดลไม่เผยแพร่การคาดการณ์จนกว่าจะมีการจัดการเลือกตั้ง การคาดการณ์ของโมเดลจะส่งผลต่อพฤติกรรมของผู้เลือกเสียงไม่ได้

โมเดลมูลค่าที่อยู่อาศัยที่คาดการณ์ราคาบ้านโดยใช้ขนาด (พื้นที่เป็นตารางเมตร) จำนวนห้องนอน และสถานที่ตั้งทางภูมิศาสตร์เป็นฟีเจอร์

บ้านไม่สามารถเปลี่ยนแปลงสถานที่ตั้ง ขนาด หรือจํานวนห้องนอนได้อย่างรวดเร็วเพื่อตอบสนองต่อการคาดการณ์ราคา จึงทําให้ลูปความคิดเห็นไม่เกิดขึ้น อย่างไรก็ตาม อาจมีความสัมพันธ์ระหว่างขนาดและจํานวนห้องนอน (บ้านหลังใหญ่มีแนวโน้มที่จะมีพื้นที่ใช้สอยมากกว่า) ซึ่งอาจต้องแยกกันวิเคราะห์

โมเดลแอตทริบิวต์ใบหน้าที่ตรวจจับว่าบุคคลในรูปภาพยิ้มหรือไม่ ซึ่งได้รับการฝึกเป็นประจำในฐานข้อมูลภาพสต็อกที่อัปเดตโดยอัตโนมัติทุกเดือน

ไม่มีการป้อนกลับในขั้นตอนนี้ เนื่องจากการคาดการณ์ของโมเดลไม่มีผลต่อฐานข้อมูลรูปภาพ อย่างไรก็ตาม เวอร์ชันของข้อมูลอินพุตเป็นข้อกังวลในเรื่องนี้ เนื่องจากอัปเดตรายเดือนเหล่านี้อาจส่งผลต่อโมเดลในลักษณะที่ไม่คาดคิด

การตรวจสอบไปป์ไลน์ (15 นาที)

ทดสอบความรู้ (15 นาที)