การถ่ายโอนการเรียนรู้คืออะไร?

โมเดลการเรียนรู้เชิงลึกที่ซับซ้อนมีพารามิเตอร์ (น้ำหนัก) นับล้าน และการฝึกอบรมตั้งแต่เริ่มต้นมักจะต้องใช้ข้อมูลและทรัพยากรคอมพิวเตอร์จำนวนมาก การถ่ายโอนการเรียนรู้เป็นเทคนิคที่ใช้ทางลัดโดยนำชิ้นส่วนของแบบจำลองที่ได้รับการฝึกอบรมเกี่ยวกับงานที่เกี่ยวข้องแล้วมาใช้ซ้ำในแบบจำลองใหม่

ตัวอย่างเช่น บทช่วยสอนถัดไปในส่วนนี้จะแสดงให้คุณเห็นถึงวิธีสร้างตัวจดจำรูปภาพของคุณเองที่ใช้ประโยชน์จากโมเดลที่ได้รับการฝึกอบรมมาแล้วเพื่อจดจำวัตถุประเภทต่างๆ กว่า 1,000 ชนิดภายในรูปภาพ คุณสามารถปรับความรู้ที่มีอยู่ในโมเดลที่ฝึกไว้ล่วงหน้าเพื่อตรวจหาคลาสภาพของคุณเองโดยใช้ข้อมูลการฝึกน้อยกว่าโมเดลเดิมที่ต้องใช้มาก

สิ่งนี้มีประโยชน์สำหรับการพัฒนาโมเดลใหม่อย่างรวดเร็ว ตลอดจนการปรับแต่งโมเดลในสภาพแวดล้อมที่มีทรัพยากรจำกัด เช่น เบราว์เซอร์และอุปกรณ์พกพา

บ่อยครั้งเมื่อทำการถ่ายโอนการเรียนรู้ เราไม่ได้ปรับน้ำหนักของโมเดลเดิม แต่เราลบเลเยอร์สุดท้ายออกและฝึกโมเดลใหม่ (มักจะค่อนข้างตื้น) ที่ด้านบนของเอาต์พุตของโมเดลที่ถูกตัดออก นี่คือเทคนิคที่คุณจะเห็นในบทช่วยสอนในส่วนนี้:

สำหรับตัวอย่างเพิ่มเติมของการถ่ายโอนการเรียนรู้โดยใช้ TensorFlow.js โปรดดู ที่ ใช้โมเดลที่ฝึกไว้ล่วงหน้า