หน้านี้แสดงรายการชุดคำแนะนำและเครื่องมือที่รู้จักในการแก้ปัญหาในโดเมนข้อความด้วย TensorFlow Hub โดยเป็นจุดเริ่มต้นสำหรับใครก็ตามที่ต้องการแก้ไขปัญหา ML ทั่วไปโดยใช้ส่วนประกอบ ML ที่ได้รับการฝึกอบรมมาแล้ว แทนที่จะเริ่มต้นใหม่ทั้งหมด
การจัดหมวดหมู่
เมื่อเราต้องการทำนายคลาสสำหรับตัวอย่างที่กำหนด เช่น sentiment , toxicity , article category หรือลักษณะอื่นใด
บทช่วยสอนด้านล่างนี้เป็นการแก้ปัญหางานเดียวกันจากมุมมองที่แตกต่างกันและการใช้เครื่องมือที่แตกต่างกัน
เคราส
การจัดหมวดหมู่ข้อความด้วย Keras - ตัวอย่างสำหรับการสร้างตัวแยกประเภทความรู้สึก IMDB ด้วยชุดข้อมูล Keras และ TensorFlow
ตัวประมาณค่า
การจัดประเภทข้อความ - ตัวอย่างสำหรับการสร้างตัวแยกประเภทความรู้สึกของ IMDB ด้วยตัวประมาณการ ประกอบด้วยเคล็ดลับหลายประการสำหรับการปรับปรุงและส่วนการเปรียบเทียบโมดูล
เบิร์ต
การทำนายความรู้สึกต่อบทวิจารณ์ภาพยนตร์ด้วย BERT บน TF Hub - แสดงวิธีใช้โมดูล BERT สำหรับการจัดหมวดหมู่ รวมถึงการใช้ bert
เบิร์ตสำหรับโทเค็นและการประมวลผลล่วงหน้า
กากเกิล
การจัดหมวดหมู่ IMDB บน Kaggle - แสดงวิธีโต้ตอบกับการแข่งขัน Kaggle จาก Colab ได้อย่างง่ายดาย รวมถึงการดาวน์โหลดข้อมูลและส่งผลลัพธ์
ตัวประมาณค่า | เคราส | ทีเอฟ2 | ชุดข้อมูล TF | เบิร์ต | Kaggle API | |
---|---|---|---|---|---|---|
การจำแนกข้อความ | ||||||
การจัดหมวดหมู่ข้อความด้วย Keras | ||||||
ทำนายความรู้สึกวิจารณ์ภาพยนตร์กับ BERT บน TF Hub | ||||||
การจำแนกประเภท IMDB บน Kaggle |
งานบางลาที่มีการฝัง FastText
ปัจจุบัน TensorFlow Hub ยังไม่มีโมดูลในทุกภาษา บทช่วยสอนต่อไปนี้แสดงวิธีใช้ประโยชน์จาก TensorFlow Hub เพื่อการทดลองที่รวดเร็วและการพัฒนา ML แบบโมดูลาร์
Bangla Article Classifier - สาธิตวิธีสร้างการฝังข้อความ TensorFlow Hub แบบใช้ซ้ำได้ และใช้เพื่อฝึกตัวแยกประเภท Keras สำหรับ ชุดข้อมูล BARD Bangla Article
ความคล้ายคลึงกันทางความหมาย
เมื่อเราต้องการค้นหาว่าประโยคใดมีความสัมพันธ์กันในการตั้งค่าแบบ Zero-Shot (ไม่มีตัวอย่างการฝึกอบรม)
ขั้นพื้นฐาน
ความคล้ายคลึงกันทางความหมาย - แสดงวิธีใช้โมดูลตัวเข้ารหัสประโยคเพื่อคำนวณความคล้ายคลึงกันของประโยค
ข้ามภาษา
ความคล้ายคลึงกันของความหมายข้ามภาษา - แสดงวิธีใช้ตัวเข้ารหัสประโยคข้ามภาษาตัวใดตัวหนึ่งเพื่อคำนวณความคล้ายคลึงกันของประโยคในภาษาต่างๆ
การดึงความหมาย
การเรียกค้นความหมาย - แสดงวิธีใช้ตัวเข้ารหัสประโยคถามตอบเพื่อสร้างดัชนีชุดของเอกสารสำหรับการเรียกค้นตามความคล้ายคลึงกันของความหมาย
อินพุต Sentence Piece
ความคล้ายคลึงกันทางความหมายกับ Universal Encoder Lite - แสดงวิธีใช้โมดูลตัวเข้ารหัสประโยคที่ยอมรับรหัส Sentence Piece ในการป้อนข้อมูลแทนข้อความ
การสร้างโมดูล
แทนที่จะใช้เฉพาะโมดูลบน tfhub.dev มีวิธีสร้างโมดูลของตัวเอง นี่อาจเป็นเครื่องมือที่มีประโยชน์สำหรับการสร้างโมดูลฐานโค้ด ML ที่ดีขึ้นและเพื่อการแชร์เพิ่มเติม
การห่อการฝังที่ได้รับการฝึกอบรมล่วงหน้าที่มีอยู่
ผู้ส่งออกโมดูลการฝังข้อความ - เครื่องมือสำหรับรวมการฝังที่ได้รับการฝึกอบรมล่วงหน้าที่มีอยู่ลงในโมดูล แสดงวิธีรวมการดำเนินการประมวลผลล่วงหน้าข้อความลงในโมดูล ซึ่งจะช่วยให้สามารถสร้างโมดูลการฝังประโยคจากการฝังโทเค็น
ผู้ส่งออกโมดูลการฝังข้อความ v2 - เช่นเดียวกับด้านบน แต่เข้ากันได้กับ TensorFlow 2 และการดำเนินการที่กระตือรือร้น