רכיב ה-ExampleValidator TFX Pipeline

רכיב הצינור של ExampleValidator מזהה חריגות בנתוני ההדרכה וההגשה. זה יכול לזהות סוגים שונים של חריגות בנתונים. למשל זה יכול:

  1. לבצע בדיקות תקפות על ידי השוואת נתונים סטטיסטיים מול סכימה שמקודדת את הציפיות מהמשתמש.
  2. זיהוי הטיית אימון-הגשה על-ידי השוואת נתוני ההדרכה וההגשה.
  3. לזהות סחיפה של נתונים על ידי התבוננות בסדרה של נתונים.
  4. לבצע אימותים מותאמים אישית באמצעות תצורה מבוססת SQL.

רכיב הצינור של ExampleValidator מזהה חריגות כלשהן בנתוני הדוגמה על ידי השוואת נתונים סטטיסטיים המחושבים על ידי רכיב הצינור של StatisticsGen מול סכימה. הסכימה המוסקת מקודדת מאפיינים שנתוני הקלט צפויים לעמוד בהם, וניתן לשנותם על ידי המפתח.

  • צורכת: סכימה מרכיב SchemaGen, וסטטיסטיקה מרכיב StatisticsGen.
  • פולטות: תוצאות אימות

אימות נתונים לדוגמה ו- TensorFlow

ExampleValidator עושה שימוש נרחב ב- TensorFlow Data Validation לאימות נתוני הקלט שלך.

שימוש ברכיב ExampleValidator

רכיב צינור של ExampleValidator הוא בדרך כלל קל מאוד לפריסה ודורש מעט התאמה אישית. קוד טיפוסי נראה כך:

validate_stats = ExampleValidator(
      statistics=statistics_gen.outputs['statistics'],
      schema=schema_gen.outputs['schema']
      )

פרטים נוספים זמינים בהפניה ל-ExampleValidator API .