ওভারভিউ
TFMA নিম্নলিখিত মেট্রিক এবং প্লট সমর্থন করে:
- স্ট্যান্ডার্ড কেরাস মেট্রিক্স (
tf.keras.metrics.*
)- মনে রাখবেন কেরাস মেট্রিক্স ব্যবহার করার জন্য আপনার কেরাস মডেলের প্রয়োজন নেই। মেট্রিক্স সরাসরি মেট্রিক্স ক্লাস ব্যবহার করে বিমে গ্রাফের বাইরে গণনা করা হয়।
স্ট্যান্ডার্ড TFMA মেট্রিক্স এবং প্লট (
tfma.metrics.*
)কাস্টম কেরাস মেট্রিক্স (
tf.keras.metrics.Metric
থেকে প্রাপ্ত মেট্রিক)কাস্টম TFMA মেট্রিক্স (
tfma.metrics.Metric
থেকে প্রাপ্ত মেট্রিক) কাস্টম বিম কম্বাইনার বা অন্যান্য মেট্রিক থেকে প্রাপ্ত মেট্রিক ব্যবহার করে।
TFMA মাল্টি-ক্লাস/মাল্টি-লেবেল সমস্যার সাথে ব্যবহারের জন্য বাইনারি শ্রেণীবিভাগের মেট্রিক্স রূপান্তর করার জন্য অন্তর্নির্মিত সমর্থন প্রদান করে:
- ক্লাস আইডি, টপ কে, ইত্যাদির উপর ভিত্তি করে বাইনারিকরণ।
- মাইক্রো গড়, ম্যাক্রো গড়, ইত্যাদির উপর ভিত্তি করে একত্রিত মেট্রিক্স।
TFMA ক্যোয়ারী/র্যাঙ্কিং ভিত্তিক মেট্রিকগুলির জন্য অন্তর্নির্মিত সমর্থনও প্রদান করে যেখানে উদাহরণগুলি পাইপলাইনে স্বয়ংক্রিয়ভাবে একটি ক্যোয়ারী কী দ্বারা গোষ্ঠীভুক্ত হয়।
রিগ্রেশন, বাইনারি শ্রেণীবিভাগ, মাল্টি-ক্লাস/মাল্টি-লেবেল শ্রেণীবিভাগ, র্যাঙ্কিং ইত্যাদি সহ বিভিন্ন সমস্যার জন্য 50+ এর বেশি স্ট্যান্ডার্ড মেট্রিক্স এবং প্লট পাওয়া যায়।
কনফিগারেশন
TFMA-তে মেট্রিক্স কনফিগার করার দুটি উপায় আছে: (1) tfma.MetricsSpec
ব্যবহার করে বা (2) tf.keras.metrics.*
এবং/অথবা tfma.metrics.*
ক্লাসের উদাহরণ তৈরি করে এবং tfma.metrics.specs_from_metrics
তাদের tfma.MetricsSpec
এর তালিকায় রূপান্তর করতে।
নিম্নলিখিত বিভাগগুলি বিভিন্ন ধরণের মেশিন লার্নিং সমস্যার উদাহরণ কনফিগারেশন বর্ণনা করে।
রিগ্রেশন মেট্রিক্স
নিম্নে একটি রিগ্রেশন সমস্যার জন্য একটি উদাহরণ কনফিগারেশন সেটআপ। সমর্থিত সম্ভাব্য অতিরিক্ত মেট্রিক্সের জন্য tf.keras.metrics.*
এবং tfma.metrics.*
মডিউলগুলি দেখুন।
from google.protobuf import text_format
metrics_specs = text_format.Parse("""
metrics_specs {
metrics { class_name: "ExampleCount" }
metrics { class_name: "MeanSquaredError" }
metrics { class_name: "Accuracy" }
metrics { class_name: "MeanLabel" }
metrics { class_name: "MeanPrediction" }
metrics { class_name: "Calibration" }
metrics {
class_name: "CalibrationPlot"
config: '"min_value": 0, "max_value": 10'
}
}
""", tfma.EvalConfig()).metrics_specs
এই একই সেটআপ নিম্নলিখিত পাইথন কোড ব্যবহার করে তৈরি করা যেতে পারে:
metrics = [
tfma.metrics.ExampleCount(name='example_count'),
tf.keras.metrics.MeanSquaredError(name='mse'),
tf.keras.metrics.Accuracy(name='accuracy'),
tfma.metrics.MeanLabel(name='mean_label'),
tfma.metrics.MeanPrediction(name='mean_prediction'),
tfma.metrics.Calibration(name='calibration'),
tfma.metrics.CalibrationPlot(
name='calibration', min_value=0, max_value=10)
]
metrics_specs = tfma.metrics.specs_from_metrics(metrics)
মনে রাখবেন যে এই সেটআপটি tfma.metrics.default_regression_specs
কল করেও উপলব্ধ।
বাইনারি ক্লাসিফিকেশন মেট্রিক্স
নিম্নলিখিত একটি বাইনারি শ্রেণীবিভাগ সমস্যা জন্য কনফিগারেশন সেটআপ উদাহরণ. সমর্থিত সম্ভাব্য অতিরিক্ত মেট্রিক্সের জন্য tf.keras.metrics.*
এবং tfma.metrics.*
মডিউলগুলি দেখুন।
from google.protobuf import text_format
metrics_specs = text_format.Parse("""
metrics_specs {
metrics { class_name: "ExampleCount" }
metrics { class_name: "BinaryCrossentropy" }
metrics { class_name: "BinaryAccuracy" }
metrics { class_name: "AUC" }
metrics { class_name: "AUCPrecisionRecall" }
metrics { class_name: "MeanLabel" }
metrics { class_name: "MeanPrediction" }
metrics { class_name: "Calibration" }
metrics { class_name: "ConfusionMatrixPlot" }
metrics { class_name: "CalibrationPlot" }
}
""", tfma.EvalConfig()).metrics_specs
এই একই সেটআপ নিম্নলিখিত পাইথন কোড ব্যবহার করে তৈরি করা যেতে পারে:
metrics = [
tfma.metrics.ExampleCount(name='example_count'),
tf.keras.metrics.BinaryCrossentropy(name='binary_crossentropy'),
tf.keras.metrics.BinaryAccuracy(name='accuracy'),
tf.keras.metrics.AUC(name='auc', num_thresholds=10000),
tf.keras.metrics.AUC(
name='auc_precision_recall', curve='PR', num_thresholds=10000),
tf.keras.metrics.Precision(name='precision'),
tf.keras.metrics.Recall(name='recall'),
tfma.metrics.MeanLabel(name='mean_label'),
tfma.metrics.MeanPrediction(name='mean_prediction'),
tfma.metrics.Calibration(name='calibration'),
tfma.metrics.ConfusionMatrixPlot(name='confusion_matrix_plot'),
tfma.metrics.CalibrationPlot(name='calibration_plot')
]
metrics_specs = tfma.metrics.specs_from_metrics(metrics)
মনে রাখবেন যে এই সেটআপটি tfma.metrics.default_binary_classification_specs
কল করেও উপলব্ধ।
মাল্টি-ক্লাস/মাল্টি-লেবেল ক্লাসিফিকেশন মেট্রিক্স
নিম্নলিখিত একটি বহু-শ্রেণীর শ্রেণীবিভাগ সমস্যার জন্য একটি উদাহরণ কনফিগারেশন সেটআপ। সমর্থিত সম্ভাব্য অতিরিক্ত মেট্রিক্সের জন্য tf.keras.metrics.*
এবং tfma.metrics.*
মডিউলগুলি দেখুন।
from google.protobuf import text_format
metrics_specs = text_format.Parse("""
metrics_specs {
metrics { class_name: "ExampleCount" }
metrics { class_name: "SparseCategoricalCrossentropy" }
metrics { class_name: "SparseCategoricalAccuracy" }
metrics { class_name: "Precision" config: '"top_k": 1' }
metrics { class_name: "Precision" config: '"top_k": 3' }
metrics { class_name: "Recall" config: '"top_k": 1' }
metrics { class_name: "Recall" config: '"top_k": 3' }
metrics { class_name: "MultiClassConfusionMatrixPlot" }
}
""", tfma.EvalConfig()).metrics_specs
এই একই সেটআপ নিম্নলিখিত পাইথন কোড ব্যবহার করে তৈরি করা যেতে পারে:
metrics = [
tfma.metrics.ExampleCount(name='example_count'),
tf.keras.metrics.SparseCategoricalCrossentropy(
name='sparse_categorical_crossentropy'),
tf.keras.metrics.SparseCategoricalAccuracy(name='accuracy'),
tf.keras.metrics.Precision(name='precision', top_k=1),
tf.keras.metrics.Precision(name='precision', top_k=3),
tf.keras.metrics.Recall(name='recall', top_k=1),
tf.keras.metrics.Recall(name='recall', top_k=3),
tfma.metrics.MultiClassConfusionMatrixPlot(
name='multi_class_confusion_matrix_plot'),
]
metrics_specs = tfma.metrics.specs_from_metrics(metrics)
মনে রাখবেন যে এই সেটআপটি tfma.metrics.default_multi_class_classification_specs
কল করেও উপলব্ধ।
মাল্টি-ক্লাস/মাল্টি-লেবেল বাইনারাইজড মেট্রিক্স
মাল্টি-ক্লাস/মাল্টি-লেবেল মেট্রিক্সকে tfma.BinarizationOptions
ব্যবহার করে প্রতি ক্লাস, প্রতি top_k, ইত্যাদি মেট্রিক্স তৈরি করতে বাইনারি করা যেতে পারে। যেমন:
from google.protobuf import text_format
metrics_specs = text_format.Parse("""
metrics_specs {
binarize: { class_ids: { values: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9] } }
// Metrics to binarize
metrics { class_name: "AUC" }
...
}
""", tfma.EvalConfig()).metrics_specs
এই একই সেটআপ নিম্নলিখিত পাইথন কোড ব্যবহার করে তৈরি করা যেতে পারে:
metrics = [
// Metrics to binarize
tf.keras.metrics.AUC(name='auc', num_thresholds=10000),
...
]
metrics_specs = tfma.metrics.specs_from_metrics(
metrics, binarize=tfma.BinarizationOptions(
class_ids={'values': [0,1,2,3,4,5,6,7,8,9]}))
মাল্টি-ক্লাস/মাল্টি-লেবেল এগ্রিগেট মেট্রিক্স
মাল্টি-ক্লাস/মাল্টি-লেবেল মেট্রিকগুলিকে tfma.AggregationOptions
ব্যবহার করে একটি বাইনারি শ্রেণিবিন্যাস মেট্রিকের জন্য একটি একক সমষ্টিগত মান তৈরি করতে একত্রিত করা যেতে পারে।
মনে রাখবেন যে একত্রিতকরণ সেটিংস বাইনারিকরণ সেটিংস থেকে স্বাধীন তাই আপনি একই সময়ে tfma.AggregationOptions
এবং tfma.BinarizationOptions
উভয়ই ব্যবহার করতে পারেন।
মাইক্রো গড়
tfma.AggregationOptions
এর মধ্যে micro_average
অপশন ব্যবহার করে মাইক্রো এভারেজিং করা যেতে পারে। যেমন:
from google.protobuf import text_format
metrics_specs = text_format.Parse("""
metrics_specs {
aggregate: { micro_average: true }
// Metrics to aggregate
metrics { class_name: "AUC" }
...
}
""", tfma.EvalConfig()).metrics_specs
এই একই সেটআপ নিম্নলিখিত পাইথন কোড ব্যবহার করে তৈরি করা যেতে পারে:
metrics = [
// Metrics to aggregate
tf.keras.metrics.AUC(name='auc', num_thresholds=10000),
...
]
metrics_specs = tfma.metrics.specs_from_metrics(
metrics, aggregate=tfma.AggregationOptions(micro_average=True))
মাইক্রো এভারেজিং top_k
সেটিং সমর্থন করে যেখানে গণনায় শুধুমাত্র শীর্ষ k মান ব্যবহার করা হয়। যেমন:
from google.protobuf import text_format
metrics_specs = text_format.Parse("""
metrics_specs {
aggregate: {
micro_average: true
top_k_list: { values: [1, 3] }
}
// Metrics to aggregate
metrics { class_name: "AUC" }
...
}
""", tfma.EvalConfig()).metrics_specs
এই একই সেটআপ নিম্নলিখিত পাইথন কোড ব্যবহার করে তৈরি করা যেতে পারে:
metrics = [
// Metrics to aggregate
tf.keras.metrics.AUC(name='auc', num_thresholds=10000),
...
]
metrics_specs = tfma.metrics.specs_from_metrics(
metrics,
aggregate=tfma.AggregationOptions(micro_average=True,
top_k_list={'values': [1, 3]}))
ম্যাক্রো/ওয়েটেড ম্যাক্রো গড়
tfma.AggregationOptions
এর মধ্যে macro_average
বা weighted_macro_average
বিকল্পগুলি ব্যবহার করে ম্যাক্রো গড় সম্পাদন করা যেতে পারে। top_k
সেটিংস ব্যবহার না করা হলে, ম্যাক্রোর জন্য class_weights
সেট করতে হবে কোন ক্লাসের গড় গণনা করতে হবে তা জানার জন্য। যদি একটি class_weight
প্রদান না করা হয় তাহলে 0.0 ধরে নেওয়া হয়। যেমন:
from google.protobuf import text_format
metrics_specs = text_format.Parse("""
metrics_specs {
aggregate: {
macro_average: true
class_weights: { key: 0 value: 1.0 }
class_weights: { key: 1 value: 1.0 }
class_weights: { key: 2 value: 1.0 }
class_weights: { key: 3 value: 1.0 }
class_weights: { key: 4 value: 1.0 }
class_weights: { key: 5 value: 1.0 }
class_weights: { key: 6 value: 1.0 }
class_weights: { key: 7 value: 1.0 }
class_weights: { key: 8 value: 1.0 }
class_weights: { key: 9 value: 1.0 }
}
// Metrics to aggregate
metrics { class_name: "AUC" }
...
}
""", tfma.EvalConfig()).metrics_specs
এই একই সেটআপ নিম্নলিখিত পাইথন কোড ব্যবহার করে তৈরি করা যেতে পারে:
metrics = [
// Metrics to aggregate
tf.keras.metrics.AUC(name='auc', num_thresholds=10000),
...
]
metrics_specs = tfma.metrics.specs_from_metrics(
metrics,
aggregate=tfma.AggregationOptions(
macro_average=True, class_weights={i: 1.0 for i in range(10)}))
মাইক্রো এভারেজিং এর মত, ম্যাক্রো এভারেজিং top_k
সেটিং সমর্থন করে যেখানে গণনায় শুধুমাত্র টপ k মান ব্যবহার করা হয়। যেমন:
from google.protobuf import text_format
metrics_specs = text_format.Parse("""
metrics_specs {
aggregate: {
macro_average: true
top_k_list: { values: [1, 3] }
}
// Metrics to aggregate
metrics { class_name: "AUC" }
...
}
""", tfma.EvalConfig()).metrics_specs
এই একই সেটআপ নিম্নলিখিত পাইথন কোড ব্যবহার করে তৈরি করা যেতে পারে:
metrics = [
// Metrics to aggregate
tf.keras.metrics.AUC(name='auc', num_thresholds=10000),
...
]
metrics_specs = tfma.metrics.specs_from_metrics(
metrics,
aggregate=tfma.AggregationOptions(macro_average=True,
top_k_list={'values': [1, 3]}))
প্রশ্ন / র্যাঙ্কিং ভিত্তিক মেট্রিক্স
ক্যোয়ারী/র্যাঙ্কিং ভিত্তিক মেট্রিকগুলি মেট্রিক্স স্পেক্সে query_key
বিকল্পটি উল্লেখ করে সক্ষম করা হয়। যেমন:
from google.protobuf import text_format
metrics_specs = text_format.Parse("""
metrics_specs {
query_key: "doc_id"
metrics {
class_name: "NDCG"
config: '"gain_key": "gain", "top_k_list": [1, 2]'
}
metrics { class_name: "MinLabelPosition" }
}
""", tfma.EvalConfig()).metrics_specs
এই একই সেটআপ নিম্নলিখিত পাইথন কোড ব্যবহার করে তৈরি করা যেতে পারে:
metrics = [
tfma.metrics.NDCG(name='ndcg', gain_key='gain', top_k_list=[1, 2]),
tfma.metrics.MinLabelPosition(name='min_label_position')
]
metrics_specs = tfma.metrics.specs_from_metrics(metrics, query_key='doc_id')
বহু-মডেল মূল্যায়ন মেট্রিক্স
TFMA একই সময়ে একাধিক মডেলের মূল্যায়ন সমর্থন করে। যখন বহু-মডেল মূল্যায়ন করা হয়, তখন প্রতিটি মডেলের জন্য মেট্রিক্স গণনা করা হবে। যেমন:
from google.protobuf import text_format
metrics_specs = text_format.Parse("""
metrics_specs {
# no model_names means all models
...
}
""", tfma.EvalConfig()).metrics_specs
যদি মডেলগুলির একটি উপসেটের জন্য মেট্রিক্স গণনা করার প্রয়োজন হয়, metric_specs
এ model_names
সেট করুন। যেমন:
from google.protobuf import text_format
metrics_specs = text_format.Parse("""
metrics_specs {
model_names: ["my-model1"]
...
}
""", tfma.EvalConfig()).metrics_specs
specs_from_metrics
API এছাড়াও মডেল নাম পাস করা সমর্থন করে:
metrics = [
...
]
metrics_specs = tfma.metrics.specs_from_metrics(
metrics, model_names=['my-model1'])
মডেল তুলনা মেট্রিক্স
TFMA একটি বেসলাইন মডেলের বিপরীতে প্রার্থী মডেলের তুলনা মেট্রিক্স মূল্যায়ন সমর্থন করে। প্রার্থী এবং বেসলাইন মডেল পেয়ার সেটআপ করার একটি সহজ উপায় হল সঠিক মডেল নাম (tfma.BASELINE_KEY এবং tfma.CANDIDATE_KEY) সহ একটি eval_shared_model বরাবর পাস করা:
eval_config = text_format.Parse("""
model_specs {
# ... model_spec without names ...
}
metrics_spec {
# ... metrics ...
}
""", tfma.EvalConfig())
eval_shared_models = [
tfma.default_eval_shared_model(
model_name=tfma.CANDIDATE_KEY,
eval_saved_model_path='/path/to/saved/candidate/model',
eval_config=eval_config),
tfma.default_eval_shared_model(
model_name=tfma.BASELINE_KEY,
eval_saved_model_path='/path/to/saved/baseline/model',
eval_config=eval_config),
]
eval_result = tfma.run_model_analysis(
eval_shared_models,
eval_config=eval_config,
# This assumes your data is a TFRecords file containing records in the
# tf.train.Example format.
data_location="/path/to/file/containing/tfrecords",
output_path="/path/for/output")
তুলনা মেট্রিক্স স্বয়ংক্রিয়ভাবে গণনা করা হয় সমস্ত পার্থক্য-সক্ষম মেট্রিকের জন্য (বর্তমানে শুধুমাত্র স্কেলার মান মেট্রিক যেমন নির্ভুলতা এবং AUC)।
মাল্টি-আউটপুট মডেল মেট্রিক্স
TFMA বিভিন্ন আউটপুট আছে এমন মডেলের মেট্রিক্স মূল্যায়ন সমর্থন করে। মাল্টি-আউটপুট মডেলগুলি তাদের আউটপুট ভবিষ্যদ্বাণীগুলিকে আউটপুট নামের দ্বারা চাবিযুক্ত ডিক্ট আকারে সংরক্ষণ করে। যখন মাল্টি-আউটপুট মডেলগুলি ব্যবহার করা হয়, তখন মেট্রিক্সের সেটের সাথে যুক্ত আউটপুটগুলির নাম অবশ্যই MetricsSpec-এর output_names
বিভাগে নির্দিষ্ট করতে হবে। যেমন:
from google.protobuf import text_format
metrics_specs = text_format.Parse("""
metrics_specs {
output_names: ["my-output"]
...
}
""", tfma.EvalConfig()).metrics_specs
specs_from_metrics
API এছাড়াও পাসিং আউটপুট নাম সমর্থন করে:
metrics = [
...
]
metrics_specs = tfma.metrics.specs_from_metrics(
metrics, output_names=['my-output'])
মেট্রিক সেটিংস কাস্টমাইজ করা
TFMA বিভিন্ন মেট্রিক্সের সাথে ব্যবহৃত সেটিংস কাস্টমাইজ করার অনুমতি দেয়। উদাহরণস্বরূপ আপনি নাম পরিবর্তন করতে চাইতে পারেন, থ্রেশহোল্ড সেট করুন, ইত্যাদি। এটি মেট্রিক কনফিগারেশনে একটি config
বিভাগ যোগ করে করা হয়। কনফিগারেশনটি প্যারামিটারগুলির JSON স্ট্রিং সংস্করণ ব্যবহার করে নির্দিষ্ট করা হয়েছে যা মেট্রিক্স __init__
পদ্ধতিতে পাস করা হবে (ব্যবহারের সহজতার জন্য '{' এবং '}' বন্ধনী বাদ দেওয়া যেতে পারে)। যেমন:
from google.protobuf import text_format
metrics_specs = text_format.Parse("""
metrics_specs {
metrics {
class_name: "ConfusionMatrixAtThresholds"
config: '"thresholds": [0.3, 0.5, 0.8]'
}
}
""", tfma.MetricsSpec()).metrics_specs
এই কাস্টমাইজেশন অবশ্যই সরাসরি সমর্থিত:
metrics = [
tfma.metrics.ConfusionMatrixAtThresholds(thresholds=[0.3, 0.5, 0.8]),
]
metrics_specs = tfma.metrics.specs_from_metrics(metrics)
আউটপুট
একটি মেট্রিক মূল্যায়নের আউটপুট হল মেট্রিক কী/মান এবং/অথবা ব্যবহৃত কনফিগারেশনের উপর ভিত্তি করে প্লট কী/মানগুলির একটি সিরিজ।
মেট্রিক কী
MetricKeys একটি কাঠামোগত কী প্রকার ব্যবহার করে সংজ্ঞায়িত করা হয়। এই কী অনন্যভাবে একটি মেট্রিকের নিম্নলিখিত দিকগুলির প্রতিটিকে চিহ্নিত করে:
- মেট্রিক নাম (
auc
,mean_label
, ইত্যাদি) - মডেলের নাম (মাল্টি-মডেল মূল্যায়ন হলেই ব্যবহার করা হয়)
- আউটপুট নাম (কেবলমাত্র ব্যবহার করা হয় যদি মাল্টি-আউটপুট মডেল মূল্যায়ন করা হয়)
- সাব কী (যেমন ক্লাস আইডি যদি মাল্টি-ক্লাস মডেল বাইনারি করা হয়)
মেট্রিক মান
মেট্রিক ভ্যালুগুলিকে একটি প্রোটো ব্যবহার করে সংজ্ঞায়িত করা হয় যা বিভিন্ন মেট্রিক্স দ্বারা সমর্থিত বিভিন্ন মানের প্রকারগুলিকে এনক্যাপুলেট করে (যেমন double
, ConfusionMatrixAtThresholds
ইত্যাদি)।
নীচে সমর্থিত মেট্রিক মান প্রকারগুলি রয়েছে:
-
double_value
- একটি ডবল টাইপের জন্য একটি মোড়ক। -
bytes_value
- একটি বাইট মান। -
bounded_value
- একটি বাস্তব মানের প্রতিনিধিত্ব করে যা একটি পয়েন্টওয়াইজ অনুমান হতে পারে, ঐচ্ছিকভাবে কিছু ধরণের আনুমানিক সীমার সাথে। বৈশিষ্ট্যvalue
আছে,lower_bound
, এবংupper_bound
। -
value_at_cutoffs
- কাটঅফের মান (যেমন precision@K, recall@K)। প্রপার্টিvalues
আছে, যার প্রতিটিরই প্রপার্টিcutoff
এবংvalue
আছে। -
confusion_matrix_at_thresholds
- থ্রেশহোল্ডে বিভ্রান্তি ম্যাট্রিক্স। প্রপার্টিmatrices
আছে, যার প্রতিটিতেthreshold
,precision
,recall
এবং কনফিউশন ম্যাট্রিক্স মান যেমনfalse_negatives
এর বৈশিষ্ট্য রয়েছে। -
array_value
- মেট্রিক্সের জন্য যা মানগুলির একটি অ্যারে প্রদান করে।
প্লট কী
প্লটকীগুলি মেট্রিক কীগুলির মতোই, ঐতিহাসিক কারণে সমস্ত প্লটের মান একটি একক প্রোটোতে সংরক্ষণ করা হয় তাই প্লট কীটির একটি নাম নেই৷
প্লট মান
সমস্ত সমর্থিত প্লট প্লটডাটা নামে একটি একক প্রোটোতে সংরক্ষণ করা হয়।
ইভাল রেজাল্ট
একটি মূল্যায়ন রান থেকে প্রত্যাবর্তন একটি tfma.EvalResult
. এই রেকর্ডে slicing_metrics
রয়েছে যা মেট্রিক কীটিকে একটি মাল্টি-লেভেল ডিক্ট হিসাবে এনকোড করে যেখানে স্তরগুলি যথাক্রমে আউটপুট নাম, ক্লাস আইডি, মেট্রিক নাম এবং মেট্রিক মানের সাথে মিলে যায়। এটি একটি জুপিটার নোটবুকে UI প্রদর্শনের জন্য ব্যবহার করার উদ্দেশ্যে। অন্তর্নিহিত ডেটা অ্যাক্সেসের প্রয়োজন হলে এর পরিবর্তে metrics
ফলাফল ফাইল ব্যবহার করা উচিত ( metrics_for_slice.proto দেখুন)।
কাস্টমাইজেশন
কাস্টম মেট্রিক্স ছাড়াও যেগুলি একটি সংরক্ষিত কেরা (বা উত্তরাধিকারী EvalSavedModel) এর অংশ হিসাবে যোগ করা হয়। TFMA পোস্ট সেভিং-এ মেট্রিক্স কাস্টমাইজ করার দুটি উপায় রয়েছে: (1) একটি কাস্টম কেরাস মেট্রিক ক্লাস সংজ্ঞায়িত করে এবং (2) একটি বীম কম্বাইনার দ্বারা সমর্থিত একটি কাস্টম TFMA মেট্রিক্স ক্লাস সংজ্ঞায়িত করে।
উভয় ক্ষেত্রেই, মেট্রিকগুলি মেট্রিক ক্লাস এবং সংশ্লিষ্ট মডিউলের নাম উল্লেখ করে কনফিগার করা হয়। যেমন:
from google.protobuf import text_format
metrics_specs = text_format.Parse("""
metrics_specs {
metrics { class_name: "MyMetric" module: "my.module"}
}
""", tfma.EvalConfig()).metrics_specs
কাস্টম কেরাস মেট্রিক্স
একটি কাস্টম কেরাস মেট্রিক তৈরি করতে, ব্যবহারকারীদের তাদের বাস্তবায়নের সাথে tf.keras.metrics.Metric
প্রসারিত করতে হবে এবং তারপর নিশ্চিত করুন যে মেট্রিকের মডিউলটি মূল্যায়নের সময় উপলব্ধ রয়েছে।
মনে রাখবেন যে মেট্রিক্স যুক্ত পোস্ট মডেল সংরক্ষণের জন্য, TFMA শুধুমাত্র সেই মেট্রিকগুলিকে সমর্থন করে যেগুলি লেবেল (যেমন y_true), ভবিষ্যদ্বাণী (y_pred), এবং উদাহরণ ওজন (নমুনা_ওজন) update_state
পদ্ধতিতে প্যারামিটার হিসাবে গ্রহণ করে।
কেরাস মেট্রিক উদাহরণ
নিম্নলিখিত একটি কাস্টম কেরাস মেট্রিকের একটি উদাহরণ:
class MyMetric(tf.keras.metrics.Mean):
def __init__(self, name='my_metric', dtype=None):
super(MyMetric, self).__init__(name=name, dtype=dtype)
def update_state(self, y_true, y_pred, sample_weight=None):
return super(MyMetric, self).update_state(
y_pred, sample_weight=sample_weight)
কাস্টম TFMA মেট্রিক্স
একটি কাস্টম TFMA মেট্রিক তৈরি করতে, ব্যবহারকারীদের তাদের বাস্তবায়নের সাথে tfma.metrics.Metric
প্রসারিত করতে হবে এবং তারপর নিশ্চিত করুন যে মেট্রিকের মডিউলটি মূল্যায়নের সময় উপলব্ধ রয়েছে।
মেট্রিক
একটি tfma.metrics.Metric
বাস্তবায়ন কোয়ার্গের একটি সেট দ্বারা গঠিত যা মেট্রিক্স মান গণনা করার জন্য প্রয়োজনীয় গণনা (সম্ভবত একাধিক) তৈরি করার জন্য একটি ফাংশন সহ মেট্রিক্স কনফিগারেশনকে সংজ্ঞায়িত করে। দুটি প্রধান গণনার ধরন রয়েছে যা ব্যবহার করা যেতে পারে: tfma.metrics.MetricComputation
এবং tfma.metrics.DerivedMetricComputation
যা নীচের বিভাগে বর্ণিত হয়েছে। যে ফাংশনটি এই গণনাগুলি তৈরি করে তা ইনপুট হিসাবে নিম্নলিখিত পরামিতিগুলি পাস করা হবে:
-
eval_config: tfam.EvalConfig
- eval কনফিগারেশনটি মূল্যায়নকারীর কাছে পাঠানো হয়েছে (মডেল স্পেক সেটিংস খোঁজার জন্য উপযোগী যেমন ভবিষ্যদ্বাণী কী ব্যবহার করতে হবে ইত্যাদি)।
-
model_names: List[Text]
- মেট্রিক্স গণনা করার জন্য মডেল নামের তালিকা (একক-মডেল হলে কিছুই নয়)
-
output_names: List[Text]
।- মেট্রিক্স গণনা করার জন্য আউটপুট নামের তালিকা (একক-মডেল থাকলে কিছুই নয়)
-
sub_keys: List[tfma.SubKey]
।- (বা কোনটি নয়) এর জন্য মেট্রিক্স গণনা করতে সাব কীগুলির তালিকা (শ্রেণীর আইডি, শীর্ষ K, ইত্যাদি)
-
aggregation_type: tfma.AggregationType
- একত্রিতকরণের ধরন যদি একটি সমষ্টি মেট্রিক গণনা করা হয়।
-
class_weights: Dict[int, float]
।- একটি সমষ্টি মেট্রিক গণনা করার জন্য ব্যবহার করা ক্লাস ওজন।
-
query_key: Text
- একটি ক্যোয়ারী/র্যাঙ্কিং ভিত্তিক মেট্রিক গণনা করা হলে ক্যোয়ারী কী ব্যবহার করা হয়।
যদি একটি মেট্রিক এই সেটিংসগুলির এক বা একাধিক সাথে যুক্ত না হয় তবে এটি সেই প্যারামিটারগুলিকে তার স্বাক্ষর সংজ্ঞার বাইরে রেখে যেতে পারে।
যদি প্রতিটি মডেল, আউটপুট এবং সাব কী-এর জন্য একটি মেট্রিক একইভাবে গণনা করা হয়, তাহলে এই প্রতিটি ইনপুটগুলির জন্য আলাদাভাবে একই গণনা করতে ইউটিলিটি tfma.metrics.merge_per_key_computations
ব্যবহার করা যেতে পারে।
মেট্রিক কম্পিউটেশন
একটি MetricComputation
preprocessors
এবং একটি combiner
সমন্বয়ে গঠিত। preprocessors
হল preprocessor
একটি তালিকা, যা একটি beam.DoFn
DoFn যা এক্সট্র্যাক্টকে তার ইনপুট হিসাবে নেয় এবং কম্বাইনার দ্বারা ব্যবহৃত প্রাথমিক অবস্থাটি আউটপুট করে (নিষ্কাশন কী সে সম্পর্কে আরও তথ্যের জন্য আর্কিটেকচার দেখুন)। সমস্ত প্রিপ্রসেসর তালিকার ক্রমানুসারে ক্রমানুসারে কার্যকর করা হবে। যদি preprocessors
খালি থাকে, তাহলে কম্বাইনারকে স্ট্যান্ডার্ডমেট্রিক ইনপুট পাস করা হবে (স্ট্যান্ডার্ড মেট্রিক ইনপুটগুলিতে লেবেল, পূর্বাভাস এবং উদাহরণ_ওজন থাকে)। combiner
হল একটি beam.CombineFn
যেটি তার ইনপুট হিসাবে এক টুপল (স্লাইস কী, প্রিপ্রসেসর আউটপুট) নেয় এবং তার ফলাফল হিসাবে একটি টুপল (স্লাইস_কি, মেট্রিক ফলাফল নির্দেশ) আউটপুট করে।
মনে রাখবেন যে স্লাইসিং preprocessors
এবং combiner
মধ্যে ঘটে।
মনে রাখবেন যে যদি একটি মেট্রিক কম্পিউটেশন উভয় স্ট্যান্ডার্ড মেট্রিক ইনপুট ব্যবহার করতে চায়, কিন্তু features
নির্যাস থেকে কয়েকটি বৈশিষ্ট্যের সাথে এটিকে বৃদ্ধি করতে চায়, তাহলে বিশেষ ফিচারপ্রেপ্রসেসর ব্যবহার করা যেতে পারে যা একাধিক কম্বাইনার থেকে অনুরোধ করা বৈশিষ্ট্যগুলিকে এককভাবে একত্রিত করবে। শেয়ার্ড স্ট্যান্ডার্ডমেট্রিক্সইনপুট মান যা সমস্ত কম্বাইনারদের কাছে পাঠানো হয় (কম্বাইনাররা তাদের আগ্রহী বৈশিষ্ট্যগুলি পড়ার জন্য এবং বাকিগুলিকে উপেক্ষা করার জন্য দায়ী)।
উদাহরণ
ExampleCount কম্পিউট করার জন্য TFMA মেট্রিক সংজ্ঞার একটি খুব সহজ উদাহরণ নিচে দেওয়া হল:
class ExampleCount(tfma.metrics.Metric):
def __init__(self, name: Text = 'example_count'):
super(ExampleCount, self).__init__(_example_count, name=name)
def _example_count(
name: Text = 'example_count') -> tfma.metrics.MetricComputations:
key = tfma.metrics.MetricKey(name=name)
return [
tfma.metrics.MetricComputation(
keys=[key],
preprocessors=[_ExampleCountPreprocessor()],
combiner=_ExampleCountCombiner(key))
]
class ExampleCountTest(tfma.test.testutil.TensorflowModelAnalysisTest):
def testExampleCount(self):
metric = ExampleCount()
computations = metric.computations(example_weighted=False)
computation = computations[0]
with beam.Pipeline() as pipeline:
result = (
pipeline
| 'Create' >> beam.Create([...]) # Add inputs
| 'PreProcess' >> beam.ParDo(computation.preprocessors[0])
| 'Process' >> beam.Map(tfma.metrics.to_standard_metric_inputs)
| 'AddSlice' >> beam.Map(lambda x: ((), x))
| 'ComputeMetric' >> beam.CombinePerKey(computation.combiner)
)
def check_result(got):
try:
self.assertLen(got, 1)
got_slice_key, got_metrics = got[0]
self.assertEqual(got_slice_key, ())
key = computation.keys[0]
self.assertIn(key, got_metrics)
self.assertAlmostEqual(got_metrics[key], expected_value, places=5)
except AssertionError as err:
raise util.BeamAssertException(err)
util.assert_that(result, check_result, label='result')
class _ExampleCountPreprocessor(beam.DoFn):
def process(self, extracts: tfma.Extracts) -> Iterable[int]:
yield 1
class _ExampleCountPreprocessorTest(unittest.TestCase):
def testExampleCountPreprocessor(self):
... # Init the test case here
with beam.Pipeline() as pipeline:
updated_pcoll = (
pipeline
| 'Create' >> beam.Create([...]) # Add inputs
| 'Preprocess'
>> beam.ParDo(
_ExampleCountPreprocessor()
)
)
beam_testing_util.assert_that(
updated_pcoll,
lambda result: ..., # Assert the test case
)
class _ExampleCountCombiner(beam.CombineFn):
def __init__(self, metric_key: tfma.metrics.MetricKey):
self._metric_key = metric_key
def create_accumulator(self) -> int:
return 0
def add_input(self, accumulator: int, state: int) -> int:
return accumulator + state
def merge_accumulators(self, accumulators: Iterable[int]) -> int:
accumulators = iter(accumulators)
result = next(accumulator)
for accumulator in accumulators:
result += accumulator
return result
def extract_output(self,
accumulator: int) -> Dict[tfma.metrics.MetricKey, int]:
return {self._metric_key: accumulator}
DerivedMetric Computation
একটি DerivedMetricComputation
একটি ফলাফল ফাংশন দ্বারা গঠিত যা অন্যান্য মেট্রিক গণনার আউটপুটের উপর ভিত্তি করে মেট্রিক মান গণনা করতে ব্যবহৃত হয়। ফলাফল ফাংশন তার ইনপুট হিসাবে গণনা করা মানগুলির একটি ডিক্ট নেয় এবং অতিরিক্ত মেট্রিক ফলাফলের একটি ডিক্ট আউটপুট করে।
মনে রাখবেন যে একটি মেট্রিক দ্বারা তৈরি গণনার তালিকায় একটি প্রাপ্ত গণনা নির্ভর করে এমন গণনাগুলি অন্তর্ভুক্ত করা গ্রহণযোগ্য (প্রস্তাবিত)৷ এটি একাধিক মেট্রিক্সের মধ্যে ভাগ করা গণনাগুলিকে প্রাক-তৈরি এবং পাস করতে হবে না। মূল্যায়নকারী স্বয়ংক্রিয়ভাবে কম্পিউটেশনগুলিকে ডি-ডুপ করবে যেগুলির একই সংজ্ঞা রয়েছে তাই একটি কম্পিউটেশন আসলে চালানো হয়।
উদাহরণ
TJUR মেট্রিক্স প্রাপ্ত মেট্রিক্সের একটি ভালো উদাহরণ প্রদান করে।