ওভারভিউ
TensorBoard এর প্রধান বৈশিষ্ট্য হল এর ইন্টারেক্টিভ GUI। যদিও, ব্যবহারকারীদের মাঝে মাঝে প্রোগ্রামেটিক্যালি TensorBoard সংরক্ষিত ডেটা লগ, যেমন পোস্টে-হক বিশ্লেষণ পারফর্মিং এবং লগ ডেটা কাস্টম দৃশ্য তৈরি মতো উদ্দেশ্য পড়তে চাই।
2.3 সমর্থন এই ব্যবহারের ক্ষেত্রে TensorBoard সঙ্গে tensorboard.data.experimental.ExperimentFromDev()
এটা তোলে TensorBoard এর প্রোগ্রামাটিক অ্যাক্সেসের অনুমতি দেয় স্কালে লগ । এই পৃষ্ঠাটি এই নতুন API এর মৌলিক ব্যবহার প্রদর্শন করে।
সেটআপ
অর্ডার কর্মসূচি এপিআই ব্যবহার করার জন্য, নিশ্চিত করুন যে আপনি ইনস্টল করতে pandas
পাশাপাশি tensorboard
।
আমরা ব্যবহার করব matplotlib
এবং seaborn
এই সহায়িকার কাস্টম প্লট জন্য, কিন্তু আপনি বিশ্লেষণ এবং মনশ্চক্ষুতে আপনার পছন্দের টুল নির্বাচন করতে পারবেন DataFrame
গুলি।
pip install tensorboard pandas
pip install matplotlib seaborn
from packaging import version
import pandas as pd
from matplotlib import pyplot as plt
import seaborn as sns
from scipy import stats
import tensorboard as tb
major_ver, minor_ver, _ = version.parse(tb.__version__).release
assert major_ver >= 2 and minor_ver >= 3, \
"This notebook requires TensorBoard 2.3 or later."
print("TensorBoard version: ", tb.__version__)
TensorBoard version: 2.3.0a20200626
হিসেবে TensorBoard scalars লোড করা হচ্ছে pandas.DataFrame
একবার একটি TensorBoard logdir TensorBoard.dev এ আপলোড করা হয়েছে, এটা কি আমরা একটি পরীক্ষা হিসেবে পড়ুন হয়ে যায়। প্রতিটি পরীক্ষার একটি অনন্য আইডি আছে, যা পরীক্ষার TensorBoard.dev URL- এ পাওয়া যাবে। : নীচের আমাদের বিক্ষোভের জন্য, আমরা একটি TensorBoard.dev পরীক্ষা ব্যবহার করা হবে https://tensorboard.dev/experiment/c1KCv3X3QvGwaXfgX1c4tg
experiment_id = "c1KCv3X3QvGwaXfgX1c4tg"
experiment = tb.data.experimental.ExperimentFromDev(experiment_id)
df = experiment.get_scalars()
df
df
একটি হল pandas.DataFrame
পরীক্ষা সব স্কালে লগ রয়েছে সেটা।
এর কলাম DataFrame
আছেন:
-
run
: মূল logdir একটি সাব প্রতিটি রান অনুরূপ। এই পরীক্ষায়, প্রতিটি রান একটি প্রদত্ত অপটিমাইজার টাইপ (একটি প্রশিক্ষণ হাইপারপ্যারামিটার) সহ MNIST ডেটাসেটে একটি কনভোলিউশনাল নিউরাল নেটওয়ার্ক (CNN) এর সম্পূর্ণ প্রশিক্ষণ থেকে। এইDataFrame
একাধিক যেমন রান যা বিভিন্ন অপটিমাইজার ধরনের অধীনে পুনরাবৃত্তি প্রশিক্ষণ রান মিলা ধারণ করে। -
tag
: এই বর্ণনা কিvalue
যে একই সারিতে মানে, কি মেট্রিক মান সারিতে প্রতিনিধিত্ব করে। : এই পরীক্ষা, আমরা মাত্র দুটি অনন্য ট্যাগ আছেepoch_accuracy
এবংepoch_loss
সঠিকতা এবং ক্ষয় মেট্রিক্স যথাক্রমে জন্য। -
step
: এই একটি সংখ্যা যে তার রান সংশ্লিষ্ট সারির অন্বয় প্রতিফলিত করে। এখানেstep
আসলে কাল সংখ্যা বোঝায়। আপনি ছাড়াও টাইমস্ট্যাম্প প্রাপ্ত করতে চানstep
মূল্যবোধ, আপনি শব্দ যুক্তি ব্যবহার করতে পারেনinclude_wall_time=True
যখন কলিংget_scalars()
। -
value
এই সুদ প্রকৃত সংখ্যাসূচক মান। উপরে বর্ণিত, প্রতিটিvalue
এই বিশেষDataFrame
পারেন একটি ক্ষতি বা কোনো সঠিকতা, উপর নির্ভর করেtag
সারির।
print(df["run"].unique())
print(df["tag"].unique())
['adam,run_1/train' 'adam,run_1/validation' 'adam,run_2/train' 'adam,run_2/validation' 'adam,run_3/train' 'adam,run_3/validation' 'adam,run_4/train' 'adam,run_4/validation' 'adam,run_5/train' 'adam,run_5/validation' 'rmsprop,run_1/train' 'rmsprop,run_1/validation' 'rmsprop,run_2/train' 'rmsprop,run_2/validation' 'rmsprop,run_3/train' 'rmsprop,run_3/validation' 'rmsprop,run_4/train' 'rmsprop,run_4/validation' 'rmsprop,run_5/train' 'rmsprop,run_5/validation' 'sgd,run_1/train' 'sgd,run_1/validation' 'sgd,run_2/train' 'sgd,run_2/validation' 'sgd,run_3/train' 'sgd,run_3/validation' 'sgd,run_4/train' 'sgd,run_4/validation' 'sgd,run_5/train' 'sgd,run_5/validation'] ['epoch_accuracy' 'epoch_loss']
একটি পিভোটেড (ওয়াইড-ফর্ম) ডেটাফ্রেম পাওয়া
আমাদের পরীক্ষা, দুই ট্যাগ ( epoch_loss
এবং epoch_accuracy
) প্রতিটি রান ধাপের একই সেট উপস্থিত হয়। এই এটা সম্ভব একটি "ওয়াইড-ফর্ম" প্রাপ্ত করে তোলে DataFrame
সরাসরি থেকে get_scalars()
ব্যবহার করে pivot=True
শব্দ যুক্তি। ওয়াইড-ফর্ম DataFrame
তার সমস্ত ট্যাগ DataFrame, যা এই এক সহ কিছু ক্ষেত্রে এর সাথে কাজ করা আরও বেশি সুবিধাজনক হয় কলাম হিসেবে অন্তর্ভুক্ত হয়েছে।
যাইহোক, হুঁশিয়ার যে সব রানে সমস্ত ট্যাগ জুড়ে পদক্ষেপ মূল্যবোধের অভিন্ন সেট থাকার শর্ত পূরণ না হয় ব্যবহার করে pivot=True
একটি ত্রুটি হয়ে যাবে।
dfw = experiment.get_scalars(pivot=True)
dfw
লক্ষ করুন যে, একটি একক "মান" কলামে পরিবর্তে, ওয়াইড-ফর্ম DataFrame স্পষ্টভাবে তার কলাম হিসাবে দুই ট্যাগ (মেট্রিক্স) রয়েছে: epoch_accuracy
এবং epoch_loss
।
CSV হিসাবে DataFrame সংরক্ষণ করা হচ্ছে
pandas.DataFrame
সঙ্গে ভাল ইনটেরোপিরাবিলিটি হয়েছে যে CSV । আপনি এটি একটি স্থানীয় CSV ফাইল হিসাবে সংরক্ষণ করতে পারেন এবং পরে আবার লোড করতে পারেন। উদাহরণ স্বরূপ:
csv_path = '/tmp/tb_experiment_1.csv'
dfw.to_csv(csv_path, index=False)
dfw_roundtrip = pd.read_csv(csv_path)
pd.testing.assert_frame_equal(dfw_roundtrip, dfw)
কাস্টম ভিজ্যুয়ালাইজেশন এবং পরিসংখ্যান বিশ্লেষণ সম্পাদন
# Filter the DataFrame to only validation data, which is what the subsequent
# analyses and visualization will be focused on.
dfw_validation = dfw[dfw.run.str.endswith("/validation")]
# Get the optimizer value for each row of the validation DataFrame.
optimizer_validation = dfw_validation.run.apply(lambda run: run.split(",")[0])
plt.figure(figsize=(16, 6))
plt.subplot(1, 2, 1)
sns.lineplot(data=dfw_validation, x="step", y="epoch_accuracy",
hue=optimizer_validation).set_title("accuracy")
plt.subplot(1, 2, 2)
sns.lineplot(data=dfw_validation, x="step", y="epoch_loss",
hue=optimizer_validation).set_title("loss")
Text(0.5, 1.0, 'loss')
উপরের প্লটগুলি বৈধতা সঠিকতা এবং বৈধতা ক্ষতির সময়সূচী দেখায়। প্রতিটি বক্ররেখা একটি অপটিমাইজার টাইপের অধীনে 5 রান জুড়ে গড় দেখায়। একটি বিল্ট-ইন বৈশিষ্ট্য ধন্যবাদ seaborn.lineplot()
, প্রতিটি বক্ররেখা এ অর্থও প্রায় প্রদর্শন ± 1 স্ট্যানডার্ড ডেভিয়েশন, যা আমাদের এই রেখাচিত্র তারতম্য এবং তিনটি অপটিমাইজার ধরনের মধ্যে পার্থক্য তাৎপর্য সুস্পষ্ট ইন্দ্রিয় দেয়। পরিবর্তনশীলতার এই দৃশ্যটি এখনও TensorBoard এর GUI তে সমর্থিত নয়।
আমরা এই অনুমানটি অধ্যয়ন করতে চাই যে ন্যূনতম বৈধতা ক্ষতি "অ্যাডাম", "আরএমএসপ্রপ" এবং "এসজিডি" অপ্টিমাইজারের মধ্যে উল্লেখযোগ্যভাবে পৃথক। সুতরাং আমরা প্রতিটি অপটিমাইজারের অধীনে ন্যূনতম বৈধতা ক্ষতির জন্য একটি ডেটাফ্রেম বের করি।
তারপরে আমরা ন্যূনতম বৈধতা ক্ষতির পার্থক্যটি কল্পনা করতে একটি বক্সপ্লট তৈরি করি।
adam_min_val_loss = dfw_validation.loc[optimizer_validation=="adam", :].groupby(
"run", as_index=False).agg({"epoch_loss": "min"})
rmsprop_min_val_loss = dfw_validation.loc[optimizer_validation=="rmsprop", :].groupby(
"run", as_index=False).agg({"epoch_loss": "min"})
sgd_min_val_loss = dfw_validation.loc[optimizer_validation=="sgd", :].groupby(
"run", as_index=False).agg({"epoch_loss": "min"})
min_val_loss = pd.concat([adam_min_val_loss, rmsprop_min_val_loss, sgd_min_val_loss])
sns.boxplot(data=min_val_loss, y="epoch_loss",
x=min_val_loss.run.apply(lambda run: run.split(",")[0]))
<matplotlib.axes._subplots.AxesSubplot at 0x7f5e017c8150>
# Perform pairwise comparisons between the minimum validation losses
# from the three optimizers.
_, p_adam_vs_rmsprop = stats.ttest_ind(
adam_min_val_loss["epoch_loss"],
rmsprop_min_val_loss["epoch_loss"])
_, p_adam_vs_sgd = stats.ttest_ind(
adam_min_val_loss["epoch_loss"],
sgd_min_val_loss["epoch_loss"])
_, p_rmsprop_vs_sgd = stats.ttest_ind(
rmsprop_min_val_loss["epoch_loss"],
sgd_min_val_loss["epoch_loss"])
print("adam vs. rmsprop: p = %.4f" % p_adam_vs_rmsprop)
print("adam vs. sgd: p = %.4f" % p_adam_vs_sgd)
print("rmsprop vs. sgd: p = %.4f" % p_rmsprop_vs_sgd)
adam vs. rmsprop: p = 0.0244 adam vs. sgd: p = 0.9749 rmsprop vs. sgd: p = 0.0135
অতএব, 0.05 এর তাত্পর্য স্তরে, আমাদের বিশ্লেষণ আমাদের অনুমানকে নিশ্চিত করে যে আমাদের পরীক্ষায় অন্তর্ভুক্ত অন্য দুটি অপ্টিমাইজারের তুলনায় আরএমএসপ্রপ অপ্টিমাইজারে ন্যূনতম বৈধতা ক্ষতি উল্লেখযোগ্যভাবে বেশি (অর্থাৎ, খারাপ)।
সংক্ষেপে বলা যায়, এই টিউটোরিয়াল যেমন স্কালে ডেটা অ্যাক্সেস করতে কিভাবে একটি উদাহরণ প্রদান করে panda.DataFrame
TensorBoard.dev এর থেকে। এটা তোলে নমনীয় ও শক্তিশালী বিশ্লেষণ এবং কল্পনা আপনার সাথে কি করতে পারেন ধরনের প্রমান DataFrame
গুলি।