टेंसरफ़्लो ट्रांसफ़ॉर्म

GitHub पर देखें

TensorFlow Transform, TensorFlow के साथ डेटा प्रीप्रोसेसिंग के लिए एक लाइब्रेरी है। tf.Transform उस डेटा के लिए उपयोगी है जिसके लिए पूर्ण-पास की आवश्यकता होती है, जैसे:

  • माध्य और मानक विचलन द्वारा इनपुट मान को सामान्यीकृत करें।
  • सभी इनपुट मानों पर एक शब्दावली उत्पन्न करके स्ट्रिंग्स को पूर्णांकों में बदलें।
  • देखे गए डेटा वितरण के आधार पर फ़्लोट को बकेट में निर्दिष्ट करके पूर्णांक में परिवर्तित करें।

TensorFlow में एकल उदाहरण या उदाहरणों के बैच में हेरफेर के लिए अंतर्निहित समर्थन है। tf.Transform उदाहरण डेटा पर पूर्ण-पास का समर्थन करने के लिए इन क्षमताओं का विस्तार करता है।

tf.Transform का आउटपुट प्रशिक्षण और सेवा के लिए उपयोग करने के लिए TensorFlow ग्राफ़ के रूप में निर्यात किया जाता है। प्रशिक्षण और सेवा दोनों के लिए एक ही ग्राफ का उपयोग करने से विषमता को रोका जा सकता है क्योंकि दोनों चरणों में समान परिवर्तन लागू होते हैं।

tf.Transform के परिचय के लिए, TFX ( लिंक ) पर TFX देव समिट टॉक का tf.Transform अनुभाग देखें।

इंस्टालेशन

tensorflow-transform PyPI पैकेज tf.Transform स्थापित करने का अनुशंसित तरीका है:

pip install tensorflow-transform

स्रोत से टीएफटी बनाएं

स्रोत से निर्माण करने के लिए निम्नलिखित चरणों का पालन करें: कमांड चलाकर एक वर्चुअल वातावरण बनाएं

python3 -m venv <virtualenv_name>
source <virtualenv_name>/bin/activate
pip3 install setuptools wheel
git clone https://github.com/tensorflow/transform.git
cd transform
python3 setup.py bdist_wheel

यह dist निर्देशिका में TFT व्हील का निर्माण करेगा। डिस्ट डायरेक्टरी से व्हील को स्थापित करने के लिए कमांड चलाएँ

cd dist
pip3 install tensorflow_transform-<version>-py3-none-any.whl

रात्रिकालीन पैकेज

टीएफटी Google क्लाउड पर https://pypi-nightly.tensorflow.org पर रात्रिकालीन पैकेज भी होस्ट करता है। नवीनतम रात्रिकालीन पैकेज स्थापित करने के लिए, कृपया निम्नलिखित कमांड का उपयोग करें:

pip install --extra-index-url https://pypi-nightly.tensorflow.org/simple tensorflow-transform

यह TFT की प्रमुख निर्भरताओं जैसे कि TensorFlow मेटाडेटा (TFMD), TFX बेसिक शेयर्ड लाइब्रेरीज़ (TFX-BSL) के लिए रात्रिकालीन पैकेज स्थापित करेगा।

उल्लेखनीय निर्भरताएँ

TensorFlow आवश्यक है.

अपाचे बीम आवश्यक है; यह वह तरीका है जिससे कुशल वितरित संगणना समर्थित है। डिफ़ॉल्ट रूप से, अपाचे बीम स्थानीय मोड में चलता है लेकिन Google क्लाउड डेटाफ़्लो और अन्य अपाचे बीम धावकों का उपयोग करके वितरित मोड में भी चलाया जा सकता है।

अपाचे एरो भी आवश्यक है. टीएफटी वेक्टरकृत सुन्न कार्यों का उपयोग करने के लिए आंतरिक रूप से डेटा का प्रतिनिधित्व करने के लिए एरो का उपयोग करता है।

संगत संस्करण

निम्न तालिका tf.Transform पैकेज संस्करण है जो एक दूसरे के साथ संगत हैं। यह हमारे परीक्षण ढांचे द्वारा निर्धारित किया जाता है, लेकिन अन्य परीक्षण न किए गए संयोजन भी काम कर सकते हैं।

टेंसरफ़्लो-परिवर्तन अपाचे-बीम[जीसीपी] पायरो टेंसरफ्लो टेंसरफ़्लो-मेटाडेटा tfx-बीएसएल
गिटहब मास्टर 2.47.0 10.0.0 रात्रिकालीन (2.x) 1.15.0 1.15.1
1.15.0 2.47.0 10.0.0 2.15 1.15.0 1.15.1
1.14.0 2.47.0 10.0.0 2.13 1.14.0 1.14.0
1.13.0 2.41.0 6.0.0 2.12 1.13.1 1.13.0
1.12.0 2.41.0 6.0.0 2.11 1.12.0 1.12.0
1.11.0 2.41.0 6.0.0 1.15.5/2.10 1.11.0 1.11.0
1.10.0 2.40.0 6.0.0 1.15.5/2.9 1.10.0 1.10.0
1.9.0 2.38.0 5.0.0 1.15.5/2.9 1.9.0 1.9.0
1.8.0 2.38.0 5.0.0 1.15.5/2.8 1.8.0 1.8.0
1.7.0 2.36.0 5.0.0 1.15.5/2.8 1.7.0 1.7.0
1.6.1 2.35.0 5.0.0 1.15.5/2.8 1.6.0 1.6.0
1.6.0 2.35.0 5.0.0 1.15.5/2.7 1.6.0 1.6.0
1.5.0 2.34.0 5.0.0 1.15.2/2.7 1.5.0 1.5.0
1.4.1 2.33.0 4.0.1 1.15.2/2.6 1.4.0 1.4.0
1.4.0 2.33.0 4.0.1 1.15.2/2.6 1.4.0 1.4.0
1.3.0 2.31.0 2.0.0 1.15.2/2.6 1.2.0 1.3.0
1.2.0 2.31.0 2.0.0 1.15.2/2.5 1.2.0 1.2.0
1.1.1 2.29.0 2.0.0 1.15.2/2.5 1.1.0 1.1.1
1.1.0 2.29.0 2.0.0 1.15.2/2.5 1.1.0 1.1.0
1.0.0 2.29.0 2.0.0 1.15/2.5 1.0.0 1.0.0
0.30.0 2.28.0 2.0.0 1.15/2.4 0.30.0 0.30.0
0.29.0 2.28.0 2.0.0 1.15/2.4 0.29.0 0.29.0
0.28.0 2.28.0 2.0.0 1.15/2.4 0.28.0 0.28.1
0.27.0 2.27.0 2.0.0 1.15/2.4 0.27.0 0.27.0
0.26.0 2.25.0 0.17.0 1.15/2.3 0.26.0 0.26.0
0.25.0 2.25.0 0.17.0 1.15/2.3 0.25.0 0.25.0
0.24.1 2.24.0 0.17.0 1.15/2.3 0.24.0 0.24.1
0.24.0 2.23.0 0.17.0 1.15/2.3 0.24.0 0.24.0
0.23.0 2.23.0 0.17.0 1.15/2.3 0.23.0 0.23.0
0.22.0 2.20.0 0.16.0 1.15/2.2 0.22.0 0.22.0
0.21.2 2.17.0 0.15.0 1.15/2.1 0.21.0 0.21.3
0.21.0 2.17.0 0.15.0 1.15/2.1 0.21.0 0.21.0
0.15.0 2.16.0 0.14.0 1.15/2.0 0.15.0 0.15.0
0.14.0 2.14.0 0.14.0 1.14 0.14.0 एन/ए
0.13.0 2.11.0 एन/ए 1.13 0.12.1 एन/ए
0.12.0 2.10.0 एन/ए 1.12 0.12.0 एन/ए
0.11.0 2.8.0 एन/ए 1.11 0.9.0 एन/ए
0.9.0 2.6.0 एन/ए 1.9 0.9.0 एन/ए
0.8.0 2.5.0 एन/ए 1.8 एन/ए एन/ए
0.6.0 2.4.0 एन/ए 1.6 एन/ए एन/ए
0.5.0 2.3.0 एन/ए 1.5 एन/ए एन/ए
0.4.0 2.2.0 एन/ए 1.4 एन/ए एन/ए
0.3.1 2.1.1 एन/ए 1.3 एन/ए एन/ए
0.3.0 2.1.1 एन/ए 1.3 एन/ए एन/ए
0.1.10 2.0.0 एन/ए 1.0 एन/ए एन/ए

प्रश्न

कृपया टेंसरफ़्लो-ट्रांसफ़ॉर्म टैग का उपयोग करके tf.Transform से स्टैक ओवरफ़्लो के साथ काम करने के बारे में कोई भी प्रश्न पूछें।