TensorFlow Transform, TensorFlow के साथ डेटा प्रीप्रोसेसिंग के लिए एक लाइब्रेरी है। tf.Transform
उस डेटा के लिए उपयोगी है जिसके लिए पूर्ण-पास की आवश्यकता होती है, जैसे:
- माध्य और मानक विचलन द्वारा इनपुट मान को सामान्यीकृत करें।
- सभी इनपुट मानों पर एक शब्दावली उत्पन्न करके स्ट्रिंग्स को पूर्णांकों में बदलें।
- देखे गए डेटा वितरण के आधार पर फ़्लोट को बकेट में निर्दिष्ट करके पूर्णांक में परिवर्तित करें।
TensorFlow में एकल उदाहरण या उदाहरणों के बैच में हेरफेर के लिए अंतर्निहित समर्थन है। tf.Transform
उदाहरण डेटा पर पूर्ण-पास का समर्थन करने के लिए इन क्षमताओं का विस्तार करता है।
tf.Transform
का आउटपुट प्रशिक्षण और सेवा के लिए उपयोग करने के लिए TensorFlow ग्राफ़ के रूप में निर्यात किया जाता है। प्रशिक्षण और सेवा दोनों के लिए एक ही ग्राफ का उपयोग करने से विषमता को रोका जा सकता है क्योंकि दोनों चरणों में समान परिवर्तन लागू होते हैं।
tf.Transform
के परिचय के लिए, TFX ( लिंक ) पर TFX देव समिट टॉक का tf.Transform
अनुभाग देखें।
इंस्टालेशन
tensorflow-transform
PyPI पैकेज tf.Transform
स्थापित करने का अनुशंसित तरीका है:
pip install tensorflow-transform
स्रोत से टीएफटी बनाएं
स्रोत से निर्माण करने के लिए निम्नलिखित चरणों का पालन करें: कमांड चलाकर एक वर्चुअल वातावरण बनाएं
python3 -m venv <virtualenv_name>
source <virtualenv_name>/bin/activate
pip3 install setuptools wheel
git clone https://github.com/tensorflow/transform.git
cd transform
python3 setup.py bdist_wheel
यह dist निर्देशिका में TFT व्हील का निर्माण करेगा। डिस्ट डायरेक्टरी से व्हील को स्थापित करने के लिए कमांड चलाएँ
cd dist
pip3 install tensorflow_transform-<version>-py3-none-any.whl
रात्रिकालीन पैकेज
टीएफटी Google क्लाउड पर https://pypi-nightly.tensorflow.org पर रात्रिकालीन पैकेज भी होस्ट करता है। नवीनतम रात्रिकालीन पैकेज स्थापित करने के लिए, कृपया निम्नलिखित कमांड का उपयोग करें:
pip install --extra-index-url https://pypi-nightly.tensorflow.org/simple tensorflow-transform
यह TFT की प्रमुख निर्भरताओं जैसे कि TensorFlow मेटाडेटा (TFMD), TFX बेसिक शेयर्ड लाइब्रेरीज़ (TFX-BSL) के लिए रात्रिकालीन पैकेज स्थापित करेगा।
उल्लेखनीय निर्भरताएँ
TensorFlow आवश्यक है.
अपाचे बीम आवश्यक है; यह वह तरीका है जिससे कुशल वितरित संगणना समर्थित है। डिफ़ॉल्ट रूप से, अपाचे बीम स्थानीय मोड में चलता है लेकिन Google क्लाउड डेटाफ़्लो और अन्य अपाचे बीम धावकों का उपयोग करके वितरित मोड में भी चलाया जा सकता है।
अपाचे एरो भी आवश्यक है. टीएफटी वेक्टरकृत सुन्न कार्यों का उपयोग करने के लिए आंतरिक रूप से डेटा का प्रतिनिधित्व करने के लिए एरो का उपयोग करता है।
संगत संस्करण
निम्न तालिका tf.Transform
पैकेज संस्करण है जो एक दूसरे के साथ संगत हैं। यह हमारे परीक्षण ढांचे द्वारा निर्धारित किया जाता है, लेकिन अन्य परीक्षण न किए गए संयोजन भी काम कर सकते हैं।
टेंसरफ़्लो-परिवर्तन | अपाचे-बीम[जीसीपी] | पायरो | टेंसरफ्लो | टेंसरफ़्लो-मेटाडेटा | tfx-बीएसएल |
---|---|---|---|---|---|
गिटहब मास्टर | 2.47.0 | 10.0.0 | रात्रिकालीन (2.x) | 1.15.0 | 1.15.1 |
1.15.0 | 2.47.0 | 10.0.0 | 2.15 | 1.15.0 | 1.15.1 |
1.14.0 | 2.47.0 | 10.0.0 | 2.13 | 1.14.0 | 1.14.0 |
1.13.0 | 2.41.0 | 6.0.0 | 2.12 | 1.13.1 | 1.13.0 |
1.12.0 | 2.41.0 | 6.0.0 | 2.11 | 1.12.0 | 1.12.0 |
1.11.0 | 2.41.0 | 6.0.0 | 1.15.5/2.10 | 1.11.0 | 1.11.0 |
1.10.0 | 2.40.0 | 6.0.0 | 1.15.5/2.9 | 1.10.0 | 1.10.0 |
1.9.0 | 2.38.0 | 5.0.0 | 1.15.5/2.9 | 1.9.0 | 1.9.0 |
1.8.0 | 2.38.0 | 5.0.0 | 1.15.5/2.8 | 1.8.0 | 1.8.0 |
1.7.0 | 2.36.0 | 5.0.0 | 1.15.5/2.8 | 1.7.0 | 1.7.0 |
1.6.1 | 2.35.0 | 5.0.0 | 1.15.5/2.8 | 1.6.0 | 1.6.0 |
1.6.0 | 2.35.0 | 5.0.0 | 1.15.5/2.7 | 1.6.0 | 1.6.0 |
1.5.0 | 2.34.0 | 5.0.0 | 1.15.2/2.7 | 1.5.0 | 1.5.0 |
1.4.1 | 2.33.0 | 4.0.1 | 1.15.2/2.6 | 1.4.0 | 1.4.0 |
1.4.0 | 2.33.0 | 4.0.1 | 1.15.2/2.6 | 1.4.0 | 1.4.0 |
1.3.0 | 2.31.0 | 2.0.0 | 1.15.2/2.6 | 1.2.0 | 1.3.0 |
1.2.0 | 2.31.0 | 2.0.0 | 1.15.2/2.5 | 1.2.0 | 1.2.0 |
1.1.1 | 2.29.0 | 2.0.0 | 1.15.2/2.5 | 1.1.0 | 1.1.1 |
1.1.0 | 2.29.0 | 2.0.0 | 1.15.2/2.5 | 1.1.0 | 1.1.0 |
1.0.0 | 2.29.0 | 2.0.0 | 1.15/2.5 | 1.0.0 | 1.0.0 |
0.30.0 | 2.28.0 | 2.0.0 | 1.15/2.4 | 0.30.0 | 0.30.0 |
0.29.0 | 2.28.0 | 2.0.0 | 1.15/2.4 | 0.29.0 | 0.29.0 |
0.28.0 | 2.28.0 | 2.0.0 | 1.15/2.4 | 0.28.0 | 0.28.1 |
0.27.0 | 2.27.0 | 2.0.0 | 1.15/2.4 | 0.27.0 | 0.27.0 |
0.26.0 | 2.25.0 | 0.17.0 | 1.15/2.3 | 0.26.0 | 0.26.0 |
0.25.0 | 2.25.0 | 0.17.0 | 1.15/2.3 | 0.25.0 | 0.25.0 |
0.24.1 | 2.24.0 | 0.17.0 | 1.15/2.3 | 0.24.0 | 0.24.1 |
0.24.0 | 2.23.0 | 0.17.0 | 1.15/2.3 | 0.24.0 | 0.24.0 |
0.23.0 | 2.23.0 | 0.17.0 | 1.15/2.3 | 0.23.0 | 0.23.0 |
0.22.0 | 2.20.0 | 0.16.0 | 1.15/2.2 | 0.22.0 | 0.22.0 |
0.21.2 | 2.17.0 | 0.15.0 | 1.15/2.1 | 0.21.0 | 0.21.3 |
0.21.0 | 2.17.0 | 0.15.0 | 1.15/2.1 | 0.21.0 | 0.21.0 |
0.15.0 | 2.16.0 | 0.14.0 | 1.15/2.0 | 0.15.0 | 0.15.0 |
0.14.0 | 2.14.0 | 0.14.0 | 1.14 | 0.14.0 | एन/ए |
0.13.0 | 2.11.0 | एन/ए | 1.13 | 0.12.1 | एन/ए |
0.12.0 | 2.10.0 | एन/ए | 1.12 | 0.12.0 | एन/ए |
0.11.0 | 2.8.0 | एन/ए | 1.11 | 0.9.0 | एन/ए |
0.9.0 | 2.6.0 | एन/ए | 1.9 | 0.9.0 | एन/ए |
0.8.0 | 2.5.0 | एन/ए | 1.8 | एन/ए | एन/ए |
0.6.0 | 2.4.0 | एन/ए | 1.6 | एन/ए | एन/ए |
0.5.0 | 2.3.0 | एन/ए | 1.5 | एन/ए | एन/ए |
0.4.0 | 2.2.0 | एन/ए | 1.4 | एन/ए | एन/ए |
0.3.1 | 2.1.1 | एन/ए | 1.3 | एन/ए | एन/ए |
0.3.0 | 2.1.1 | एन/ए | 1.3 | एन/ए | एन/ए |
0.1.10 | 2.0.0 | एन/ए | 1.0 | एन/ए | एन/ए |
प्रश्न
कृपया टेंसरफ़्लो-ट्रांसफ़ॉर्म टैग का उपयोग करके tf.Transform
से स्टैक ओवरफ़्लो के साथ काम करने के बारे में कोई भी प्रश्न पूछें।