- विवरण :
iNaturalist डेटासेट 2021 में कुल 10,000 प्रजातियाँ हैं। संपूर्ण प्रशिक्षण डेटासेट में लगभग 2.7M छवियां हैं। डेटासेट को अधिक सुलभ बनाने के लिए हमने कुल 500K छवियों के लिए प्रति प्रजाति 50 उदाहरणों के साथ एक "मिनी" प्रशिक्षण डेटासेट भी बनाया है। पूर्ण प्रशिक्षण train
स्प्लिट mini
स्प्लिट के साथ ओवरलैप होता है। वैल सेट में प्रत्येक प्रजाति के लिए 10 सत्यापन छवियां (कुल 100K) शामिल हैं। public_test
स्प्लिट (जमीनी सच्चाई लेबल के बिना) में कुल 500,000 परीक्षण छवियां हैं।
मुखपृष्ठ : https://github.com/visipedia/inat_comp/tree/master/2021
स्रोत कोड :
tfds.image_classification.i_naturalist2021.INaturalist2021
संस्करण :
-
1.0.0
: प्रारंभिक रिलीज. -
2.0.0
: अद्यतन: क्लास सूचकांक JSON ट्रेन फ़ाइल में क्रम का पालन करते हैं। -
2.0.1
(डिफ़ॉल्ट): अद्यतन: JSON फ़ाइलों में दिए गए उदाहरण आईडी को शामिल करें।
-
डाउनलोड आकार :
316.54 GiB
डेटासेट का आकार :
318.45 GiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'mini' | 500,000 |
'test' | 500,000 |
'train' | 2,686,843 |
'val' | 100,000 |
- फ़ीचर संरचना :
FeaturesDict({
'file_id': Text(shape=(), dtype=string),
'id': Scalar(shape=(), dtype=int64),
'image': Image(shape=(None, None, 3), dtype=uint8),
'label': ClassLabel(shape=(), dtype=int64, num_classes=10000),
'supercategory': ClassLabel(shape=(), dtype=int64, num_classes=11),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीप्रकार | विवरण |
---|---|---|---|---|
फीचर्सडिक्ट | ||||
फ़ाइल_आईडी | मूलपाठ | डोरी | ||
पहचान | अदिश | int64 | ||
छवि | छवि | (कोई नहीं, कोई नहीं, 3) | uint8 | |
लेबल | क्लास लेबल | int64 | ||
सुपरश्रेणी | क्लास लेबल | int64 |
पर्यवेक्षित कुंजियाँ (
as_supervised
doc देखें):('image', 'label')
चित्र ( tfds.show_examples ):
- उदाहरण ( tfds.as_dataframe ):
- उद्धरण :
\
@misc{inaturalist21,
Howpublished = {~\url{https://github.com/visipedia/inat_comp/tree/master/2021} },
Title = { {iNaturalist} 2021 competition dataset.},
Year = {2021},
key = { {iNaturalist} 2021 competition dataset},
}