com.dmlab

  • وصف :

تحتوي مجموعة بيانات Dmlab على إطارات لاحظها الوكيل الذي يعمل في بيئة DeepMind Lab، والتي تم توضيحها من خلال المسافة بين الوكيل والكائنات المختلفة الموجودة في البيئة. الهدف هو تقييم قدرة النموذج المرئي على التفكير في المسافات من المدخلات المرئية في البيئات ثلاثية الأبعاد. تتكون مجموعة بيانات Dmlab من صور ملونة مقاس 360 × 480 مقسمة إلى 6 فئات. الفئات هي {قريب، بعيد، بعيد جدًا} × {مكافأة إيجابية، مكافأة سلبية} على التوالي.

ينقسم أمثلة
'test' 22,735
'train' 65,550
'validation' 22,628
  • هيكل الميزة :
FeaturesDict({
    'filename': Text(shape=(), dtype=string),
    'image': Image(shape=(360, 480, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=6),
})
  • وثائق الميزة :
ميزة فصل شكل نوع D وصف
المميزاتDict
اسم الملف نص خيط
صورة صورة (360، 480، 3) uint8
ملصق ClassLabel int64

التصور

  • الاقتباس :
@article{zhai2019visual,
        title={The Visual Task Adaptation Benchmark},
        author={Xiaohua Zhai and Joan Puigcerver and Alexander Kolesnikov and
               Pierre Ruyssen and Carlos Riquelme and Mario Lucic and
               Josip Djolonga and Andre Susano Pinto and Maxim Neumann and
               Alexey Dosovitskiy and Lucas Beyer and Olivier Bachem and
               Michael Tschannen and Marcin Michalski and Olivier Bousquet and
               Sylvain Gelly and Neil Houlsby},
                              year={2019},
                              eprint={1910.04867},
                              archivePrefix={arXiv},
                              primaryClass={cs.CV},
                              url = {https://arxiv.org/abs/1910.04867}
                          }