- وصف :
تعتمد مجموعة البيانات هذه بشكل أساسي على مجموعة بيانات AI2D (انظر هنا ).
راجع القسم 4.1 من ورقتنا للتعرف على عملية شرح مجموعة بيانات AI2D-Caption.
الصفحة الرئيسية : https://huggingface.co/datasets/abhayzala/AI2D-Caption
كود المصدر :
tfds.datasets.ai2dcaption.Builder
الإصدارات :
-
1.0.0
(افتراضي): الإصدار الأولي.
-
حجم التحميل :
Unknown size
حجم مجموعة البيانات :
2.01 GiB
التخزين المؤقت التلقائي ( الوثائق ): لا
الإنشقاقات :
ينقسم | أمثلة |
---|---|
'auditor_llm_training_examples' | 30 |
'gpt4v' | 4,903 |
'llava_15' | 4,902 |
'planner_llm_training_examples' | 30 |
'test' | 75 |
- هيكل الميزة :
FeaturesDict({
'caption': Text(shape=(), dtype=string),
'entities': Sequence({
'bounds': BBoxFeature(shape=(4,), dtype=float32),
'cat': ClassLabel(shape=(), dtype=int64, num_classes=10),
'from': Text(shape=(), dtype=string),
'id': Text(shape=(), dtype=string),
'label': Text(shape=(), dtype=string),
'to': Text(shape=(), dtype=string),
'type': ClassLabel(shape=(), dtype=int64, num_classes=5),
}),
'image': Image(shape=(None, None, 3), dtype=uint8, description=The image of the diagram.),
'image_filename': Text(shape=(), dtype=string),
'layout': ClassLabel(shape=(), dtype=int64, num_classes=7),
'relationships': Sequence(Text(shape=(), dtype=string)),
'topic': ClassLabel(shape=(), dtype=int64, num_classes=4),
})
- وثائق الميزة :
ميزة | فصل | شكل | نوع D | وصف |
---|---|---|---|---|
المميزاتDict | ||||
التسمية التوضيحية | نص | خيط | ||
الكيانات | تسلسل | |||
الكيانات/الحدود | ميزة BBox | (4،) | float32 | |
الكيانات/القط | ClassLabel | int64 | ||
الجهات/من | نص | خيط | ||
الكيانات/المعرف | نص | خيط | ||
الكيانات/التسمية | نص | خيط | ||
الكيانات/ إلى | نص | خيط | ||
الكيانات/النوع | ClassLabel | int64 | ||
صورة | صورة | (لا شيء، لا شيء، 3) | uint8 | صورة المخطط. |
image_filename | نص | خيط | اسم ملف الصورة. على سبيل المثال "1337.png" | |
تَخطِيط | ClassLabel | int64 | ||
العلاقات | التسلسل (النص) | (لا أحد،) | خيط | |
عنوان | ClassLabel | int64 |
المفاتيح الخاضعة للإشراف (راجع
as_supervised
doc ):None
الشكل ( tfds.show_examples ):
- أمثلة ( tfds.as_dataframe ):
- الاقتباس :
@inproceedings{Zala2024DiagrammerGPT,
author = {Abhay Zala and Han Lin and Jaemin Cho and Mohit Bansal},
title = {DiagrammerGPT: Generating Open-Domain, Open-Platform Diagrams via LLM Planning},
year = {2024},
booktitle = {COLM},
}