- Descrizione :
Questo set di dati si basa principalmente sul set di dati AI2D (vedi qui ).
Vedere la sezione 4.1 del nostro documento per il processo di annotazione del set di dati AI2D-Caption.
Home page : https://huggingface.co/datasets/abhayzala/AI2D-Caption
Codice sorgente :
tfds.datasets.ai2dcaption.Builder
Versioni :
-
1.0.0
(impostazione predefinita): versione iniziale.
-
Dimensioni del download :
Unknown size
Dimensione del set di dati :
2.01 GiB
Memorizzazione nella cache automatica ( documentazione ): No
Divide :
Diviso | Esempi |
---|---|
'auditor_llm_training_examples' | 30 |
'gpt4v' | 4.903 |
'llava_15' | 4.902 |
'planner_llm_training_examples' | 30 |
'test' | 75 |
- Struttura delle caratteristiche :
FeaturesDict({
'caption': Text(shape=(), dtype=string),
'entities': Sequence({
'bounds': BBoxFeature(shape=(4,), dtype=float32),
'cat': ClassLabel(shape=(), dtype=int64, num_classes=10),
'from': Text(shape=(), dtype=string),
'id': Text(shape=(), dtype=string),
'label': Text(shape=(), dtype=string),
'to': Text(shape=(), dtype=string),
'type': ClassLabel(shape=(), dtype=int64, num_classes=5),
}),
'image': Image(shape=(None, None, 3), dtype=uint8, description=The image of the diagram.),
'image_filename': Text(shape=(), dtype=string),
'layout': ClassLabel(shape=(), dtype=int64, num_classes=7),
'relationships': Sequence(Text(shape=(), dtype=string)),
'topic': ClassLabel(shape=(), dtype=int64, num_classes=4),
})
- Documentazione delle funzionalità :
Caratteristica | Classe | Forma | Tipo D | Descrizione |
---|---|---|---|---|
CaratteristicheDict | ||||
didascalia | Testo | corda | ||
entità | Sequenza | |||
entità/limiti | Funzione BBox | (4,) | float32 | |
enti/cat | ClassLabel | int64 | ||
entità/da | Testo | corda | ||
entità/id | Testo | corda | ||
entità/etichetta | Testo | corda | ||
entità/a | Testo | corda | ||
entità/tipo | ClassLabel | int64 | ||
immagine | Immagine | (Nessuno, Nessuno, 3) | uint8 | L'immagine del diagramma. |
nome_file_immagine | Testo | corda | Nome file immagine. ad esempio "1337.png" | |
disposizione | ClassLabel | int64 | ||
relazioni | Sequenza(Testo) | (Nessuno,) | corda | |
argomento | ClassLabel | int64 |
Chiavi supervisionate (vedi il documento
as_supervised
):None
Figura ( tfds.show_examples ):
- Esempi ( tfds.as_dataframe ):
- Citazione :
@inproceedings{Zala2024DiagrammerGPT,
author = {Abhay Zala and Han Lin and Jaemin Cho and Mohit Bansal},
title = {DiagrammerGPT: Generating Open-Domain, Open-Platform Diagrams via LLM Planning},
year = {2024},
booktitle = {COLM},
}