- opis :
QUALITY, zestaw danych wielokrotnego wyboru do czytania ze zrozumieniem.
Dostarczamy tylko surową wersję.
Strona główna : https://github.com/nyu-mll/quality
Kod źródłowy :
tfds.datasets.quality.Builder
Wersje :
-
1.0.0
(domyślnie): Wersja początkowa.
-
Rozmiar pliku do pobrania :
17.26 MiB
Automatyczne buforowanie ( dokumentacja ): Tak
Podziały :
Podział | Przykłady |
---|---|
'dev' | 230 |
'test' | 232 |
'train' | 300 |
- Struktura funkcji :
FeaturesDict({
'article': Text(shape=(), dtype=string),
'article_id': Text(shape=(), dtype=string),
'difficults': Sequence(bool),
'gold_labels': Sequence(int32),
'options': Sequence(Sequence(Text(shape=(), dtype=string))),
'question_ids': Sequence(Text(shape=(), dtype=string)),
'questions': Sequence(Text(shape=(), dtype=string)),
'set_unique_id': Text(shape=(), dtype=string),
'source': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
'topic': Text(shape=(), dtype=string),
'url': Text(shape=(), dtype=string),
'writer_id': Text(shape=(), dtype=string),
'writer_labels': Sequence(int32),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształtować się | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
artykuł | Tekst | strunowy | ||
identyfikator_artykułu | Tekst | strunowy | ||
trudności | Sekwencja (Tensor) | (Nic,) | bool | |
złote_etykiety | Sekwencja (Tensor) | (Nic,) | int32 | |
opcje | Sekwencja(Sekwencja(Tekst)) | (Brak, brak) | strunowy | |
identyfikator_pytania | Sekwencja (tekst) | (Nic,) | strunowy | |
pytania | Sekwencja (tekst) | (Nic,) | strunowy | |
set_unique_id | Tekst | strunowy | ||
źródło | Tekst | strunowy | ||
tytuł | Tekst | strunowy | ||
temat | Tekst | strunowy | ||
adres URL | Tekst | strunowy | ||
identyfikator_pisarza | Tekst | strunowy | ||
etykiety_pisarzy | Sekwencja (Tensor) | (Nic,) | int32 |
Klucze nadzorowane (Zobacz dokument
as_supervised
):None
Rysunek ( tfds.show_examples ): Nieobsługiwany.
Cytat :
@article{pang2021quality,
title={ {QuALITY}: Question Answering with Long Input Texts, Yes!},
author={Pang, Richard Yuanzhe and Parrish, Alicia and Joshi, Nitish and Nangia, Nikita and Phang, Jason and Chen, Angelica and Padmakumar, Vishakh and Ma, Johnny and Thompson, Jana and He, He and Bowman, Samuel R.},
journal={arXiv preprint arXiv:2112.08608},
year={2021}
}
quality/raw (domyślna konfiguracja)
Opis konfiguracji : Raw z HTML.
Rozmiar zestawu danych :
22.18 MiB
Przykłady ( tfds.as_dataframe ):
jakość / rozebrana
Opis konfiguracji: Pozbawiony HTML.
Rozmiar zestawu danych :
20.73 MiB
Przykłady ( tfds.as_dataframe ):