sci_tail

opis :

Zestaw danych SciTail to zestaw danych implikacji utworzony na podstawie egzaminów z przedmiotów ścisłych wielokrotnego wyboru i zdań internetowych. Każde pytanie i wybór prawidłowej odpowiedzi są przekształcane w asertywne stwierdzenie w celu sformułowania hipotezy. Wyszukiwanie informacji służy do uzyskiwania odpowiedniego tekstu z dużego zbioru zdań internetowych, a zdania te są używane jako przesłanka P. Adnotacja takiej pary przesłanka-hipoteza jest pozyskiwana w ramach crowdsourcingu jako wsparcie (pociąga) lub nie (neutralne), aby aby utworzyć zestaw danych SciTail. Zbiór danych zawiera 27 026 przykładów z 10 101 przykładami z etykietą pociągającą i 16 925 z etykietą neutralną.

Dodatkowa dokumentacja : Przeglądaj dokumenty z kodem na
Strona główna : https://allenai.org/data/scitail
Kod źródłowy : tfds.datasets.sci_tail.Builder
Wersje :
- 1.0.0 (domyślnie): Wersja początkowa.
Rozmiar pliku do pobrania : 13.52 MiB
Rozmiar zestawu danych : 6.01 MiB
Automatyczne buforowanie ( dokumentacja ): Tak
Podziały :

Podział	Przykłady
`'test'`	2126
`'train'`	23097
`'validation'`	1304

Struktura funkcji :

FeaturesDict({
    'hypothesis': Text(shape=(), dtype=string),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'premise': Text(shape=(), dtype=string),
})

Dokumentacja funkcji :

Funkcja	Klasa	Typ D
	FunkcjeDict
hipoteza	Tekst	strunowy
etykieta	Etykieta klasy	int64
przesłanka	Tekst	strunowy

Klucze nadzorowane (Zobacz dokument as_supervised ): None
Rysunek ( tfds.show_examples ): Nieobsługiwany.
Przykłady ( tfds.as_dataframe ):

Cytat :

@inproceedings{khot2018scitail,
    title={Scitail: A textual entailment dataset from science question answering},
    author={Khot, Tushar and Sabharwal, Ashish and Clark, Peter},
    booktitle={Proceedings of the 32th AAAI Conference on Artificial Intelligence (AAAI 2018)},
    url = "http://ai2-website.s3.amazonaws.com/publications/scitail-aaai-2018_cameraready.pdf",
    year={2018}
}