- opis :
Zestaw danych SciTail to zestaw danych implikacji utworzony na podstawie egzaminów z przedmiotów ścisłych wielokrotnego wyboru i zdań internetowych. Każde pytanie i wybór prawidłowej odpowiedzi są przekształcane w asertywne stwierdzenie w celu sformułowania hipotezy. Wyszukiwanie informacji służy do uzyskiwania odpowiedniego tekstu z dużego zbioru zdań internetowych, a zdania te są używane jako przesłanka P. Adnotacja takiej pary przesłanka-hipoteza jest pozyskiwana w ramach crowdsourcingu jako wsparcie (pociąga) lub nie (neutralne), aby aby utworzyć zestaw danych SciTail. Zbiór danych zawiera 27 026 przykładów z 10 101 przykładami z etykietą pociągającą i 16 925 z etykietą neutralną.
Dodatkowa dokumentacja : Przeglądaj dokumenty z kodem na
Strona główna : https://allenai.org/data/scitail
Kod źródłowy :
tfds.datasets.sci_tail.Builder
Wersje :
-
1.0.0
(domyślnie): Wersja początkowa.
-
Rozmiar pliku do pobrania :
13.52 MiB
Rozmiar zestawu danych :
6.01 MiB
Automatyczne buforowanie ( dokumentacja ): Tak
Podziały :
Podział | Przykłady |
---|---|
'test' | 2126 |
'train' | 23097 |
'validation' | 1304 |
- Struktura funkcji :
FeaturesDict({
'hypothesis': Text(shape=(), dtype=string),
'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
'premise': Text(shape=(), dtype=string),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształtować się | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
hipoteza | Tekst | strunowy | ||
etykieta | Etykieta klasy | int64 | ||
przesłanka | Tekst | strunowy |
Klucze nadzorowane (Zobacz dokument
as_supervised
):None
Rysunek ( tfds.show_examples ): Nieobsługiwany.
Przykłady ( tfds.as_dataframe ):
- Cytat :
@inproceedings{khot2018scitail,
title={Scitail: A textual entailment dataset from science question answering},
author={Khot, Tushar and Sabharwal, Ashish and Clark, Peter},
booktitle={Proceedings of the 32th AAAI Conference on Artificial Intelligence (AAAI 2018)},
url = "http://ai2-website.s3.amazonaws.com/publications/scitail-aaai-2018_cameraready.pdf",
year={2018}
}