sci_tail

  • opis :

Zestaw danych SciTail to zestaw danych implikacji utworzony na podstawie egzaminów z przedmiotów ścisłych wielokrotnego wyboru i zdań internetowych. Każde pytanie i wybór prawidłowej odpowiedzi są przekształcane w asertywne stwierdzenie w celu sformułowania hipotezy. Wyszukiwanie informacji służy do uzyskiwania odpowiedniego tekstu z dużego zbioru zdań internetowych, a zdania te są używane jako przesłanka P. Adnotacja takiej pary przesłanka-hipoteza jest pozyskiwana w ramach crowdsourcingu jako wsparcie (pociąga) lub nie (neutralne), aby aby utworzyć zestaw danych SciTail. Zbiór danych zawiera 27 026 przykładów z 10 101 przykładami z etykietą pociągającą i 16 925 z etykietą neutralną.

Podział Przykłady
'test' 2126
'train' 23097
'validation' 1304
  • Struktura funkcji :
FeaturesDict({
    'hypothesis': Text(shape=(), dtype=string),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'premise': Text(shape=(), dtype=string),
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształtować się Typ D Opis
FunkcjeDict
hipoteza Tekst strunowy
etykieta Etykieta klasy int64
przesłanka Tekst strunowy
  • Cytat :
@inproceedings{khot2018scitail,
    title={Scitail: A textual entailment dataset from science question answering},
    author={Khot, Tushar and Sabharwal, Ashish and Clark, Peter},
    booktitle={Proceedings of the 32th AAAI Conference on Artificial Intelligence (AAAI 2018)},
    url = "http://ai2-website.s3.amazonaws.com/publications/scitail-aaai-2018_cameraready.pdf",
    year={2018}
}