- Описание :
Этот набор данных состоит из 6642 пар вопросов/ответов. На вопросы должен ответить Freebase, большой граф знаний. Вопросы в основном сосредоточены вокруг одного именованного объекта. Вопросы популярны в Интернете (по крайней мере, в 2013 году).
Дополнительная документация : изучить документы с кодом
Домашняя страница : https://worksheets.codalab.org/worksheets/0xba659fe363cb46e7a505c5b6a774dc8a
Исходный код :
tfds.question_answering.WebQuestions
Версии :
-
1.0.0
(по умолчанию): нет примечаний к выпуску.
-
Размер загрузки :
1.21 MiB
Размер набора данных :
983.88 KiB
Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'test' | 2032 |
'train' | 3778 |
- Структура функции :
FeaturesDict({
'answers': Sequence(Text(shape=(), dtype=string)),
'question': Text(shape=(), dtype=string),
'url': Text(shape=(), dtype=string),
})
- Документация по функциям :
Особенность | Учебный класс | Форма | Dтип | Описание |
---|---|---|---|---|
ОсобенностиDict | ||||
ответы | Последовательность (текст) | (Никто,) | нить | |
вопрос | Текст | нить | ||
URL | Текст | нить |
Ключи под наблюдением (см . документ
as_supervised
):None
Рисунок ( tfds.show_examples ): не поддерживается.
Примеры ( tfds.as_dataframe ):
- Цитата :
@inproceedings{berant-etal-2013-semantic,
title = "Semantic Parsing on {F}reebase from Question-Answer Pairs",
author = "Berant, Jonathan and
Chou, Andrew and
Frostig, Roy and
Liang, Percy",
booktitle = "Proceedings of the 2013 Conference on Empirical Methods in Natural Language Processing",
month = oct,
year = "2013",
address = "Seattle, Washington, USA",
publisher = "Association for Computational Linguistics",
url = "https://www.aclweb.org/anthology/D13-1160",
pages = "1533--1544",
}