- Описание :
databricks-dolly-15k
— это набор данных с открытым исходным кодом, содержащий записи следования инструкциям, используемые при обучении databricks/dolly-v2-12b, который был создан тысячами сотрудников Databricks в нескольких поведенческих категориях, изложенных в документе InstructGPT , включая мозговой штурм, классификацию, закрытый контроль качества, генерация, извлечение информации, открытый контроль качества и обобщение.
Этот набор данных можно использовать для любых целей, академических или коммерческих, в соответствии с условиями непортированной лицензии Creative Commons Attribution-ShareAlike 3.0 .
Домашняя страница : https://github.com/databrickslabs/dolly .
Исходный код :
tfds.datasets.databricks_dolly.Builder
.Версии :
-
1.0.0
(по умолчанию): первоначальный выпуск.
-
Размер загрузки :
12.60 MiB
Размер набора данных :
12.69 MiB
Автокэширование ( документация ): Да
Расколы :
Расколоть | Примеры |
---|---|
'train' | 15 014 |
- Структура функции :
FeaturesDict({
'category': Text(shape=(), dtype=string),
'context': Text(shape=(), dtype=string),
'instruction': Text(shape=(), dtype=string),
'response': Text(shape=(), dtype=string),
})
- Функциональная документация :
Особенность | Сорт | Форма | Дтип | Описание |
---|---|---|---|---|
ВозможностиDict | ||||
категория | Текст | нить | ||
контекст | Текст | нить | ||
инструкция | Текст | нить | ||
ответ | Текст | нить |
Контролируемые ключи (см. документ
as_supervised
):None
Рисунок ( tfds.show_examples ): не поддерживается.
Примеры ( tfds.as_dataframe ):
- Цитата :