- Deskripsi :
databricks-dolly-15k
adalah kumpulan data sumber terbuka dari catatan mengikuti instruksi yang digunakan dalam pelatihan databricks/dolly-v2-12b yang dihasilkan oleh ribuan karyawan Databricks dalam beberapa kategori perilaku yang diuraikan dalam makalah InstructGPT , termasuk brainstorming, klasifikasi, QA tertutup, pembuatan, ekstraksi informasi, QA terbuka, dan ringkasan.
Kumpulan data ini dapat digunakan untuk tujuan apa pun, baik akademis atau komersial, berdasarkan ketentuan Lisensi Creative Commons Attribution-ShareAlike 3.0 Unported .
Beranda : https://github.com/databrickslabs/dolly
Kode sumber :
tfds.datasets.databricks_dolly.Builder
Versi :
-
1.0.0
(default): Rilis awal.
-
Ukuran unduhan :
12.60 MiB
Ukuran kumpulan data :
12.69 MiB
Cache otomatis ( dokumentasi ): Ya
Perpecahan :
Membelah | Contoh |
---|---|
'train' | 15.014 |
- Struktur fitur :
FeaturesDict({
'category': Text(shape=(), dtype=string),
'context': Text(shape=(), dtype=string),
'instruction': Text(shape=(), dtype=string),
'response': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
Fitur | Kelas | Membentuk | Tipe D | Keterangan |
---|---|---|---|---|
FiturDict | ||||
kategori | Teks | rangkaian | ||
konteks | Teks | rangkaian | ||
petunjuk | Teks | rangkaian | ||
tanggapan | Teks | rangkaian |
Kunci yang diawasi (Lihat dokumen
as_supervised
):None
Gambar ( tfds.show_examples ): Tidak didukung.
Contoh ( tfds.as_dataframe ):
- Kutipan :