- Açıklama :
databricks-dolly-15k
binlerce Databricks çalışanı tarafından beyin fırtınası, sınıflandırma dahil olmak üzere InstructGPT belgesinde ana hatları verilen davranış kategorilerinin birçoğunda oluşturulan , databricks/dolly-v2-12b eğitiminde kullanılan talimat takip kayıtlarının açık kaynaklı bir veri kümesidir. kapalı QA, oluşturma, bilgi çıkarma, açık QA ve özetleme.
Bu veri kümesi , Creative Commons Atıf-AynıPaylaş 3.0 Aktarılmamış Lisans koşulları kapsamında akademik veya ticari herhangi bir amaç için kullanılabilir.
Ana sayfa : https://github.com/databrickslabs/dolly
Kaynak kodu :
tfds.datasets.databricks_dolly.Builder
Sürümler :
-
1.0.0
(varsayılan): İlk sürüm.
-
İndirme boyutu :
12.60 MiB
Veri kümesi boyutu :
12.69 MiB
Otomatik önbelleğe alınmış ( belgeler ): Evet
Bölünmeler :
Bölmek | Örnekler |
---|---|
'train' | 15.014 |
- Özellik yapısı :
FeaturesDict({
'category': Text(shape=(), dtype=string),
'context': Text(shape=(), dtype=string),
'instruction': Text(shape=(), dtype=string),
'response': Text(shape=(), dtype=string),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
kategori | Metin | sicim | ||
bağlam | Metin | sicim | ||
talimat | Metin | sicim | ||
cevap | Metin | sicim |
Denetlenen anahtarlar (
as_supervised
belgesine bakın):None
Şekil ( tfds.show_examples ): Desteklenmiyor.
Örnekler ( tfds.as_dataframe ):
- Alıntı :