- 説明:
databricks-dolly-15k
databricks/dolly-v2-12bのトレーニングで使用される指示に従う記録のオープンソース データセットです。このデータセットは、ブレーンストーミング、分類、クローズド QA、生成、情報抽出、オープン QA、および要約。
このデータセットは、クリエイティブ コモンズ 表示-継承 3.0 非移植ライセンスの条件に基づいて、学術的または商業的であるかを問わず、あらゆる目的に使用できます。
バージョン:
-
1.0.0
(デフォルト): 初期リリース。
-
ダウンロードサイズ:
12.60 MiB
データセットのサイズ:
12.69 MiB
自動キャッシュ(ドキュメント): はい
分割:
スプリット | 例 |
---|---|
'train' | 15,014 |
- 機能の構造:
FeaturesDict({
'category': Text(shape=(), dtype=string),
'context': Text(shape=(), dtype=string),
'instruction': Text(shape=(), dtype=string),
'response': Text(shape=(), dtype=string),
})
- 機能ドキュメント:
特徴 | クラス | 形 | Dタイプ | 説明 |
---|---|---|---|---|
特徴辞書 | ||||
カテゴリー | 文章 | 弦 | ||
コンテクスト | 文章 | 弦 | ||
命令 | 文章 | 弦 | ||
応答 | 文章 | 弦 |
監視キー(
as_supervised
docを参照):None
図( tfds.show_examples ): サポートされていません。
例( tfds.as_dataframe ):
- 引用: