databricks_dolly

  • 説明:

databricks-dolly-15k databricks/dolly-v2-12bのトレーニングで使用される指示に従う記録のオープンソース データセットです。このデータセットは、ブレーンストーミング、分類、クローズド QA、生成、情報抽出、オープン QA、および要約。

このデータセットは、クリエイティブ コモンズ 表示-継承 3.0 非移植ライセンスの条件に基づいて、学術的または商業的であるかを問わず、あらゆる目的に使用できます。

スプリット
'train' 15,014
  • 機能の構造:
FeaturesDict({
    'category': Text(shape=(), dtype=string),
    'context': Text(shape=(), dtype=string),
    'instruction': Text(shape=(), dtype=string),
    'response': Text(shape=(), dtype=string),
})
  • 機能ドキュメント:
特徴クラスDタイプ説明
特徴辞書
カテゴリー文章
コンテクスト文章
命令文章
応答文章
  • 引用