- 説明:
Groove MIDI データセット (GMD) は、Roland TD-11 V-Drum 電子ドラム キットでキャプチャされた人間が演奏し、テンポを合わせた表現力豊かなドラミングの 13.6 時間の整列された MIDI と (合成された) オーディオで構成されています。
追加のドキュメント:コード を使用したペーパーの探索
ソース コード:
tfds.datasets.groove.Builder
バージョン:
-
2.0.1
(デフォルト): リリース ノートはありません。
-
監視されたキー(
as_supervised
docを参照):None
図( tfds.show_examples ): サポートされていません。
引用:
@inproceedings{groove2019,
Author = {Jon Gillick and Adam Roberts and Jesse Engel and Douglas Eck and David Bamman},
Title = {Learning to Groove with Inverse Sequence Transformations},
Booktitle = {International Conference on Machine Learning (ICML)}
Year = {2019},
}
グルーブ/フル ミディオンリー (デフォルト設定)
構成の説明: オーディオなし、分割されていないグルーブ データセット。
ダウンロードサイズ:
3.11 MiB
データセットサイズ:
5.22 MiB
自動キャッシュ(ドキュメント): はい
スプリット:
スプリット | 例 |
---|---|
'test' | 129 |
'train' | 897 |
'validation' | 124 |
- 機能構造:
FeaturesDict({
'bpm': int32,
'drummer': ClassLabel(shape=(), dtype=int64, num_classes=10),
'id': string,
'midi': string,
'style': FeaturesDict({
'primary': ClassLabel(shape=(), dtype=int64, num_classes=18),
'secondary': string,
}),
'time_signature': ClassLabel(shape=(), dtype=int64, num_classes=5),
'type': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
- 機能のドキュメント:
特徴 | クラス | 形 | Dtype | 説明 |
---|---|---|---|---|
特徴辞書 | ||||
bpm | テンソル | int32 | ||
ドラマー | クラスラベル | int64 | ||
ID | テンソル | ストリング | ||
ミディ | テンソル | ストリング | ||
スタイル | 特徴辞書 | |||
スタイル/プライマリ | クラスラベル | int64 | ||
スタイル/セカンダリ | テンソル | ストリング | ||
time_signature | クラスラベル | int64 | ||
タイプ | クラスラベル | int64 |
- 例( tfds.as_dataframe ):
グルーブ/フル-16000hz
構成の説明: オーディオ付き、分割されていないグルーブ データセット。
ダウンロードサイズ:
4.76 GiB
データセットサイズ:
2.33 GiB
自動キャッシュ(ドキュメント): いいえ
スプリット:
スプリット | 例 |
---|---|
'test' | 124 |
'train' | 846 |
'validation' | 120 |
- 機能構造:
FeaturesDict({
'audio': Audio(shape=(None,), dtype=float32),
'bpm': int32,
'drummer': ClassLabel(shape=(), dtype=int64, num_classes=10),
'id': string,
'midi': string,
'style': FeaturesDict({
'primary': ClassLabel(shape=(), dtype=int64, num_classes=18),
'secondary': string,
}),
'time_signature': ClassLabel(shape=(), dtype=int64, num_classes=5),
'type': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
- 機能のドキュメント:
特徴 | クラス | 形 | Dtype | 説明 |
---|---|---|---|---|
特徴辞書 | ||||
オーディオ | オーディオ | (なし、) | float32 | |
bpm | テンソル | int32 | ||
ドラマー | クラスラベル | int64 | ||
ID | テンソル | ストリング | ||
ミディ | テンソル | ストリング | ||
スタイル | 特徴辞書 | |||
スタイル/プライマリ | クラスラベル | int64 | ||
スタイル/セカンダリ | テンソル | ストリング | ||
time_signature | クラスラベル | int64 | ||
タイプ | クラスラベル | int64 |
- 例( tfds.as_dataframe ):
グルーブ/2bar-ミディアムリー
構成の説明: 2 小節のチャンクに分割された、オーディオのないグルーブ データセット。
ダウンロードサイズ:
3.11 MiB
データセットのサイズ:
19.59 MiB
自動キャッシュ(ドキュメント): はい
スプリット:
スプリット | 例 |
---|---|
'test' | 2,204 |
'train' | 18,163 |
'validation' | 2,252 |
- 機能構造:
FeaturesDict({
'bpm': int32,
'drummer': ClassLabel(shape=(), dtype=int64, num_classes=10),
'id': string,
'midi': string,
'style': FeaturesDict({
'primary': ClassLabel(shape=(), dtype=int64, num_classes=18),
'secondary': string,
}),
'time_signature': ClassLabel(shape=(), dtype=int64, num_classes=5),
'type': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
- 機能のドキュメント:
特徴 | クラス | 形 | Dtype | 説明 |
---|---|---|---|---|
特徴辞書 | ||||
bpm | テンソル | int32 | ||
ドラマー | クラスラベル | int64 | ||
ID | テンソル | ストリング | ||
ミディ | テンソル | ストリング | ||
スタイル | 特徴辞書 | |||
スタイル/プライマリ | クラスラベル | int64 | ||
スタイル/セカンダリ | テンソル | ストリング | ||
time_signature | クラスラベル | int64 | ||
タイプ | クラスラベル | int64 |
- 例( tfds.as_dataframe ):
グルーブ/2bar-16000hz
構成の説明: 2 小節のチャンクに分割された、オーディオを含むグルーブ データセット。
ダウンロードサイズ:
4.76 GiB
データセットサイズ:
4.61 GiB
自動キャッシュ(ドキュメント): いいえ
スプリット:
スプリット | 例 |
---|---|
'test' | 1,873 |
'train' | 14,390 |
'validation' | 2,034 |
- 機能構造:
FeaturesDict({
'audio': Audio(shape=(None,), dtype=float32),
'bpm': int32,
'drummer': ClassLabel(shape=(), dtype=int64, num_classes=10),
'id': string,
'midi': string,
'style': FeaturesDict({
'primary': ClassLabel(shape=(), dtype=int64, num_classes=18),
'secondary': string,
}),
'time_signature': ClassLabel(shape=(), dtype=int64, num_classes=5),
'type': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
- 機能のドキュメント:
特徴 | クラス | 形 | Dtype | 説明 |
---|---|---|---|---|
特徴辞書 | ||||
オーディオ | オーディオ | (なし、) | float32 | |
bpm | テンソル | int32 | ||
ドラマー | クラスラベル | int64 | ||
ID | テンソル | ストリング | ||
ミディ | テンソル | ストリング | ||
スタイル | 特徴辞書 | |||
スタイル/プライマリ | クラスラベル | int64 | ||
スタイル/セカンダリ | テンソル | ストリング | ||
time_signature | クラスラベル | int64 | ||
タイプ | クラスラベル | int64 |
- 例( tfds.as_dataframe ):
グルーブ/4bar-ミディアムリー
構成の説明: 4 小節のチャンクに分割された、オーディオのないグルーブ データセット。
ダウンロードサイズ:
3.11 MiB
データセットサイズ:
27.32 MiB
自動キャッシュ(ドキュメント): はい
スプリット:
スプリット | 例 |
---|---|
'test' | 2,033 |
'train' | 17,261 |
'validation' | 2,121 |
- 機能構造:
FeaturesDict({
'bpm': int32,
'drummer': ClassLabel(shape=(), dtype=int64, num_classes=10),
'id': string,
'midi': string,
'style': FeaturesDict({
'primary': ClassLabel(shape=(), dtype=int64, num_classes=18),
'secondary': string,
}),
'time_signature': ClassLabel(shape=(), dtype=int64, num_classes=5),
'type': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
- 機能のドキュメント:
特徴 | クラス | 形 | Dtype | 説明 |
---|---|---|---|---|
特徴辞書 | ||||
bpm | テンソル | int32 | ||
ドラマー | クラスラベル | int64 | ||
ID | テンソル | ストリング | ||
ミディ | テンソル | ストリング | ||
スタイル | 特徴辞書 | |||
スタイル/プライマリ | クラスラベル | int64 | ||
スタイル/セカンダリ | テンソル | ストリング | ||
time_signature | クラスラベル | int64 | ||
タイプ | クラスラベル | int64 |
- 例( tfds.as_dataframe ):