- Sự miêu tả :
D4RL là một chuẩn mực nguồn mở dành cho việc học tăng cường ngoại tuyến. Nó cung cấp các môi trường và bộ dữ liệu được tiêu chuẩn hóa cho các thuật toán đào tạo và đo điểm chuẩn.
Các bộ dữ liệu tuân theo định dạng RLDS để thể hiện các bước và các tập.
Mô tả cấu hình : Xem thêm chi tiết về nhiệm vụ và các phiên bản của nó trong https://github.com/rail-berkeley/d4rl/wiki/Tasks#antmaze
Trang chủ : https://sites.google.com/view/d4rl-anonymous
Mã nguồn :
tfds.d4rl.d4rl_antmaze.D4rlAntmaze
Phiên bản :
-
1.0.0
: Bản phát hành đầu tiên. -
1.1.1
(mặc định): Đã thêm bộ dữ liệu v2.
-
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không
Cấu trúc tính năng :
FeaturesDict({
'steps': Dataset({
'action': Tensor(shape=(8,), dtype=float32),
'discount': float32,
'infos': FeaturesDict({
'goal': Tensor(shape=(2,), dtype=float32),
'qpos': Tensor(shape=(15,), dtype=float32),
'qvel': Tensor(shape=(14,), dtype=float32),
}),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': Tensor(shape=(29,), dtype=float32),
'reward': float32,
}),
})
- Tài liệu tính năng :
Tính năng | Lớp học | Hình dạng | loại D | Sự miêu tả |
---|---|---|---|---|
Tính năngDict | ||||
bước | Tập dữ liệu | |||
bước/hành động | Tenxơ | (số 8,) | phao32 | |
bước/giảm giá | Tenxơ | phao32 | ||
các bước/thông tin | Tính năngDict | |||
các bước/thông tin/mục tiêu | Tenxơ | (2,) | phao32 | |
bước/thông tin/qpos | Tenxơ | (15,) | phao32 | |
bước/thông tin/qvel | Tenxơ | (14,) | phao32 | |
bước/is_first | Tenxơ | bool | ||
bước/is_last | Tenxơ | bool | ||
bước/is_terminal | Tenxơ | bool | ||
bước/quan sát | Tenxơ | (29,) | phao32 | |
bước/phần thưởng | Tenxơ | phao32 |
Khóa được giám sát (Xem
as_supervised
doc ):None
Hình ( tfds.show_examples ): Không được hỗ trợ.
Trích dẫn :
@misc{fu2020d4rl,
title={D4RL: Datasets for Deep Data-Driven Reinforcement Learning},
author={Justin Fu and Aviral Kumar and Ofir Nachum and George Tucker and Sergey Levine},
year={2020},
eprint={2004.07219},
archivePrefix={arXiv},
primaryClass={cs.LG}
}
d4rl_antmaze/umaze-v0 (cấu hình mặc định)
Kích thước tải xuống :
221.76 MiB
Kích thước tập dữ liệu :
274.83 MiB
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 10,154 |
- Ví dụ ( tfds.as_dataframe ):
d4rl_antmaze/umaze-diverse-v0
Kích thước tải xuống :
220.16 MiB
Kích thước tập dữ liệu :
270.23 MiB
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 1.154 |
- Ví dụ ( tfds.as_dataframe ):
d4rl_antmaze/medium-play-v0
Kích thước tải xuống :
220.40 MiB
Kích thước tập dữ liệu :
275.20 MiB
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 10.695 |
- Ví dụ ( tfds.as_dataframe ):
d4rl_antmaze/trung-đa dạng-v0
Kích thước tải xuống :
220.39 MiB
Kích thước tập dữ liệu :
271.18 MiB
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 2.924 |
- Ví dụ ( tfds.as_dataframe ):
d4rl_antmaze/lớn-đa dạng-v0
Kích thước tải xuống :
220.47 MiB
Kích thước tập dữ liệu :
273.36 MiB
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 7.141 |
- Ví dụ ( tfds.as_dataframe ):
d4rl_antmaze/large-play-v0
Kích thước tải xuống :
220.19 MiB
Kích thước tập dữ liệu :
276.61 MiB
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 13.458 |
- Ví dụ ( tfds.as_dataframe ):
d4rl_antmaze/umaze-v2
Kích thước tải xuống :
221.76 MiB
Kích thước tập dữ liệu :
274.83 MiB
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 10,154 |
- Ví dụ ( tfds.as_dataframe ):
d4rl_antmaze/umaze-đa dạng-v2
Kích thước tải xuống :
220.16 MiB
Kích thước tập dữ liệu :
270.20 MiB
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 1.036 |
- Ví dụ ( tfds.as_dataframe ):
d4rl_antmaze/medium-play-v2
Kích thước tải xuống :
220.40 MiB
Kích thước tập dữ liệu :
275.22 MiB
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 10,768 |
- Ví dụ ( tfds.as_dataframe ):
d4rl_antmaze/trung-đa dạng-v2
Kích thước tải xuống :
220.39 MiB
Kích thước tập dữ liệu :
271.19 MiB
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 2,959 |
- Ví dụ ( tfds.as_dataframe ):
d4rl_antmaze/lớn-đa dạng-v2
Kích thước tải xuống :
220.47 MiB
Kích thước tập dữ liệu :
273.38 MiB
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 7.189 |
- Ví dụ ( tfds.as_dataframe ):
d4rl_antmaze/large-play-v2
Kích thước tải xuống :
220.18 MiB
Kích thước tập dữ liệu :
276.63 MiB
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 13.517 |
- Ví dụ ( tfds.as_dataframe ):