d4rl_mujoco_ant,d4rl_mujoco_ant

  • Tanım :

D4RL, çevrimdışı takviyeli öğrenim için açık kaynaklı bir kıyaslamadır. Eğitim ve kıyaslama algoritmaları için standartlaştırılmış ortamlar ve veri kümeleri sağlar.

Veri kümeleri, adımları ve bölümleri temsil etmek için RLDS formatını takip eder.

@misc{fu2020d4rl,
    title={D4RL: Datasets for Deep Data-Driven Reinforcement Learning},
    author={Justin Fu and Aviral Kumar and Ofir Nachum and George Tucker and Sergey Levine},
    year={2020},
    eprint={2004.07219},
    archivePrefix={arXiv},
    primaryClass={cs.LG}
}

d4rl_mujoco_ant/v0-expert (varsayılan yapılandırma)

  • İndirme boyutu : 131.34 MiB

  • Veri kümesi boyutu : 464.94 MiB

  • Otomatik önbelleğe alınmış ( belgeler ): Hayır

  • Bölünmeler :

Bölmek Örnekler
'train' 1.288
  • Özellik yapısı :
FeaturesDict({
    'steps': Dataset({
        'action': Tensor(shape=(8,), dtype=float32),
        'discount': float32,
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(111,), dtype=float32),
        'reward': float32,
    }),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Tanım
ÖzelliklerDict
adımlar Veri kümesi
adımlar/eylem Tensör (8,) kayan nokta32
adımlar/indirim Tensör kayan nokta32
adımlar/is_first Tensör bool
adımlar/is_last Tensör bool
adımlar/is_terminal Tensör bool
adımlar/gözlem Tensör (111,) kayan nokta32
adımlar/ödül Tensör kayan nokta32

d4rl_mujoco_ant/v0-medium

  • İndirme boyutu : 131.39 MiB

  • Veri kümesi boyutu : 464.78 MiB

  • Otomatik önbelleğe alınmış ( belgeler ): Hayır

  • Bölünmeler :

Bölmek Örnekler
'train' 1.122
  • Özellik yapısı :
FeaturesDict({
    'steps': Dataset({
        'action': Tensor(shape=(8,), dtype=float32),
        'discount': float32,
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(111,), dtype=float32),
        'reward': float32,
    }),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Tanım
ÖzelliklerDict
adımlar Veri kümesi
adımlar/eylem Tensör (8,) kayan nokta32
adımlar/indirim Tensör kayan nokta32
adımlar/is_first Tensör bool
adımlar/is_last Tensör bool
adımlar/is_terminal Tensör bool
adımlar/gözlem Tensör (111,) kayan nokta32
adımlar/ödül Tensör kayan nokta32

d4rl_mujoco_ant/v0-medium-expert

  • İndirme boyutu : 262.73 MiB

  • Veri kümesi boyutu : 929.71 MiB

  • Otomatik önbelleğe alınmış ( belgeler ): Hayır

  • Bölünmeler :

Bölmek Örnekler
'train' 2.410
  • Özellik yapısı :
FeaturesDict({
    'steps': Dataset({
        'action': Tensor(shape=(8,), dtype=float32),
        'discount': float32,
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(111,), dtype=float32),
        'reward': float32,
    }),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Tanım
ÖzelliklerDict
adımlar Veri kümesi
adımlar/eylem Tensör (8,) kayan nokta32
adımlar/indirim Tensör kayan nokta32
adımlar/is_first Tensör bool
adımlar/is_last Tensör bool
adımlar/is_terminal Tensör bool
adımlar/gözlem Tensör (111,) kayan nokta32
adımlar/ödül Tensör kayan nokta32

d4rl_mujoco_ant/v0-mixed

  • İndirme boyutu : 104.63 MiB

  • Veri kümesi boyutu : 464.93 MiB

  • Otomatik önbelleğe alınmış ( belgeler ): Hayır

  • Bölünmeler :

Bölmek Örnekler
'train' 1.320
  • Özellik yapısı :
FeaturesDict({
    'steps': Dataset({
        'action': Tensor(shape=(8,), dtype=float32),
        'discount': float32,
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(111,), dtype=float32),
        'reward': float32,
    }),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Tanım
ÖzelliklerDict
adımlar Veri kümesi
adımlar/eylem Tensör (8,) kayan nokta32
adımlar/indirim Tensör kayan nokta32
adımlar/is_first Tensör bool
adımlar/is_last Tensör bool
adımlar/is_terminal Tensör bool
adımlar/gözlem Tensör (111,) kayan nokta32
adımlar/ödül Tensör kayan nokta32

d4rl_mujoco_ant/v0-random

  • İndirme boyutu : 139.50 MiB

  • Veri kümesi boyutu : 464.97 MiB

  • Otomatik önbelleğe alınmış ( belgeler ): Hayır

  • Bölünmeler :

Bölmek Örnekler
'train' 1.377
  • Özellik yapısı :
FeaturesDict({
    'steps': Dataset({
        'action': Tensor(shape=(8,), dtype=float32),
        'discount': float32,
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(111,), dtype=float32),
        'reward': float32,
    }),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Tanım
ÖzelliklerDict
adımlar Veri kümesi
adımlar/eylem Tensör (8,) kayan nokta32
adımlar/indirim Tensör kayan nokta32
adımlar/is_first Tensör bool
adımlar/is_last Tensör bool
adımlar/is_terminal Tensör bool
adımlar/gözlem Tensör (111,) kayan nokta32
adımlar/ödül Tensör kayan nokta32

d4rl_mujoco_ant/v1-expert

  • İndirme boyutu : 220.72 MiB

  • Veri kümesi boyutu : 968.63 MiB

  • Otomatik önbelleğe alınmış ( belgeler ): Hayır

  • Bölünmeler :

Bölmek Örnekler
'train' 1.033
  • Özellik yapısı :
FeaturesDict({
    'algorithm': string,
    'iteration': int32,
    'policy': FeaturesDict({
        'fc0': FeaturesDict({
            'bias': Tensor(shape=(256,), dtype=float32),
            'weight': Tensor(shape=(256, 111), dtype=float32),
        }),
        'fc1': FeaturesDict({
            'bias': Tensor(shape=(256,), dtype=float32),
            'weight': Tensor(shape=(256, 256), dtype=float32),
        }),
        'last_fc': FeaturesDict({
            'bias': Tensor(shape=(8,), dtype=float32),
            'weight': Tensor(shape=(8, 256), dtype=float32),
        }),
        'last_fc_log_std': FeaturesDict({
            'bias': Tensor(shape=(8,), dtype=float32),
            'weight': Tensor(shape=(8, 256), dtype=float32),
        }),
        'nonlinearity': string,
        'output_distribution': string,
    }),
    'steps': Dataset({
        'action': Tensor(shape=(8,), dtype=float32),
        'discount': float32,
        'infos': FeaturesDict({
            'action_log_probs': float32,
            'qpos': Tensor(shape=(15,), dtype=float32),
            'qvel': Tensor(shape=(14,), dtype=float32),
        }),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(111,), dtype=float32),
        'reward': float32,
    }),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Tanım
ÖzelliklerDict
algoritma Tensör sicim
yineleme Tensör int32
politika ÖzelliklerDict
politika/fc0 ÖzelliklerDict
politika/fc0/önyargı Tensör (256,) kayan nokta32
politika/fc0/ağırlık Tensör (256, 111) kayan nokta32
politika/fc1 ÖzelliklerDict
politika/fc1/önyargı Tensör (256,) kayan nokta32
politika/fc1/ağırlık Tensör (256, 256) kayan nokta32
politika/last_fc ÖzelliklerDict
politika/last_fc/bias Tensör (8,) kayan nokta32
politika/last_fc/ağırlık Tensör (8, 256) kayan nokta32
politika/last_fc_log_std ÖzelliklerDict
politika/last_fc_log_std/bias Tensör (8,) kayan nokta32
politika/last_fc_log_std/weight Tensör (8, 256) kayan nokta32
politika/doğrusal olmama Tensör sicim
politika/çıkış_dağıtımı Tensör sicim
adımlar Veri kümesi
adımlar/eylem Tensör (8,) kayan nokta32
adımlar/indirim Tensör kayan nokta32
adımlar/bilgiler ÖzelliklerDict
adımlar/bilgiler/action_log_probs Tensör kayan nokta32
adımlar/bilgiler/qpos Tensör (15,) kayan nokta32
adımlar/bilgiler/qvel Tensör (14,) kayan nokta32
adımlar/is_first Tensör bool
adımlar/is_last Tensör bool
adımlar/is_terminal Tensör bool
adımlar/gözlem Tensör (111,) kayan nokta32
adımlar/ödül Tensör kayan nokta32

d4rl_mujoco_ant/v1-medium

  • İndirme boyutu : 222.39 MiB

  • Veri kümesi boyutu : 1023.71 MiB

  • Otomatik önbelleğe alınmış ( belgeler ): Hayır

  • Bölünmeler :

Bölmek Örnekler
'train' 1.179
  • Özellik yapısı :
FeaturesDict({
    'algorithm': string,
    'iteration': int32,
    'policy': FeaturesDict({
        'fc0': FeaturesDict({
            'bias': Tensor(shape=(256,), dtype=float32),
            'weight': Tensor(shape=(256, 111), dtype=float32),
        }),
        'fc1': FeaturesDict({
            'bias': Tensor(shape=(256,), dtype=float32),
            'weight': Tensor(shape=(256, 256), dtype=float32),
        }),
        'last_fc': FeaturesDict({
            'bias': Tensor(shape=(8,), dtype=float32),
            'weight': Tensor(shape=(8, 256), dtype=float32),
        }),
        'last_fc_log_std': FeaturesDict({
            'bias': Tensor(shape=(8,), dtype=float32),
            'weight': Tensor(shape=(8, 256), dtype=float32),
        }),
        'nonlinearity': string,
        'output_distribution': string,
    }),
    'steps': Dataset({
        'action': Tensor(shape=(8,), dtype=float32),
        'discount': float32,
        'infos': FeaturesDict({
            'action_log_probs': float32,
            'qpos': Tensor(shape=(15,), dtype=float32),
            'qvel': Tensor(shape=(14,), dtype=float32),
        }),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(111,), dtype=float32),
        'reward': float32,
    }),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Tanım
ÖzelliklerDict
algoritma Tensör sicim
yineleme Tensör int32
politika ÖzelliklerDict
politika/fc0 ÖzelliklerDict
politika/fc0/önyargı Tensör (256,) kayan nokta32
politika/fc0/ağırlık Tensör (256, 111) kayan nokta32
politika/fc1 ÖzelliklerDict
politika/fc1/önyargı Tensör (256,) kayan nokta32
politika/fc1/ağırlık Tensör (256, 256) kayan nokta32
politika/last_fc ÖzelliklerDict
politika/last_fc/bias Tensör (8,) kayan nokta32
politika/last_fc/ağırlık Tensör (8, 256) kayan nokta32
politika/last_fc_log_std ÖzelliklerDict
politika/last_fc_log_std/bias Tensör (8,) kayan nokta32
politika/last_fc_log_std/weight Tensör (8, 256) kayan nokta32
politika/doğrusal olmama Tensör sicim
politika/çıkış_dağıtımı Tensör sicim
adımlar Veri kümesi
adımlar/eylem Tensör (8,) kayan nokta32
adımlar/indirim Tensör kayan nokta32
adımlar/bilgiler ÖzelliklerDict
adımlar/bilgiler/action_log_probs Tensör kayan nokta32
adımlar/bilgiler/qpos Tensör (15,) kayan nokta32
adımlar/bilgiler/qvel Tensör (14,) kayan nokta32
adımlar/is_first Tensör bool
adımlar/is_last Tensör bool
adımlar/is_terminal Tensör bool
adımlar/gözlem Tensör (111,) kayan nokta32
adımlar/ödül Tensör kayan nokta32

d4rl_mujoco_ant/v1-medium-expert

  • İndirme boyutu : 442.25 MiB

  • Veri kümesi boyutu : 1.13 GiB

  • Otomatik önbelleğe alınmış ( belgeler ): Hayır

  • Bölünmeler :

Bölmek Örnekler
'train' 2.211
  • Özellik yapısı :
FeaturesDict({
    'steps': Dataset({
        'action': Tensor(shape=(8,), dtype=float32),
        'discount': float32,
        'infos': FeaturesDict({
            'action_log_probs': float32,
            'qpos': Tensor(shape=(15,), dtype=float32),
            'qvel': Tensor(shape=(14,), dtype=float32),
        }),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(111,), dtype=float32),
        'reward': float32,
    }),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Tanım
ÖzelliklerDict
adımlar Veri kümesi
adımlar/eylem Tensör (8,) kayan nokta32
adımlar/indirim Tensör kayan nokta32
adımlar/bilgiler ÖzelliklerDict
adımlar/bilgiler/action_log_probs Tensör kayan nokta32
adımlar/bilgiler/qpos Tensör (15,) kayan nokta32
adımlar/bilgiler/qvel Tensör (14,) kayan nokta32
adımlar/is_first Tensör bool
adımlar/is_last Tensör bool
adımlar/is_terminal Tensör bool
adımlar/gözlem Tensör (111,) kayan nokta32
adımlar/ödül Tensör kayan nokta32

d4rl_mujoco_ant/v1-medium-tekrar oynatma

  • İndirme boyutu : 132.05 MiB

  • Veri kümesi boyutu : 175.27 MiB

  • Otomatik önbelleğe alınmış ( belgeler ): Yalnızca shuffle_files=False (train) olduğunda

  • Bölünmeler :

Bölmek Örnekler
'train' 485
  • Özellik yapısı :
FeaturesDict({
    'algorithm': string,
    'iteration': int32,
    'steps': Dataset({
        'action': Tensor(shape=(8,), dtype=float64),
        'discount': float64,
        'infos': FeaturesDict({
            'action_log_probs': float64,
            'qpos': Tensor(shape=(15,), dtype=float64),
            'qvel': Tensor(shape=(14,), dtype=float64),
        }),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(111,), dtype=float64),
        'reward': float64,
    }),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Tanım
ÖzelliklerDict
algoritma Tensör sicim
yineleme Tensör int32
adımlar Veri kümesi
adımlar/eylem Tensör (8,) kayan nokta64
adımlar/indirim Tensör kayan nokta64
adımlar/bilgiler ÖzelliklerDict
adımlar/bilgiler/action_log_probs Tensör kayan nokta64
adımlar/bilgiler/qpos Tensör (15,) kayan nokta64
adımlar/bilgiler/qvel Tensör (14,) kayan nokta64
adımlar/is_first Tensör bool
adımlar/is_last Tensör bool
adımlar/is_terminal Tensör bool
adımlar/gözlem Tensör (111,) kayan nokta64
adımlar/ödül Tensör kayan nokta64

d4rl_mujoco_ant/v1-tam-tekrar oynatma

  • İndirme boyutu : 437.57 MiB

  • Veri kümesi boyutu : 580.09 MiB

  • Otomatik önbelleğe alınmış ( belgeler ): Hayır

  • Bölünmeler :

Bölmek Örnekler
'train' 1.319
  • Özellik yapısı :
FeaturesDict({
    'algorithm': string,
    'iteration': int32,
    'steps': Dataset({
        'action': Tensor(shape=(8,), dtype=float64),
        'discount': float64,
        'infos': FeaturesDict({
            'action_log_probs': float64,
            'qpos': Tensor(shape=(15,), dtype=float64),
            'qvel': Tensor(shape=(14,), dtype=float64),
        }),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(111,), dtype=float64),
        'reward': float64,
    }),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Tanım
ÖzelliklerDict
algoritma Tensör sicim
yineleme Tensör int32
adımlar Veri kümesi
adımlar/eylem Tensör (8,) kayan nokta64
adımlar/indirim Tensör kayan nokta64
adımlar/bilgiler ÖzelliklerDict
adımlar/bilgiler/action_log_probs Tensör kayan nokta64
adımlar/bilgiler/qpos Tensör (15,) kayan nokta64
adımlar/bilgiler/qvel Tensör (14,) kayan nokta64
adımlar/is_first Tensör bool
adımlar/is_last Tensör bool
adımlar/is_terminal Tensör bool
adımlar/gözlem Tensör (111,) kayan nokta64
adımlar/ödül Tensör kayan nokta64

d4rl_mujoco_ant/v1-random

  • İndirme boyutu : 225.18 MiB

  • Veri kümesi boyutu : 583.83 MiB

  • Otomatik önbelleğe alınmış ( belgeler ): Hayır

  • Bölünmeler :

Bölmek Örnekler
'train' 5.741
  • Özellik yapısı :
FeaturesDict({
    'steps': Dataset({
        'action': Tensor(shape=(8,), dtype=float32),
        'discount': float32,
        'infos': FeaturesDict({
            'action_log_probs': float32,
            'qpos': Tensor(shape=(15,), dtype=float32),
            'qvel': Tensor(shape=(14,), dtype=float32),
        }),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(111,), dtype=float32),
        'reward': float32,
    }),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Tanım
ÖzelliklerDict
adımlar Veri kümesi
adımlar/eylem Tensör (8,) kayan nokta32
adımlar/indirim Tensör kayan nokta32
adımlar/bilgiler ÖzelliklerDict
adımlar/bilgiler/action_log_probs Tensör kayan nokta32
adımlar/bilgiler/qpos Tensör (15,) kayan nokta32
adımlar/bilgiler/qvel Tensör (14,) kayan nokta32
adımlar/is_first Tensör bool
adımlar/is_last Tensör bool
adımlar/is_terminal Tensör bool
adımlar/gözlem Tensör (111,) kayan nokta32
adımlar/ödül Tensör kayan nokta32

d4rl_mujoco_ant/v2-expert

  • İndirme boyutu : 355.94 MiB

  • Veri kümesi boyutu : 969.38 MiB

  • Otomatik önbelleğe alınmış ( belgeler ): Hayır

  • Bölünmeler :

Bölmek Örnekler
'train' 1.035
  • Özellik yapısı :
FeaturesDict({
    'algorithm': string,
    'iteration': int32,
    'policy': FeaturesDict({
        'fc0': FeaturesDict({
            'bias': Tensor(shape=(256,), dtype=float32),
            'weight': Tensor(shape=(256, 111), dtype=float32),
        }),
        'fc1': FeaturesDict({
            'bias': Tensor(shape=(256,), dtype=float32),
            'weight': Tensor(shape=(256, 256), dtype=float32),
        }),
        'last_fc': FeaturesDict({
            'bias': Tensor(shape=(8,), dtype=float32),
            'weight': Tensor(shape=(8, 256), dtype=float32),
        }),
        'last_fc_log_std': FeaturesDict({
            'bias': Tensor(shape=(8,), dtype=float32),
            'weight': Tensor(shape=(8, 256), dtype=float32),
        }),
        'nonlinearity': string,
        'output_distribution': string,
    }),
    'steps': Dataset({
        'action': Tensor(shape=(8,), dtype=float32),
        'discount': float32,
        'infos': FeaturesDict({
            'action_log_probs': float64,
            'qpos': Tensor(shape=(15,), dtype=float64),
            'qvel': Tensor(shape=(14,), dtype=float64),
        }),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(111,), dtype=float32),
        'reward': float32,
    }),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Tanım
ÖzelliklerDict
algoritma Tensör sicim
yineleme Tensör int32
politika ÖzelliklerDict
politika/fc0 ÖzelliklerDict
politika/fc0/önyargı Tensör (256,) kayan nokta32
politika/fc0/ağırlık Tensör (256, 111) kayan nokta32
politika/fc1 ÖzelliklerDict
politika/fc1/önyargı Tensör (256,) kayan nokta32
politika/fc1/ağırlık Tensör (256, 256) kayan nokta32
politika/last_fc ÖzelliklerDict
politika/last_fc/bias Tensör (8,) kayan nokta32
politika/last_fc/ağırlık Tensör (8, 256) kayan nokta32
politika/last_fc_log_std ÖzelliklerDict
politika/last_fc_log_std/bias Tensör (8,) kayan nokta32
politika/last_fc_log_std/weight Tensör (8, 256) kayan nokta32
politika/doğrusal olmama Tensör sicim
politika/çıkış_dağıtımı Tensör sicim
adımlar Veri kümesi
adımlar/eylem Tensör (8,) kayan nokta32
adımlar/indirim Tensör kayan nokta32
adımlar/bilgiler ÖzelliklerDict
adımlar/bilgiler/action_log_probs Tensör kayan nokta64
adımlar/bilgiler/qpos Tensör (15,) kayan nokta64
adımlar/bilgiler/qvel Tensör (14,) kayan nokta64
adımlar/is_first Tensör bool
adımlar/is_last Tensör bool
adımlar/is_terminal Tensör bool
adımlar/gözlem Tensör (111,) kayan nokta32
adımlar/ödül Tensör kayan nokta32

d4rl_mujoco_ant/v2-tam-tekrar oynatma

  • İndirme boyutu : 428.57 MiB

  • Veri kümesi boyutu : 580.09 MiB

  • Otomatik önbelleğe alınmış ( belgeler ): Hayır

  • Bölünmeler :

Bölmek Örnekler
'train' 1.319
  • Özellik yapısı :
FeaturesDict({
    'algorithm': string,
    'iteration': int32,
    'steps': Dataset({
        'action': Tensor(shape=(8,), dtype=float32),
        'discount': float32,
        'infos': FeaturesDict({
            'action_log_probs': float64,
            'qpos': Tensor(shape=(15,), dtype=float64),
            'qvel': Tensor(shape=(14,), dtype=float64),
        }),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(111,), dtype=float32),
        'reward': float32,
    }),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Tanım
ÖzelliklerDict
algoritma Tensör sicim
yineleme Tensör int32
adımlar Veri kümesi
adımlar/eylem Tensör (8,) kayan nokta32
adımlar/indirim Tensör kayan nokta32
adımlar/bilgiler ÖzelliklerDict
adımlar/bilgiler/action_log_probs Tensör kayan nokta64
adımlar/bilgiler/qpos Tensör (15,) kayan nokta64
adımlar/bilgiler/qvel Tensör (14,) kayan nokta64
adımlar/is_first Tensör bool
adımlar/is_last Tensör bool
adımlar/is_terminal Tensör bool
adımlar/gözlem Tensör (111,) kayan nokta32
adımlar/ödül Tensör kayan nokta32

d4rl_mujoco_ant/v2-medium

  • İndirme boyutu : 358.81 MiB

  • Veri kümesi boyutu : 1.01 GiB

  • Otomatik önbelleğe alınmış ( belgeler ): Hayır

  • Bölünmeler :

Bölmek Örnekler
'train' 1.203
  • Özellik yapısı :
FeaturesDict({
    'algorithm': string,
    'iteration': int32,
    'policy': FeaturesDict({
        'fc0': FeaturesDict({
            'bias': Tensor(shape=(256,), dtype=float32),
            'weight': Tensor(shape=(256, 111), dtype=float32),
        }),
        'fc1': FeaturesDict({
            'bias': Tensor(shape=(256,), dtype=float32),
            'weight': Tensor(shape=(256, 256), dtype=float32),
        }),
        'last_fc': FeaturesDict({
            'bias': Tensor(shape=(8,), dtype=float32),
            'weight': Tensor(shape=(8, 256), dtype=float32),
        }),
        'last_fc_log_std': FeaturesDict({
            'bias': Tensor(shape=(8,), dtype=float32),
            'weight': Tensor(shape=(8, 256), dtype=float32),
        }),
        'nonlinearity': string,
        'output_distribution': string,
    }),
    'steps': Dataset({
        'action': Tensor(shape=(8,), dtype=float32),
        'discount': float32,
        'infos': FeaturesDict({
            'action_log_probs': float64,
            'qpos': Tensor(shape=(15,), dtype=float64),
            'qvel': Tensor(shape=(14,), dtype=float64),
        }),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(111,), dtype=float32),
        'reward': float32,
    }),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Tanım
ÖzelliklerDict
algoritma Tensör sicim
yineleme Tensör int32
politika ÖzelliklerDict
politika/fc0 ÖzelliklerDict
politika/fc0/önyargı Tensör (256,) kayan nokta32
politika/fc0/ağırlık Tensör (256, 111) kayan nokta32
politika/fc1 ÖzelliklerDict
politika/fc1/önyargı Tensör (256,) kayan nokta32
politika/fc1/ağırlık Tensör (256, 256) kayan nokta32
politika/last_fc ÖzelliklerDict
politika/last_fc/bias Tensör (8,) kayan nokta32
politika/last_fc/ağırlık Tensör (8, 256) kayan nokta32
politika/last_fc_log_std ÖzelliklerDict
politika/last_fc_log_std/bias Tensör (8,) kayan nokta32
politika/last_fc_log_std/weight Tensör (8, 256) kayan nokta32
politika/doğrusal olmama Tensör sicim
politika/çıkış_dağıtımı Tensör sicim
adımlar Veri kümesi
adımlar/eylem Tensör (8,) kayan nokta32
adımlar/indirim Tensör kayan nokta32
adımlar/bilgiler ÖzelliklerDict
adımlar/bilgiler/action_log_probs Tensör kayan nokta64
adımlar/bilgiler/qpos Tensör (15,) kayan nokta64
adımlar/bilgiler/qvel Tensör (14,) kayan nokta64
adımlar/is_first Tensör bool
adımlar/is_last Tensör bool
adımlar/is_terminal Tensör bool
adımlar/gözlem Tensör (111,) kayan nokta32
adımlar/ödül Tensör kayan nokta32

d4rl_mujoco_ant/v2-medium-expert

  • İndirme boyutu : 713.67 MiB

  • Veri kümesi boyutu : 1.13 GiB

  • Otomatik önbelleğe alınmış ( belgeler ): Hayır

  • Bölünmeler :

Bölmek Örnekler
'train' 2.237
  • Özellik yapısı :
FeaturesDict({
    'steps': Dataset({
        'action': Tensor(shape=(8,), dtype=float32),
        'discount': float32,
        'infos': FeaturesDict({
            'action_log_probs': float64,
            'qpos': Tensor(shape=(15,), dtype=float64),
            'qvel': Tensor(shape=(14,), dtype=float64),
        }),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(111,), dtype=float32),
        'reward': float32,
    }),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Tanım
ÖzelliklerDict
adımlar Veri kümesi
adımlar/eylem Tensör (8,) kayan nokta32
adımlar/indirim Tensör kayan nokta32
adımlar/bilgiler ÖzelliklerDict
adımlar/bilgiler/action_log_probs Tensör kayan nokta64
adımlar/bilgiler/qpos Tensör (15,) kayan nokta64
adımlar/bilgiler/qvel Tensör (14,) kayan nokta64
adımlar/is_first Tensör bool
adımlar/is_last Tensör bool
adımlar/is_terminal Tensör bool
adımlar/gözlem Tensör (111,) kayan nokta32
adımlar/ödül Tensör kayan nokta32

d4rl_mujoco_ant/v2-medium-tekrar oynatma

  • İndirme boyutu : 130.16 MiB

  • Veri kümesi boyutu : 175.27 MiB

  • Otomatik önbelleğe alınmış ( belgeler ): Yalnızca shuffle_files=False (train) olduğunda

  • Bölünmeler :

Bölmek Örnekler
'train' 485
  • Özellik yapısı :
FeaturesDict({
    'algorithm': string,
    'iteration': int32,
    'steps': Dataset({
        'action': Tensor(shape=(8,), dtype=float32),
        'discount': float32,
        'infos': FeaturesDict({
            'action_log_probs': float64,
            'qpos': Tensor(shape=(15,), dtype=float64),
            'qvel': Tensor(shape=(14,), dtype=float64),
        }),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(111,), dtype=float32),
        'reward': float32,
    }),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Tanım
ÖzelliklerDict
algoritma Tensör sicim
yineleme Tensör int32
adımlar Veri kümesi
adımlar/eylem Tensör (8,) kayan nokta32
adımlar/indirim Tensör kayan nokta32
adımlar/bilgiler ÖzelliklerDict
adımlar/bilgiler/action_log_probs Tensör kayan nokta64
adımlar/bilgiler/qpos Tensör (15,) kayan nokta64
adımlar/bilgiler/qvel Tensör (14,) kayan nokta64
adımlar/is_first Tensör bool
adımlar/is_last Tensör bool
adımlar/is_terminal Tensör bool
adımlar/gözlem Tensör (111,) kayan nokta32
adımlar/ödül Tensör kayan nokta32

d4rl_mujoco_ant/v2-random

  • İndirme boyutu : 366.66 MiB

  • Veri kümesi boyutu : 583.90 MiB

  • Otomatik önbelleğe alınmış ( belgeler ): Hayır

  • Bölünmeler :

Bölmek Örnekler
'train' 5.822
  • Özellik yapısı :
FeaturesDict({
    'steps': Dataset({
        'action': Tensor(shape=(8,), dtype=float32),
        'discount': float32,
        'infos': FeaturesDict({
            'action_log_probs': float64,
            'qpos': Tensor(shape=(15,), dtype=float64),
            'qvel': Tensor(shape=(14,), dtype=float64),
        }),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(111,), dtype=float32),
        'reward': float32,
    }),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Tanım
ÖzelliklerDict
adımlar Veri kümesi
adımlar/eylem Tensör (8,) kayan nokta32
adımlar/indirim Tensör kayan nokta32
adımlar/bilgiler ÖzelliklerDict
adımlar/bilgiler/action_log_probs Tensör kayan nokta64
adımlar/bilgiler/qpos Tensör (15,) kayan nokta64
adımlar/bilgiler/qvel Tensör (14,) kayan nokta64
adımlar/is_first Tensör bool
adımlar/is_last Tensör bool
adımlar/is_terminal Tensör bool
adımlar/gözlem Tensör (111,) kayan nokta32
adımlar/ödül Tensör kayan nokta32