- Tanım :
QM9, C, H, O, N ve F'den oluşan 134k kararlı küçük organik moleküller için hesaplanmış geometrik, enerjik, elektronik ve termodinamik özelliklerden oluşur. Her zamanki gibi, karakterize edilmemiş molekülleri çıkarırız ve kalan 130.831'i sağlarız.
Ana sayfa : https://doi.org/10.6084/m9.figshare.c.978904.v5
Kaynak kodu :
tfds.datasets.qm9.Builder
Sürümler :
-
1.0.0
(varsayılan): İlk sürüm.
-
İndirme boyutu :
82.62 MiB
Veri kümesi boyutu :
177.16 MiB
Özellik yapısı :
FeaturesDict({
'A': float32,
'B': float32,
'C': float32,
'Cv': float32,
'G': float32,
'G_atomization': float32,
'H': float32,
'H_atomization': float32,
'InChI': string,
'InChI_relaxed': string,
'Mulliken_charges': Tensor(shape=(29,), dtype=float32),
'SMILES': string,
'SMILES_relaxed': string,
'U': float32,
'U0': float32,
'U0_atomization': float32,
'U_atomization': float32,
'alpha': float32,
'charges': Tensor(shape=(29,), dtype=int64),
'frequencies': Tensor(shape=(None,), dtype=float32),
'gap': float32,
'homo': float32,
'index': int64,
'lumo': float32,
'mu': float32,
'num_atoms': int64,
'positions': Tensor(shape=(29, 3), dtype=float32),
'r2': float32,
'tag': string,
'zpve': float32,
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
A | Tensör | kayan nokta32 | ||
B | Tensör | kayan nokta32 | ||
C | Tensör | kayan nokta32 | ||
Özgeçmiş | Tensör | kayan nokta32 | ||
G | Tensör | kayan nokta32 | ||
G_atomizasyon | Tensör | kayan nokta32 | ||
H | Tensör | kayan nokta32 | ||
H_atomizasyon | Tensör | kayan nokta32 | ||
InChI | Tensör | sicim | ||
InChI_relaxed | Tensör | sicim | ||
Mulliken_charges | Tensör | (29,) | kayan nokta32 | |
GÜLÜMSEMELER | Tensör | sicim | ||
SMILES_rahatlamış | Tensör | sicim | ||
sen | Tensör | kayan nokta32 | ||
U0 | Tensör | kayan nokta32 | ||
U0_atomizasyon | Tensör | kayan nokta32 | ||
U_atomizasyon | Tensör | kayan nokta32 | ||
alfa | Tensör | kayan nokta32 | ||
masraflar | Tensör | (29,) | int64 | |
frekanslar | Tensör | (Hiçbiri,) | kayan nokta32 | |
açıklık | Tensör | kayan nokta32 | ||
homo | Tensör | kayan nokta32 | ||
indeks | Tensör | int64 | ||
lumo | Tensör | kayan nokta32 | ||
sen | Tensör | kayan nokta32 | ||
num_atoms | Tensör | int64 | ||
pozisyonlar | Tensör | (29, 3) | kayan nokta32 | |
r2 | Tensör | kayan nokta32 | ||
etiket | Tensör | sicim | ||
zpve | Tensör | kayan nokta32 |
Denetlenen anahtarlar (
as_supervised
belgesine bakın):None
Şekil ( tfds.show_examples ): Desteklenmiyor.
Örnekler ( tfds.as_dataframe ): Eksik.
Alıntı :
@article{ramakrishnan2014quantum,
title={Quantum chemistry structures and properties of 134 kilo molecules},
author={Ramakrishnan, Raghunathan and Dral, Pavlo O and Rupp, Matthias and von Lilienfeld, O Anatole},
journal={Scientific Data},
volume={1},
year={2014},
publisher={Nature Publishing Group}
}
qm9/orijinal (varsayılan yapılandırma)
Yapılandırma açıklaması : QM9 herhangi bir bölünme tanımlamaz. Dolayısıyla bu değişken, QM9 veri kümesinin tamamını orijinal sıraya göre tren bölmesine yerleştirir (karıştırma yok).
Otomatik önbelleğe alınmış ( belgeler ): Yalnızca
shuffle_files=False
(train) olduğundaBölünmeler :
Bölmek | Örnekler |
---|---|
'train' | 130.831 |
qm9/karabatak
Yapılandırma açıklaması : Cormorant tarafından kullanılan veri kümesi bölme işlemi. 100.000 eğitim, 17.748 doğrulama ve 13.083 test örneği. Bölme, tohum 0 ile karıştırıldıktan sonra gerçekleşir. Makale: https://arxiv.org/abs/1906.04015 Bölme: https://github.com/risilab/cormorant/blob/master/src/cormorant/data/prepare/qm9.py
Otomatik önbelleğe alınmış ( dokümantasyon ): Evet (test, doğrulama), Yalnızca
shuffle_files=False
(tren) olduğundaBölünmeler :
Bölmek | Örnekler |
---|---|
'test' | 13.083 |
'train' | 100.000 |
'validation' | 17.748 |
qm9/dimenet
Yapılandırma açıklaması : DimeNet tarafından kullanılan veri kümesi bölünmesi. 110.000 eğitim, 10.000 doğrulama ve 10.831 test örneği. Bölme, tohum 42 ile karıştırıldıktan sonra gerçekleşir. Makale: https://arxiv.org/abs/2003.03123 Bölme: https://github.com/gasteigerjo/dimenet/blob/master/dimenet/training/data_provider.py
Otomatik önbelleğe alınmış ( dokümantasyon ): Evet (test, doğrulama), Yalnızca
shuffle_files=False
(tren) olduğundaBölünmeler :
Bölmek | Örnekler |
---|---|
'test' | 10.831 |
'train' | 110.000 |
'validation' | 10.000 |