- Opis :
QM9 składa się z obliczonych właściwości geometrycznych, energetycznych, elektronicznych i termodynamicznych dla stabilnych 134 tys. małych cząsteczek organicznych składających się z C, H, O, N i F. Jak zwykle usuwamy niescharakteryzowane cząsteczki i dostarczamy pozostałe 130 831.
Strona główna : https://doi.org/10.6084/m9.figshare.c.978904.v5
Kod źródłowy :
tfds.datasets.qm9.Builder
Wersje :
-
1.0.0
(domyślnie): Wersja pierwsza.
-
Rozmiar pobierania :
82.62 MiB
Rozmiar zbioru danych :
177.16 MiB
Struktura funkcji :
FeaturesDict({
'A': float32,
'B': float32,
'C': float32,
'Cv': float32,
'G': float32,
'G_atomization': float32,
'H': float32,
'H_atomization': float32,
'InChI': string,
'InChI_relaxed': string,
'Mulliken_charges': Tensor(shape=(29,), dtype=float32),
'SMILES': string,
'SMILES_relaxed': string,
'U': float32,
'U0': float32,
'U0_atomization': float32,
'U_atomization': float32,
'alpha': float32,
'charges': Tensor(shape=(29,), dtype=int64),
'frequencies': Tensor(shape=(None,), dtype=float32),
'gap': float32,
'homo': float32,
'index': int64,
'lumo': float32,
'mu': float32,
'num_atoms': int64,
'positions': Tensor(shape=(29, 3), dtype=float32),
'r2': float32,
'tag': string,
'zpve': float32,
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDykt | ||||
A | Napinacz | pływak32 | ||
B | Napinacz | pływak32 | ||
C | Napinacz | pływak32 | ||
Cv | Napinacz | pływak32 | ||
G | Napinacz | pływak32 | ||
G_atomizacja | Napinacz | pływak32 | ||
H | Napinacz | pływak32 | ||
H_atomizacja | Napinacz | pływak32 | ||
InChI | Napinacz | smyczkowy | ||
InChI_zrelaksowany | Napinacz | smyczkowy | ||
Mulliken_charges | Napinacz | (29,) | pływak32 | |
UŚMIECHA SIĘ | Napinacz | smyczkowy | ||
SMILES_zrelaksowany | Napinacz | smyczkowy | ||
U | Napinacz | pływak32 | ||
U0 | Napinacz | pływak32 | ||
U0_atomizacja | Napinacz | pływak32 | ||
U_atomizacja | Napinacz | pływak32 | ||
alfa | Napinacz | pływak32 | ||
opłaty | Napinacz | (29,) | int64 | |
częstotliwości | Napinacz | (Nic,) | pływak32 | |
luka | Napinacz | pływak32 | ||
homo | Napinacz | pływak32 | ||
indeks | Napinacz | int64 | ||
lumo | Napinacz | pływak32 | ||
mu | Napinacz | pływak32 | ||
liczba_atomów | Napinacz | int64 | ||
pozycje | Napinacz | (29, 3) | pływak32 | |
r2 | Napinacz | pływak32 | ||
etykietka | Napinacz | smyczkowy | ||
zpve | Napinacz | pływak32 |
Klucze nadzorowane (zobacz dokument
as_supervised
):None
Rysunek ( tfds.show_examples ): Nieobsługiwany.
Cytat :
@article{ramakrishnan2014quantum,
title={Quantum chemistry structures and properties of 134 kilo molecules},
author={Ramakrishnan, Raghunathan and Dral, Pavlo O and Rupp, Matthias and von Lilienfeld, O Anatole},
journal={Scientific Data},
volume={1},
year={2014},
publisher={Nature Publishing Group}
}
qm9/original (konfiguracja domyślna)
Opis konfiguracji : QM9 nie definiuje żadnych podziałów. Zatem ten wariant umieszcza pełny zbiór danych QM9 w podziale pociągu, w pierwotnej kolejności (bez tasowania).
Automatyczne buforowanie ( dokumentacja ): Tylko wtedy, gdy
shuffle_files=False
(pociąg)Podziały :
Podział | Przykłady |
---|---|
'train' | 130 831 |
- Przykłady ( tfds.as_dataframe ):
m9/kormoran
Opis konfiguracji : Podział zbioru danych używany przez Kormorana. 100 000 pociągów, 17 748 walidacji i 13 083 próbek testowych. Dzielenie następuje po przetasowaniu z nasionem 0. Artykuł: https://arxiv.org/abs/1906.04015 Split: https://github.com/risilab/cormorant/blob/master/src/cormorant/data/prepare/qm9.py
Automatyczne buforowanie ( dokumentacja ): Tak (test, walidacja), Tylko gdy
shuffle_files=False
(pociąg)Podziały :
Podział | Przykłady |
---|---|
'test' | 13083 |
'train' | 100 000 |
'validation' | 17748 |
- Przykłady ( tfds.as_dataframe ):
qm9/dimenet
Opis konfiguracji : Podział zbioru danych używany przez DimeNet. 110 000 pociągów, 10 000 walidacji i 10 831 próbek testowych. Dzielenie następuje po przemieszaniu z nasionami 42. Artykuł: https://arxiv.org/abs/2003.03123 Podział: https://github.com/gasteigerjo/dimenet/blob/master/dimenet/training/data_provider.py
Automatyczne buforowanie ( dokumentacja ): Tak (test, walidacja), Tylko gdy
shuffle_files=False
(pociąg)Podziały :
Podział | Przykłady |
---|---|
'test' | 10831 |
'train' | 110 000 |
'validation' | 10 000 |
- Przykłady ( tfds.as_dataframe ):