- Descrizione :
QM9 consiste nel calcolo delle proprietà geometriche, energetiche, elettroniche e termodinamiche per 134.000 piccole molecole organiche stabili costituite da C, H, O, N e F. Come al solito, rimuoviamo le molecole non caratterizzate e forniamo le restanti 130.831.
Pagina iniziale : https://doi.org/10.6084/m9.figshare.c.978904.v5
Codice sorgente :
tfds.datasets.qm9.Builder
Versioni :
-
1.0.0
(impostazione predefinita): versione iniziale.
-
Dimensione download :
82.62 MiB
Dimensione del set di dati :
177.16 MiB
Struttura delle caratteristiche :
FeaturesDict({
'A': float32,
'B': float32,
'C': float32,
'Cv': float32,
'G': float32,
'G_atomization': float32,
'H': float32,
'H_atomization': float32,
'InChI': string,
'InChI_relaxed': string,
'Mulliken_charges': Tensor(shape=(29,), dtype=float32),
'SMILES': string,
'SMILES_relaxed': string,
'U': float32,
'U0': float32,
'U0_atomization': float32,
'U_atomization': float32,
'alpha': float32,
'charges': Tensor(shape=(29,), dtype=int64),
'frequencies': Tensor(shape=(None,), dtype=float32),
'gap': float32,
'homo': float32,
'index': int64,
'lumo': float32,
'mu': float32,
'num_atoms': int64,
'positions': Tensor(shape=(29, 3), dtype=float32),
'r2': float32,
'tag': string,
'zpve': float32,
})
- Documentazione delle funzionalità :
Caratteristica | Classe | Forma | Tipo D | Descrizione |
---|---|---|---|---|
CaratteristicheDict | ||||
UN | Tensore | float32 | ||
B | Tensore | float32 | ||
C | Tensore | float32 | ||
CV | Tensore | float32 | ||
G | Tensore | float32 | ||
G_atomizzazione | Tensore | float32 | ||
H | Tensore | float32 | ||
H_atomizzazione | Tensore | float32 | ||
InChI | Tensore | corda | ||
InChI_rilassato | Tensore | corda | ||
Mulliken_charges | Tensore | (29,) | float32 | |
SORRISI | Tensore | corda | ||
SORRISI_rilassato | Tensore | corda | ||
U | Tensore | float32 | ||
U0 | Tensore | float32 | ||
U0_atomizzazione | Tensore | float32 | ||
U_atomizzazione | Tensore | float32 | ||
alfa | Tensore | float32 | ||
spese | Tensore | (29,) | int64 | |
frequenze | Tensore | (Nessuno,) | float32 | |
spacco | Tensore | float32 | ||
omo | Tensore | float32 | ||
indice | Tensore | int64 | ||
lumo | Tensore | float32 | ||
mu | Tensore | float32 | ||
num_atomi | Tensore | int64 | ||
posizioni | Tensore | (29, 3) | float32 | |
r2 | Tensore | float32 | ||
etichetta | Tensore | corda | ||
zpve | Tensore | float32 |
Chiavi supervisionate (vedi il documento
as_supervised
):None
Figura ( tfds.show_examples ): non supportato.
Esempi ( tfds.as_dataframe ): Mancante.
Citazione :
@article{ramakrishnan2014quantum,
title={Quantum chemistry structures and properties of 134 kilo molecules},
author={Ramakrishnan, Raghunathan and Dral, Pavlo O and Rupp, Matthias and von Lilienfeld, O Anatole},
journal={Scientific Data},
volume={1},
year={2014},
publisher={Nature Publishing Group}
}
qm9/originale (configurazione predefinita)
Descrizione della configurazione : QM9 non definisce alcuna suddivisione. Quindi questa variante inserisce l'intero set di dati QM9 nella suddivisione del treno, nell'ordine originale (senza mescolamento).
Memorizzato automaticamente nella cache ( documentazione ): solo quando
shuffle_files=False
(train)Divide :
Diviso | Esempi |
---|---|
'train' | 130.831 |
qm9/cormorano
Descrizione configurazione : suddivisione del set di dati utilizzata da Cormorant. 100.000 treni, 17.748 convalide e 13.083 campioni di prova. La divisione avviene dopo aver mescolato con il seme 0. Documento: https://arxiv.org/abs/1906.04015 Divisione: https://github.com/risilab/cormorant/blob/master/src/cormorant/data/prepare/qm9.py
Memorizzazione nella cache automatica ( documentazione ): Sì (test, convalida), solo quando
shuffle_files=False
(train)Divide :
Diviso | Esempi |
---|---|
'test' | 13.083 |
'train' | 100.000 |
'validation' | 17.748 |
qm9/dimenet
Descrizione configurazione : suddivisione del set di dati utilizzata da DimeNet. 110.000 treni, 10.000 convalide e 10.831 campioni di prova. La divisione avviene dopo aver mescolato con il seme 42. Documento: https://arxiv.org/abs/2003.03123 Divisione: https://github.com/gasteigerjo/dimenet/blob/master/dimenet/training/data_provider.py
Memorizzazione nella cache automatica ( documentazione ): Sì (test, convalida), solo quando
shuffle_files=False
(train)Divide :
Diviso | Esempi |
---|---|
'test' | 10.831 |
'train' | 110.000 |
'validation' | 10.000 |