- Description :
QM9 comprend les propriétés géométriques, énergétiques, électroniques et thermodynamiques calculées pour 134 000 petites molécules organiques stables composées de C, H, O, N et F. Comme d'habitude, nous supprimons les molécules non caractérisées et fournissons les 130 831 restantes.
Page d'accueil : https://doi.org/10.6084/m9.figshare.c.978904.v5
Code source :
tfds.datasets.qm9.Builder
Versions :
-
1.0.0
(par défaut) : version initiale.
-
Taille du téléchargement :
82.62 MiB
Taille de l'ensemble de données :
177.16 MiB
Structure des fonctionnalités :
FeaturesDict({
'A': float32,
'B': float32,
'C': float32,
'Cv': float32,
'G': float32,
'G_atomization': float32,
'H': float32,
'H_atomization': float32,
'InChI': string,
'InChI_relaxed': string,
'Mulliken_charges': Tensor(shape=(29,), dtype=float32),
'SMILES': string,
'SMILES_relaxed': string,
'U': float32,
'U0': float32,
'U0_atomization': float32,
'U_atomization': float32,
'alpha': float32,
'charges': Tensor(shape=(29,), dtype=int64),
'frequencies': Tensor(shape=(None,), dtype=float32),
'gap': float32,
'homo': float32,
'index': int64,
'lumo': float32,
'mu': float32,
'num_atoms': int64,
'positions': Tensor(shape=(29, 3), dtype=float32),
'r2': float32,
'tag': string,
'zpve': float32,
})
- Documentation des fonctionnalités :
Fonctionnalité | Classe | Forme | Type D | Description |
---|---|---|---|---|
FonctionnalitésDict | ||||
UN | Tenseur | flotteur32 | ||
B | Tenseur | flotteur32 | ||
C | Tenseur | flotteur32 | ||
CV | Tenseur | flotteur32 | ||
g | Tenseur | flotteur32 | ||
G_atomisation | Tenseur | flotteur32 | ||
H | Tenseur | flotteur32 | ||
H_atomisation | Tenseur | flotteur32 | ||
InChI | Tenseur | chaîne | ||
InChI_relaxé | Tenseur | chaîne | ||
Mulliken_charges | Tenseur | (29,) | flotteur32 | |
SOURIRES | Tenseur | chaîne | ||
SMILES_détendu | Tenseur | chaîne | ||
U | Tenseur | flotteur32 | ||
U0 | Tenseur | flotteur32 | ||
U0_atomisation | Tenseur | flotteur32 | ||
U_atomisation | Tenseur | flotteur32 | ||
alpha | Tenseur | flotteur32 | ||
des charges | Tenseur | (29,) | int64 | |
fréquences | Tenseur | (Aucun,) | flotteur32 | |
écart | Tenseur | flotteur32 | ||
homo | Tenseur | flotteur32 | ||
indice | Tenseur | int64 | ||
lumo | Tenseur | flotteur32 | ||
mu | Tenseur | flotteur32 | ||
num_atomes | Tenseur | int64 | ||
postes | Tenseur | (29, 3) | flotteur32 | |
r2 | Tenseur | flotteur32 | ||
étiqueter | Tenseur | chaîne | ||
zpve | Tenseur | flotteur32 |
Clés supervisées (Voir doc
as_supervised
) :None
Figure ( tfds.show_examples ) : non pris en charge.
Exemples ( tfds.as_dataframe ) : Manquant.
Citation :
@article{ramakrishnan2014quantum,
title={Quantum chemistry structures and properties of 134 kilo molecules},
author={Ramakrishnan, Raghunathan and Dral, Pavlo O and Rupp, Matthias and von Lilienfeld, O Anatole},
journal={Scientific Data},
volume={1},
year={2014},
publisher={Nature Publishing Group}
}
qm9/original (configuration par défaut)
Description de la config : QM9 ne définit aucun split. Ainsi, cette variante place l'ensemble de données QM9 complet dans la répartition du train, dans l'ordre d'origine (pas de brassage).
Mise en cache automatique ( documentation ) : uniquement lorsque
shuffle_files=False
(train)Divisions :
Diviser | Exemples |
---|---|
'train' | 130 831 |
qm9/cormoran
Description de la configuration : Division de l'ensemble de données utilisée par Cormorant. 100 000 trains, 17 748 validations et 13 083 échantillons de test. Le fractionnement se produit après le mélange avec la graine 0. Papier : https://arxiv.org/abs/1906.04015 Fractionnement : https://github.com/risilab/cormorant/blob/master/src/cormorant/data/prepare/qm9.py
Mise en cache automatique ( documentation ) : Oui (test, validation), Uniquement lorsque
shuffle_files=False
(train)Divisions :
Diviser | Exemples |
---|---|
'test' | 13 083 |
'train' | 100 000 |
'validation' | 17 748 |
qm9/dimenet
Description de la configuration : Division de l'ensemble de données utilisée par DimeNet. 110 000 trains, 10 000 validations et 10 831 échantillons de test. Le fractionnement se produit après le mélange avec la graine 42. Papier : https://arxiv.org/abs/2003.03123 Fractionnement : https://github.com/gasteigerjo/dimenet/blob/master/dimenet/training/data_provider.py
Mise en cache automatique ( documentation ) : Oui (test, validation), Uniquement lorsque
shuffle_files=False
(train)Divisions :
Diviser | Exemples |
---|---|
'test' | 10 831 |
'train' | 110 000 |
'validation' | 10 000 |