- وصف :
يتكون QM9 من خصائص هندسية وحيوية وإلكترونية وديناميكية حرارية محسوبة لـ 134 ألف جزيء عضوي صغير مستقر يتكون من C وH وO وN وF. كالعادة، نقوم بإزالة الجزيئات غير المميزة وتوفير الـ 130,831 المتبقية.
الصفحة الرئيسية : https://doi.org/10.6084/m9.figshare.c.978904.v5
كود المصدر :
tfds.datasets.qm9.Builder
الإصدارات :
-
1.0.0
(افتراضي): الإصدار الأولي.
-
حجم التحميل :
82.62 MiB
حجم مجموعة البيانات :
177.16 MiB
هيكل الميزة :
FeaturesDict({
'A': float32,
'B': float32,
'C': float32,
'Cv': float32,
'G': float32,
'G_atomization': float32,
'H': float32,
'H_atomization': float32,
'InChI': string,
'InChI_relaxed': string,
'Mulliken_charges': Tensor(shape=(29,), dtype=float32),
'SMILES': string,
'SMILES_relaxed': string,
'U': float32,
'U0': float32,
'U0_atomization': float32,
'U_atomization': float32,
'alpha': float32,
'charges': Tensor(shape=(29,), dtype=int64),
'frequencies': Tensor(shape=(None,), dtype=float32),
'gap': float32,
'homo': float32,
'index': int64,
'lumo': float32,
'mu': float32,
'num_atoms': int64,
'positions': Tensor(shape=(29, 3), dtype=float32),
'r2': float32,
'tag': string,
'zpve': float32,
})
- وثائق الميزة :
ميزة | فصل | شكل | نوع D | وصف |
---|---|---|---|---|
المميزاتDict | ||||
أ | الموتر | float32 | ||
ب | الموتر | float32 | ||
ج | الموتر | float32 | ||
السيرة الذاتية | الموتر | float32 | ||
ز | الموتر | float32 | ||
التفتيت | الموتر | float32 | ||
ح | الموتر | float32 | ||
H_ الانحلال | الموتر | float32 | ||
إنتشي | الموتر | خيط | ||
InChI_relaxed | الموتر | خيط | ||
Mulliken_charges | الموتر | (29،) | float32 | |
ابتسامات | الموتر | خيط | ||
SMILES_Relaxed | الموتر | خيط | ||
ش | الموتر | float32 | ||
U0 | الموتر | float32 | ||
U0_atomization | الموتر | float32 | ||
U_ الانحلال | الموتر | float32 | ||
ألفا | الموتر | float32 | ||
رسوم | الموتر | (29،) | int64 | |
الترددات | الموتر | (لا أحد،) | float32 | |
فجوة | الموتر | float32 | ||
هومو | الموتر | float32 | ||
فِهرِس | الموتر | int64 | ||
lumo | الموتر | float32 | ||
مو | الموتر | float32 | ||
num_atoms | الموتر | int64 | ||
المواقف | الموتر | (29، 3) | float32 | |
ص2 | الموتر | float32 | ||
بطاقة شعار | الموتر | خيط | ||
com.zpve | الموتر | float32 |
المفاتيح الخاضعة للإشراف (راجع
as_supervised
doc ):None
الشكل ( tfds.show_examples ): غير مدعوم.
أمثلة ( tfds.as_dataframe ): مفقود.
الاقتباس :
@article{ramakrishnan2014quantum,
title={Quantum chemistry structures and properties of 134 kilo molecules},
author={Ramakrishnan, Raghunathan and Dral, Pavlo O and Rupp, Matthias and von Lilienfeld, O Anatole},
journal={Scientific Data},
volume={1},
year={2014},
publisher={Nature Publishing Group}
}
qm9/الأصلي (التكوين الافتراضي)
وصف التكوين : لا يحدد QM9 أي تقسيمات. لذلك يضع هذا المتغير مجموعة بيانات QM9 الكاملة في تقسيم القطار، بالترتيب الأصلي (بدون خلط).
التخزين المؤقت التلقائي ( الوثائق ): فقط عندما
shuffle_files=False
(القطار)الإنشقاقات :
ينقسم | أمثلة |
---|---|
'train' | 130,831 |
qm9/غاق
وصف التكوين : تقسيم مجموعة البيانات المستخدمة بواسطة Cormorant. 100000 قطار و17748 تحققًا و13083 عينة اختبار. يحدث الانقسام بعد خلط البذور 0. الورقة: https://arxiv.org/abs/1906.04015 الانقسام: https://github.com/risilab/cormorant/blob/master/src/cormorant/data/prepare/qm9.py
تخزين مؤقت تلقائي ( الوثائق ): نعم (اختبار، التحقق من الصحة)، فقط عندما
shuffle_files=False
(تدريب)الإنشقاقات :
ينقسم | أمثلة |
---|---|
'test' | 13,083 |
'train' | 100.000 |
'validation' | 17,748 |
qm9/ديمينت
وصف التكوين : تقسيم مجموعة البيانات المستخدمة بواسطة DimeNet. 110.000 قطار و10.000 تحقق و10.831 عينة اختبار. يحدث الانقسام بعد الخلط مع البذور 42. الورقة: https://arxiv.org/abs/2003.03123 الانقسام: https://github.com/gasteigerjo/dimenet/blob/master/dimenet/training/data_provider.py
تخزين مؤقت تلقائي ( الوثائق ): نعم (اختبار، التحقق من الصحة)، فقط عندما
shuffle_files=False
(تدريب)الإنشقاقات :
ينقسم | أمثلة |
---|---|
'test' | 10,831 |
'train' | 110.000 |
'validation' | 10.000 |