- বর্ণনা :
QM9-এ C, H, O, N, এবং F দ্বারা গঠিত 134k স্থিতিশীল ছোট জৈব অণুর জন্য গণনা করা জ্যামিতিক, শক্তিবর্ধক, ইলেকট্রনিক এবং তাপগতিগত বৈশিষ্ট্য রয়েছে। যথারীতি, আমরা অচ্যুতিত অণুগুলি সরিয়ে ফেলি এবং অবশিষ্ট 130,831টি প্রদান করি।
সোর্স কোড :
tfds.datasets.qm9.Builder
সংস্করণ :
-
1.0.0
(ডিফল্ট): প্রাথমিক প্রকাশ।
-
ডাউনলোড সাইজ :
82.62 MiB
ডেটাসেটের আকার :
177.16 MiB
বৈশিষ্ট্য গঠন :
FeaturesDict({
'A': float32,
'B': float32,
'C': float32,
'Cv': float32,
'G': float32,
'G_atomization': float32,
'H': float32,
'H_atomization': float32,
'InChI': string,
'InChI_relaxed': string,
'Mulliken_charges': Tensor(shape=(29,), dtype=float32),
'SMILES': string,
'SMILES_relaxed': string,
'U': float32,
'U0': float32,
'U0_atomization': float32,
'U_atomization': float32,
'alpha': float32,
'charges': Tensor(shape=(29,), dtype=int64),
'frequencies': Tensor(shape=(None,), dtype=float32),
'gap': float32,
'homo': float32,
'index': int64,
'lumo': float32,
'mu': float32,
'num_atoms': int64,
'positions': Tensor(shape=(29, 3), dtype=float32),
'r2': float32,
'tag': string,
'zpve': float32,
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
ক | টেনসর | float32 | ||
খ | টেনসর | float32 | ||
গ | টেনসর | float32 | ||
সিভি | টেনসর | float32 | ||
জি | টেনসর | float32 | ||
G_পরমাণুকরণ | টেনসর | float32 | ||
এইচ | টেনসর | float32 | ||
H_পরমাণুকরণ | টেনসর | float32 | ||
InChI | টেনসর | স্ট্রিং | ||
InChI_আরাম | টেনসর | স্ট্রিং | ||
মুলিকেন_চার্জ | টেনসর | (২৯,) | float32 | |
স্মাইল | টেনসর | স্ট্রিং | ||
SMILES_আরাম | টেনসর | স্ট্রিং | ||
উ | টেনসর | float32 | ||
U0 | টেনসর | float32 | ||
U0_পরমাণুকরণ | টেনসর | float32 | ||
U_পরমাণুকরণ | টেনসর | float32 | ||
আলফা | টেনসর | float32 | ||
চার্জ | টেনসর | (২৯,) | int64 | |
ফ্রিকোয়েন্সি | টেনসর | (কোনটিই নয়,) | float32 | |
ফাঁক | টেনসর | float32 | ||
হোমো | টেনসর | float32 | ||
সূচক | টেনসর | int64 | ||
লুমো | টেনসর | float32 | ||
mu | টেনসর | float32 | ||
সংখ্যা_পরমাণু | টেনসর | int64 | ||
অবস্থান | টেনসর | (২৯, ৩) | float32 | |
r2 | টেনসর | float32 | ||
ট্যাগ | টেনসর | স্ট্রিং | ||
zpve | টেনসর | float32 |
তত্ত্বাবধান করা কী (দেখুন
as_supervised
doc ):None
চিত্র ( tfds.show_examples ): সমর্থিত নয়।
উদাহরণ ( tfds.as_dataframe ): অনুপস্থিত।
উদ্ধৃতি :
@article{ramakrishnan2014quantum,
title={Quantum chemistry structures and properties of 134 kilo molecules},
author={Ramakrishnan, Raghunathan and Dral, Pavlo O and Rupp, Matthias and von Lilienfeld, O Anatole},
journal={Scientific Data},
volume={1},
year={2014},
publisher={Nature Publishing Group}
}
qm9/অরিজিনাল (ডিফল্ট কনফিগারেশন)
কনফিগার বিবরণ : QM9 কোনো বিভাজন সংজ্ঞায়িত করে না। তাই এই বৈকল্পিকটি সম্পূর্ণ QM9 ডেটাসেটটিকে ট্রেনের বিভাজনে, আসল ক্রমে (কোনও এলোমেলো করা হবে না) রাখে।
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): শুধুমাত্র যখন
shuffle_files=False
(ট্রেন)বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 130,831 |
qm9/কর্মোর্যান্ট
কনফিগারেশনের বিবরণ : Cormorant দ্বারা ব্যবহৃত ডেটাসেট বিভক্ত। 100,000 ট্রেন, 17,748টি বৈধতা এবং 13,083টি পরীক্ষার নমুনা। বীজের সাথে এলোমেলো করার পরে বিভাজন ঘটে 0। কাগজ: https://arxiv.org/abs/1906.04015 বিভক্ত: https://github.com/risilab/cormorant/blob/master/src/cormorant/data/prepare/qm9.py
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ (পরীক্ষা, বৈধতা), শুধুমাত্র যখন
shuffle_files=False
(ট্রেন)বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'test' | ১৩,০৮৩ |
'train' | 100,000 |
'validation' | 17,748 |
qm9/ডাইমেনেট
কনফিগারেশনের বিবরণ : ডাইমেনেট দ্বারা ব্যবহৃত ডেটাসেট বিভক্ত। 110,000 ট্রেন, 10,000 বৈধতা, এবং 10,831টি পরীক্ষার নমুনা। বীজের সাথে এলোমেলো করার পরে বিভক্ত হয় 42. কাগজ: https://arxiv.org/abs/2003.03123 বিভক্ত: https://github.com/gasteigerjo/dimenet/blob/master/dimenet/training/data_provider.py
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ (পরীক্ষা, বৈধতা), শুধুমাত্র যখন
shuffle_files=False
(ট্রেন)বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'test' | 10,831 |
'train' | 110,000 |
'validation' | 10,000 |