qm9

  • বর্ণনা :

QM9-এ C, H, O, N, এবং F দ্বারা গঠিত 134k স্থিতিশীল ছোট জৈব অণুর জন্য গণনা করা জ্যামিতিক, শক্তিবর্ধক, ইলেকট্রনিক এবং তাপগতিগত বৈশিষ্ট্য রয়েছে। যথারীতি, আমরা অচ্যুতিত অণুগুলি সরিয়ে ফেলি এবং অবশিষ্ট 130,831টি প্রদান করি।

  • হোমপেজ : https://doi.org/10.6084/m9.figshare.c.978904.v5

  • সোর্স কোড : tfds.datasets.qm9.Builder

  • সংস্করণ :

    • 1.0.0 (ডিফল্ট): প্রাথমিক প্রকাশ।
  • ডাউনলোড সাইজ : 82.62 MiB

  • ডেটাসেটের আকার : 177.16 MiB

  • বৈশিষ্ট্য গঠন :

FeaturesDict({
    'A': float32,
    'B': float32,
    'C': float32,
    'Cv': float32,
    'G': float32,
    'G_atomization': float32,
    'H': float32,
    'H_atomization': float32,
    'InChI': string,
    'InChI_relaxed': string,
    'Mulliken_charges': Tensor(shape=(29,), dtype=float32),
    'SMILES': string,
    'SMILES_relaxed': string,
    'U': float32,
    'U0': float32,
    'U0_atomization': float32,
    'U_atomization': float32,
    'alpha': float32,
    'charges': Tensor(shape=(29,), dtype=int64),
    'frequencies': Tensor(shape=(None,), dtype=float32),
    'gap': float32,
    'homo': float32,
    'index': int64,
    'lumo': float32,
    'mu': float32,
    'num_atoms': int64,
    'positions': Tensor(shape=(29, 3), dtype=float32),
    'r2': float32,
    'tag': string,
    'zpve': float32,
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
টেনসর float32
টেনসর float32
টেনসর float32
সিভি টেনসর float32
জি টেনসর float32
G_পরমাণুকরণ টেনসর float32
এইচ টেনসর float32
H_পরমাণুকরণ টেনসর float32
InChI টেনসর স্ট্রিং
InChI_আরাম টেনসর স্ট্রিং
মুলিকেন_চার্জ টেনসর (২৯,) float32
স্মাইল টেনসর স্ট্রিং
SMILES_আরাম টেনসর স্ট্রিং
টেনসর float32
U0 টেনসর float32
U0_পরমাণুকরণ টেনসর float32
U_পরমাণুকরণ টেনসর float32
আলফা টেনসর float32
চার্জ টেনসর (২৯,) int64
ফ্রিকোয়েন্সি টেনসর (কোনটিই নয়,) float32
ফাঁক টেনসর float32
হোমো টেনসর float32
সূচক টেনসর int64
লুমো টেনসর float32
mu টেনসর float32
সংখ্যা_পরমাণু টেনসর int64
অবস্থান টেনসর (২৯, ৩) float32
r2 টেনসর float32
ট্যাগ টেনসর স্ট্রিং
zpve টেনসর float32
  • তত্ত্বাবধান করা কী (দেখুন as_supervised doc ): None

  • চিত্র ( tfds.show_examples ): সমর্থিত নয়।

  • উদাহরণ ( tfds.as_dataframe ): অনুপস্থিত।

  • উদ্ধৃতি :

@article{ramakrishnan2014quantum,
  title={Quantum chemistry structures and properties of 134 kilo molecules},
  author={Ramakrishnan, Raghunathan and Dral, Pavlo O and Rupp, Matthias and von Lilienfeld, O Anatole},
  journal={Scientific Data},
  volume={1},
  year={2014},
  publisher={Nature Publishing Group}
}

qm9/অরিজিনাল (ডিফল্ট কনফিগারেশন)

  • কনফিগার বিবরণ : QM9 কোনো বিভাজন সংজ্ঞায়িত করে না। তাই এই বৈকল্পিকটি সম্পূর্ণ QM9 ডেটাসেটটিকে ট্রেনের বিভাজনে, আসল ক্রমে (কোনও এলোমেলো করা হবে না) রাখে।

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): শুধুমাত্র যখন shuffle_files=False (ট্রেন)

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 130,831

qm9/কর্মোর্যান্ট

  • কনফিগারেশনের বিবরণ : Cormorant দ্বারা ব্যবহৃত ডেটাসেট বিভক্ত। 100,000 ট্রেন, 17,748টি বৈধতা এবং 13,083টি পরীক্ষার নমুনা। বীজের সাথে এলোমেলো করার পরে বিভাজন ঘটে 0। কাগজ: https://arxiv.org/abs/1906.04015 বিভক্ত: https://github.com/risilab/cormorant/blob/master/src/cormorant/data/prepare/qm9.py

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ (পরীক্ষা, বৈধতা), শুধুমাত্র যখন shuffle_files=False (ট্রেন)

  • বিভাজন :

বিভক্ত উদাহরণ
'test' ১৩,০৮৩
'train' 100,000
'validation' 17,748

qm9/ডাইমেনেট

  • কনফিগারেশনের বিবরণ : ডাইমেনেট দ্বারা ব্যবহৃত ডেটাসেট বিভক্ত। 110,000 ট্রেন, 10,000 বৈধতা, এবং 10,831টি পরীক্ষার নমুনা। বীজের সাথে এলোমেলো করার পরে বিভক্ত হয় 42. কাগজ: https://arxiv.org/abs/2003.03123 বিভক্ত: https://github.com/gasteigerjo/dimenet/blob/master/dimenet/training/data_provider.py

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ (পরীক্ষা, বৈধতা), শুধুমাত্র যখন shuffle_files=False (ট্রেন)

  • বিভাজন :

বিভক্ত উদাহরণ
'test' 10,831
'train' 110,000
'validation' 10,000