- คำอธิบาย :
QM9 ประกอบด้วยคุณสมบัติทางเรขาคณิต พลังงาน อิเล็กทรอนิกส์ และอุณหพลศาสตร์ที่คำนวณแล้วสำหรับโมเลกุลอินทรีย์ขนาดเล็กที่มีความเสถียร 134,000 โมเลกุลซึ่งประกอบด้วย C, H, O, N และ F ตามปกติ เราจะกำจัดโมเลกุลที่ไม่เคยมีมาก่อนและจัดเตรียมส่วนที่เหลืออีก 130,831 โมเลกุล
ซอร์สโค้ด :
tfds.datasets.qm9.Builder
รุ่น :
-
1.0.0
(ค่าเริ่มต้น): การเปิดตัวครั้งแรก
-
ขนาดดาวน์โหลด :
82.62 MiB
ขนาดชุดข้อมูล :
177.16 MiB
โครงสร้างคุณสมบัติ :
FeaturesDict({
'A': float32,
'B': float32,
'C': float32,
'Cv': float32,
'G': float32,
'G_atomization': float32,
'H': float32,
'H_atomization': float32,
'InChI': string,
'InChI_relaxed': string,
'Mulliken_charges': Tensor(shape=(29,), dtype=float32),
'SMILES': string,
'SMILES_relaxed': string,
'U': float32,
'U0': float32,
'U0_atomization': float32,
'U_atomization': float32,
'alpha': float32,
'charges': Tensor(shape=(29,), dtype=int64),
'frequencies': Tensor(shape=(None,), dtype=float32),
'gap': float32,
'homo': float32,
'index': int64,
'lumo': float32,
'mu': float32,
'num_atoms': int64,
'positions': Tensor(shape=(29, 3), dtype=float32),
'r2': float32,
'tag': string,
'zpve': float32,
})
- เอกสารคุณสมบัติ :
คุณสมบัติ | ระดับ | รูปร่าง | ประเภทD | คำอธิบาย |
---|---|---|---|---|
คุณสมบัติDict | ||||
ก | เทนเซอร์ | ลอย32 | ||
บี | เทนเซอร์ | ลอย32 | ||
ค | เทนเซอร์ | ลอย32 | ||
ประวัติย่อ | เทนเซอร์ | ลอย32 | ||
ช | เทนเซอร์ | ลอย32 | ||
G_การทำให้เป็นละออง | เทนเซอร์ | ลอย32 | ||
ชม | เทนเซอร์ | ลอย32 | ||
H_การทำให้เป็นละออง | เทนเซอร์ | ลอย32 | ||
อินชิ | เทนเซอร์ | เชือก | ||
อินชิ_ผ่อนคลาย | เทนเซอร์ | เชือก | ||
Mulliken_charges | เทนเซอร์ | (29,) | ลอย32 | |
ยิ้ม | เทนเซอร์ | เชือก | ||
SMILES_ผ่อนคลาย | เทนเซอร์ | เชือก | ||
คุณ | เทนเซอร์ | ลอย32 | ||
U0 | เทนเซอร์ | ลอย32 | ||
U0_การทำให้เป็นละออง | เทนเซอร์ | ลอย32 | ||
U_การทำให้เป็นละออง | เทนเซอร์ | ลอย32 | ||
อัลฟ่า | เทนเซอร์ | ลอย32 | ||
ค่าธรรมเนียม | เทนเซอร์ | (29,) | int64 | |
ความถี่ | เทนเซอร์ | (ไม่มี,) | ลอย32 | |
ช่องว่าง | เทนเซอร์ | ลอย32 | ||
โฮโม | เทนเซอร์ | ลอย32 | ||
ดัชนี | เทนเซอร์ | int64 | ||
ลูโม | เทนเซอร์ | ลอย32 | ||
หมู่ | เทนเซอร์ | ลอย32 | ||
num_atoms | เทนเซอร์ | int64 | ||
ตำแหน่ง | เทนเซอร์ | (29, 3) | ลอย32 | |
r2 | เทนเซอร์ | ลอย32 | ||
แท็ก | เทนเซอร์ | เชือก | ||
zpve | เทนเซอร์ | ลอย32 |
คีย์ภายใต้การดูแล (ดู
as_supervised
doc ):None
รูปภาพ ( tfds.show_examples ): ไม่รองรับ
การอ้างอิง :
@article{ramakrishnan2014quantum,
title={Quantum chemistry structures and properties of 134 kilo molecules},
author={Ramakrishnan, Raghunathan and Dral, Pavlo O and Rupp, Matthias and von Lilienfeld, O Anatole},
journal={Scientific Data},
volume={1},
year={2014},
publisher={Nature Publishing Group}
}
qm9/ดั้งเดิม (การกำหนดค่าเริ่มต้น)
คำอธิบายการกำหนดค่า : QM9 ไม่ได้กำหนดการแยกใดๆ ดังนั้นตัวแปรนี้จึงวางชุดข้อมูล QM9 แบบเต็มไว้ในการแยกรถไฟตามลำดับเดิม (ไม่มีการสับเปลี่ยน)
แคชอัตโนมัติ ( เอกสารประกอบ ): เฉพาะเมื่อ
shuffle_files=False
(train)แยก :
แยก | ตัวอย่าง |
---|---|
'train' | 130,831 |
- ตัวอย่าง ( tfds.as_dataframe ):
qm9/นกกาน้ำ
คำอธิบายการกำหนดค่า : การแยกชุดข้อมูลที่ใช้โดย Cormorant รถไฟ 100,000 ขบวน การตรวจสอบความถูกต้อง 17,748 รายการ และตัวอย่างการทดสอบ 13,083 รายการ การแยกเกิดขึ้นหลังจากการสับด้วยเมล็ด 0 กระดาษ: https://arxiv.org/abs/1906.04015 แยก: https://github.com/risilab/cormorant/blob/master/src/cormorant/data/prepare/qm9.py
แคชอัตโนมัติ ( เอกสาร ): ใช่ (ทดสอบ การตรวจสอบ) เฉพาะเมื่อ
shuffle_files=False
(train)แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 13,083 |
'train' | 100,000 |
'validation' | 17,748 |
- ตัวอย่าง ( tfds.as_dataframe ):
qm9/ไดเมนเนต
คำอธิบายการกำหนดค่า : การแยกชุดข้อมูลที่ใช้โดย DimeNet รถไฟ 110,000 ขบวน การตรวจสอบ 10,000 รายการ และตัวอย่างทดสอบ 10,831 รายการ การแยกเกิดขึ้นหลังจากการสับด้วยเมล็ด 42 เอกสาร: https://arxiv.org/abs/2003.03123 การแยก: https://github.com/gasteigerjo/dimenet/blob/master/dimenet/training/data_provider.py
แคชอัตโนมัติ ( เอกสาร ): ใช่ (ทดสอบ การตรวจสอบ) เฉพาะเมื่อ
shuffle_files=False
(train)แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 10,831 |
'train' | 110,000 |
'validation' | 10,000 |
- ตัวอย่าง ( tfds.as_dataframe ):