- Sự miêu tả :
QM9 bao gồm các đặc tính hình học, năng lượng, điện tử và nhiệt động được tính toán cho 134k phân tử hữu cơ nhỏ ổn định được tạo thành từ C, H, O, N và F. Như thường lệ, chúng tôi loại bỏ các phân tử không bị biến đổi và cung cấp 130.831 phân tử còn lại.
Trang chủ : https://doi.org/10.6084/m9.figshare.c.978904.v5
Mã nguồn :
tfds.datasets.qm9.Builder
Phiên bản :
-
1.0.0
(mặc định): Bản phát hành đầu tiên.
-
Kích thước tải xuống :
82.62 MiB
Kích thước tập dữ liệu :
177.16 MiB
Cấu trúc tính năng :
FeaturesDict({
'A': float32,
'B': float32,
'C': float32,
'Cv': float32,
'G': float32,
'G_atomization': float32,
'H': float32,
'H_atomization': float32,
'InChI': string,
'InChI_relaxed': string,
'Mulliken_charges': Tensor(shape=(29,), dtype=float32),
'SMILES': string,
'SMILES_relaxed': string,
'U': float32,
'U0': float32,
'U0_atomization': float32,
'U_atomization': float32,
'alpha': float32,
'charges': Tensor(shape=(29,), dtype=int64),
'frequencies': Tensor(shape=(None,), dtype=float32),
'gap': float32,
'homo': float32,
'index': int64,
'lumo': float32,
'mu': float32,
'num_atoms': int64,
'positions': Tensor(shape=(29, 3), dtype=float32),
'r2': float32,
'tag': string,
'zpve': float32,
})
- Tài liệu tính năng :
Tính năng | Lớp học | Hình dạng | loại D | Sự miêu tả |
---|---|---|---|---|
Tính năngDict | ||||
MỘT | Tenxơ | phao32 | ||
B | Tenxơ | phao32 | ||
C | Tenxơ | phao32 | ||
CV | Tenxơ | phao32 | ||
G | Tenxơ | phao32 | ||
G_atomization | Tenxơ | phao32 | ||
H | Tenxơ | phao32 | ||
H_nguyên tử hóa | Tenxơ | phao32 | ||
InChI | Tenxơ | sợi dây | ||
InChI_thư giãn | Tenxơ | sợi dây | ||
Mulliken_charges | Tenxơ | (29,) | phao32 | |
Mỉm cười | Tenxơ | sợi dây | ||
SMILES_thư giãn | Tenxơ | sợi dây | ||
bạn | Tenxơ | phao32 | ||
U0 | Tenxơ | phao32 | ||
U0_atomization | Tenxơ | phao32 | ||
U_atomization | Tenxơ | phao32 | ||
alpha | Tenxơ | phao32 | ||
phí | Tenxơ | (29,) | int64 | |
tần số | Tenxơ | (Không có,) | phao32 | |
khoảng cách | Tenxơ | phao32 | ||
đồng tính | Tenxơ | phao32 | ||
mục lục | Tenxơ | int64 | ||
ánh sáng | Tenxơ | phao32 | ||
mu | Tenxơ | phao32 | ||
số_nguyên tử | Tenxơ | int64 | ||
chức vụ | Tenxơ | (29, 3) | phao32 | |
r2 | Tenxơ | phao32 | ||
nhãn | Tenxơ | sợi dây | ||
zpve | Tenxơ | phao32 |
Khóa được giám sát (Xem
as_supervised
doc ):None
Hình ( tfds.show_examples ): Không được hỗ trợ.
Ví dụ ( tfds.as_dataframe ): Thiếu.
Trích dẫn :
@article{ramakrishnan2014quantum,
title={Quantum chemistry structures and properties of 134 kilo molecules},
author={Ramakrishnan, Raghunathan and Dral, Pavlo O and Rupp, Matthias and von Lilienfeld, O Anatole},
journal={Scientific Data},
volume={1},
year={2014},
publisher={Nature Publishing Group}
}
qm9/bản gốc (cấu hình mặc định)
Mô tả cấu hình : QM9 không xác định bất kỳ sự phân chia nào. Vì vậy, biến thể này đặt toàn bộ tập dữ liệu QM9 vào phần tách đoàn tàu, theo thứ tự ban đầu (không xáo trộn).
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Chỉ khi
shuffle_files=False
(train)Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 130.831 |
qm9/chim cốc
Mô tả cấu hình : Phân chia tập dữ liệu được Cormorant sử dụng. 100.000 chuyến tàu, 17.748 xác nhận và 13.083 mẫu thử nghiệm. Quá trình phân tách xảy ra sau khi xáo trộn với hạt giống 0. Giấy: https://arxiv.org/abs/1906.04015 Phân tách: https://github.com/risilab/cormorant/blob/master/src/cormorant/data/prepare/qm9.py
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Có (kiểm tra, xác thực), Chỉ khi
shuffle_files=False
(train)Chia tách :
Tách ra | Ví dụ |
---|---|
'test' | 13.083 |
'train' | 100.000 |
'validation' | 17.748 |
qm9/dimenet
Mô tả cấu hình : Phân chia tập dữ liệu được DimeNet sử dụng. 110.000 chuyến tàu, 10.000 xác nhận và 10.831 mẫu thử nghiệm. Quá trình phân tách xảy ra sau khi xáo trộn hạt giống 42. Giấy: https://arxiv.org/abs/2003.03123 Phân tách: https://github.com/gasteigerjo/dimenet/blob/master/dimenet/training/data_provider.py
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Có (kiểm tra, xác thực), Chỉ khi
shuffle_files=False
(train)Chia tách :
Tách ra | Ví dụ |
---|---|
'test' | 10,831 |
'train' | 110.000 |
'validation' | 10.000 |