msr_genomics_kbcomp

Tài liệu tham khảo:

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:msr_genomics_kbcomp')
  • Sự miêu tả :
The database is derived from the NCI PID Pathway Interaction Database, and the textual mentions are extracted from cooccurring pairs of genes in PubMed abstracts, processed and annotated by Literome (Poon et al. 2014). This dataset was used in the paper Compositional Learning of Embeddings for Relation Paths in Knowledge Bases and Text (Toutanova, Lin, Yih, Poon, and Quirk, 2016).
  • Giấy phép : Không có giấy phép được biết đến
  • Phiên bản : 1.1.0
  • Chia tách :
Tách ra Ví dụ
'test' 2784
'train' 12160
'validation' 1315
  • Đặc trưng :
{
    "GENE1": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "relation": {
        "num_classes": 3,
        "names": [
            "Positive_regulation",
            "Negative_regulation",
            "Family"
        ],
        "names_file": null,
        "id": null,
        "_type": "ClassLabel"
    },
    "GENE2": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    }
}