đi lên_kb

Tài liệu tham khảo:

kinh điển

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:ascent_kb/canonical')
  • Sự miêu tả :
This dataset contains 8.9M commonsense assertions extracted by the Ascent pipeline (https://ascent.mpi-inf.mpg.de/).
Tách ra Ví dụ
'train' 8904060
  • Đặc trưng :
    "arg1": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    "rel": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    "arg2": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    "support": {
        "dtype": "int64",
        "id": null,
        "_type": "Value"
    "facets": [
            "value": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            "type": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            "support": {
                "dtype": "int64",
                "id": null,
                "_type": "Value"
    "source_sentences": [
            "text": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            "source": {
                "dtype": "string",
                "id": null,
                "_type": "Value"


Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:ascent_kb/open')
  • Sự miêu tả :
This dataset contains 8.9M commonsense assertions extracted by the Ascent pipeline (https://ascent.mpi-inf.mpg.de/).
Tách ra Ví dụ
'train' 8904060
  • Đặc trưng :
    "subject": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    "predicate": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    "object": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    "support": {
        "dtype": "int64",
        "id": null,
        "_type": "Value"
    "facets": [
            "value": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            "type": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            "support": {
                "dtype": "int64",
                "id": null,
                "_type": "Value"
    "source_sentences": [
            "text": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            "source": {
                "dtype": "string",
                "id": null,
                "_type": "Value"