wiki_tóm tắt

Tài liệu tham khảo:

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:wiki_summary')
  • Sự miêu tả :
The dataset extracted from Persian Wikipedia into the form of articles and highlights and cleaned the dataset into pairs of articles and highlights and reduced the articles' length (only version 1.0.0) and highlights' length to a maximum of 512 and 128, respectively, suitable for parsBERT.
  • Giấy phép : Không có giấy phép được biết đến
  • Phiên bản : 1.1.0
  • Chia tách :
Tách ra Ví dụ
'test' 5638
'train' 45654
'validation' 5074
  • Đặc trưng :
    "id": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    "link": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    "title": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    "article": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    "highlights": {
        "dtype": "string",
        "id": null,
        "_type": "Value"