ウィキアン

  • 説明:

WikiANN (PAN-X とも呼ばれる) は、IOB2 形式の LOC (場所)、PER (人)、および ORG (組織) タグで注釈が付けられたウィキペディアの記事で構成される、多言語固有表現認識データセットです。このバージョンは、Rahimi らのバランスの取れたトレーニング、開発、およびテスト分割に対応しています。 (2019)、元の WikiANN コーパスの 282 の言語のうち 176 をサポートしています。

FeaturesDict({
    'langs': Sequence(Text(shape=(), dtype=string)),
    'spans': Sequence(Text(shape=(), dtype=string)),
    'tags': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=7)),
    'tokens': Sequence(Text(shape=(), dtype=string)),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
言語シーケンス(テキスト) (なし、)ストリング
スパンシーケンス(テキスト) (なし、)ストリング
タグシーケンス(クラスラベル) (なし、) int64
トークンシーケンス(テキスト) (なし、)ストリング
@inproceedings{rahimi-etal-2019-massively,
    title = "Massively Multilingual Transfer for {NER}",
    author = "Rahimi, Afshin  and
      Li, Yuan  and
      Cohn, Trevor",
    booktitle = "Proceedings of the 57th Annual Meeting of the Association     for Computational Linguistics",
    month = jul,
    year = "2019",
    address = "Florence, Italy",
    publisher = "Association for Computational Linguistics",
    url = "https://www.aclweb.org/anthology/P19-1015",
    pages = "151--164",
}

wikiann/ace (デフォルト設定)

  • 構成の説明: Wikiann ace の列車/開発/テストの分割

  • データセットサイズ: 54.10 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100

wikiann/af

  • 構成の説明: Wikiann af train/dev/test 分割

  • データセットサイズ: 1.46 MiB

  • スプリット:

スプリット
'test' 1,000
'train' 5,000
'validation' 1,000

ウィキアン/アルズ

  • 構成の説明: Wikiann als train/dev/test 分割

  • データセットサイズ: 72.71 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100

ウィキアン/アム

  • 構成の説明: Wikiann am train/dev/test 分割

  • データセットサイズ: 57.45 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100

ウィキアン/アン

  • 構成の説明: Wikiann ang train/dev/test 分割

  • データセットサイズ: 54.09 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100

ウィキアン/アン

  • 構成の説明: Wikiann an train/dev/test 分割

  • データセットサイズ: 453.48 KiB

  • スプリット:

スプリット
'test' 1,000
'train' 1,000
'validation' 1,000

ウィキアン/アーク

  • 構成の説明: Wikiann アーク トレイン/開発/テストの分割

  • データセットサイズ: 46.72 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100

wikiann/ar

  • 構成の説明: Wikiann ar train/dev/test 分割

  • データセットのサイズ: 7.68 MiB

  • スプリット:

スプリット
'test' 10,000
'train' 20,000
'validation' 10,000

wikiann/arz

  • 構成の説明: Wikiann arz train/dev/test 分割

  • データセットサイズ: 63.88 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100

wikiann/as

  • 構成の説明: Wikiann を train/dev/test 分割として

  • データセットサイズ: 67.52 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100

wikiann/ast

  • 構成の説明: Wikiann ast train/dev/test 分割

  • データセットサイズ: 530.44 KiB

  • スプリット:

スプリット
'test' 1,000
'train' 1,000
'validation' 1,000

ウィキアン/エイ

  • 構成の説明: Wikiann ay train/dev/test 分割

  • データセットサイズ: 35.33 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100

ウィキアン/az

  • 構成の説明: Wikiann az train/dev/test splits

  • データセットサイズ: 2.39 MiB

  • スプリット:

スプリット
'test' 1,000
'train' 10,000
'validation' 1,000

ウィキアン/バー

  • 構成の説明: Wikiann バーのトレーニング/開発/テストの分割

  • データセットサイズ: 43.94 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100

wikiann/ba

  • 構成の説明: Wikiann ba train/dev/test 分割

  • データセットサイズ: 72.95 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100

wikiann/bat-smg

  • 構成の説明: Wikiann bat-smg train/dev/test 分割

  • データセットサイズ: 63.67 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100

ウィキアン/ビー

  • 構成の説明: Wikiann be train/dev/test splits

  • データセットサイズ: 3.63 MiB

  • スプリット:

スプリット
'test' 1,000
'train' 15,000
'validation' 1,000

wikiann/be-x-old

  • 構成の説明: Wikiann be-x-old train/dev/test 分割

  • データセットのサイズ: 1.95 MiB

  • スプリット:

スプリット
'test' 1,000
'train' 5,000
'validation' 1,000

ウィキアン/BG

  • 構成の説明: Wikiann bg train/dev/test 分割

  • データセットのサイズ: 8.79 MiB

  • スプリット:

スプリット
'test' 10,000
'train' 20,000
'validation' 10,000

wikiann/bh

  • 構成の説明: Wikiann bh train/dev/test 分割

  • データセットサイズ: 80.45 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100

ウィキアン/bn

  • 構成の説明: Wikiann bn train/dev/test 分割

  • データセットサイズ: 2.60 MiB

  • スプリット:

スプリット
'test' 1,000
'train' 10,000
'validation' 1,000

wikiann/bo

  • 構成の説明: Wikiann bo train/dev/test splits

  • データセットサイズ: 55.98 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100

wikiann/br

  • 構成の説明: Wikiann br train/dev/test 分割

  • データセットサイズ: 504.28 KiB

  • スプリット:

スプリット
'test' 1,000
'train' 1,000
'validation' 1,000

wikiann/bs

  • 構成の説明: Wikiann bs train/dev/test 分割

  • データセットサイズ: 3.05 MiB

  • スプリット:

スプリット
'test' 1,000
'train' 15,000
'validation' 1,000

wikiann/ca

  • 構成の説明: Wikiann ca train/dev/test 分割

  • データセットサイズ: 5.95 MiB

  • スプリット:

スプリット
'test' 10,000
'train' 20,000
'validation' 10,000

wikiann/cbk-zam

  • 構成の説明: Wikiann cbk-zam の train/dev/test 分割

  • データセットサイズ: 102.73 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100

wikiann/cdo

  • 構成の説明: Wikiann cdo train/dev/test 分割

  • データセットサイズ: 76.46 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100

wikiann/ceb

  • 構成の説明: Wikiann CEB の列車/開発/テストの分割

  • データセットサイズ: 54.40 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100

wikiann/ce

  • 構成の説明: Wikiann ce train/dev/test 分割

  • データセットサイズ: 90.21 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100

wikiann/ckb

  • 構成の説明: Wikiann ckb のトレーニング/開発/テストの分割

  • データセットサイズ: 579.97 KiB

  • スプリット:

スプリット
'test' 1,000
'train' 1,000
'validation' 1,000

wikiann/co

  • 構成の説明: Wikiann co train/dev/test 分割

  • データセットサイズ: 41.70 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100

wikiann/crh

  • 構成の説明: Wikiann crh train/dev/test 分割

  • データセットサイズ: 53.30 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100

ウィキアン/csb

  • 構成の説明: Wikiann csb のトレーニング/開発/テストの分割

  • データセットサイズ: 64.54 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100

wikiann/cs

  • 構成の説明: Wikiann cs のトレーニング/開発/テストの分割

  • データセットサイズ: 7.22 MiB

  • スプリット:

スプリット
'test' 10,000
'train' 20,000
'validation' 10,000

ウィキアン/CV

  • 構成の説明: Wikiann cv train/dev/test 分割

  • データセットサイズ: 66.00 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100

wikiann/cy

  • 構成の説明: Wikiann cy train/dev/test の分割

  • データセットサイズ: 2.08 MiB

  • スプリット:

スプリット
'test' 1,000
'train' 10,000
'validation' 1,000

ウィキアン/ダ

  • 構成の説明: Wikiann da train/dev/test 分割

  • データセットのサイズ: 7.14 MiB

  • スプリット:

スプリット
'test' 10,000
'train' 20,000
'validation' 10,000

wikiann/de

  • 構成の説明: Wikiann de train/dev/test 分割

  • データセットのサイズ: 7.88 MiB

  • スプリット:

スプリット
'test' 10,000
'train' 20,000
'validation' 10,000

ウィキアン/ディク

  • 構成の説明: Wikiann diq train/dev/test 分割

  • データセットサイズ: 53.87 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100

ウィキアン/DV

  • 構成の説明: Wikiann dv train/dev/test 分割

  • データセットサイズ: 73.24 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100

ウィキアン/エル

  • 構成の説明: Wikiann el train/dev/test 分割

  • データセットのサイズ: 9.26 MiB

  • スプリット:

スプリット
'test' 10,000
'train' 20,000
'validation' 10,000

wikiann/eml

  • 構成の説明: Wikiann eml のトレーニング/開発/テストの分割

  • データセットサイズ: 67.16 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100

ウィキアン/en

  • 構成の説明: Wikiann en train/dev/test 分割

  • データセットのサイズ: 6.97 MiB

  • スプリット:

スプリット
'test' 10,000
'train' 20,000
'validation' 10,000

wikiann/eo

  • 構成の説明: Wikiann eo のトレーニング/開発/テストの分割

  • データセットのサイズ: 5.46 MiB

  • スプリット:

スプリット
'test' 10,000
'train' 15,000
'validation' 10,000

wikiann/es

  • 構成の説明: Wikiann es train/dev/test 分割

  • データセットサイズ: 6.33 MiB

  • スプリット:

スプリット
'test' 10,000
'train' 20,000
'validation' 10,000

wikiann/et

  • 構成の説明: Wikiann et train/dev/test 分割

  • データセットサイズ: 6.31 MiB

  • スプリット:

スプリット
'test' 10,000
'train' 15,000
'validation' 10,000

ウィキアン/eu

  • 構成の説明: Wikiann eu のトレーニング/開発/テストの分割

  • データセットのサイズ: 5.82 MiB

  • スプリット:

スプリット
'test' 10,000
'train' 10,000
'validation' 10,000

ウィキアン/内線

  • 構成の説明: Wikiann ext train/dev/test 分割

  • データセットサイズ: 59.86 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100

ウィキアン/ファ

  • 構成の説明: Wikiann fa train/dev/test 分割

  • データセットのサイズ: 7.82 MiB

  • スプリット:

スプリット
'test' 10,000
'train' 20,000
'validation' 10,000

wikiann/fi

  • 構成の説明: Wikiann fi train/dev/test 分割

  • データセットのサイズ: 7.51 MiB

  • スプリット:

スプリット
'test' 10,000
'train' 20,000
'validation' 10,000

wikiann/fiu-vro

  • 構成の説明: Wikiann fiu-vro train/dev/test 分割

  • データセットサイズ: 65.91 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100

wikiann/fo

  • 構成の説明: Wikiann for train/dev/test 分割

  • データセットサイズ: 55.92 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100

wikiann/frr

  • 構成の説明: Wikiann frr train/dev/test 分割

  • データセットサイズ: 41.98 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100

wikiann/fr

  • 構成の説明: Wikiann fr train/dev/test 分割

  • データセットサイズ: 6.46 MiB

  • スプリット:

スプリット
'test' 10,000
'train' 20,000
'validation' 10,000

ウィキアン/ファー

  • 構成の説明: Wikiann 毛皮の列車/開発/テストの分割

  • データセットサイズ: 62.83 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100

wikiann/fy

  • 構成の説明: Wikiann fy train/dev/test 分割

  • データセットサイズ: 521.68 KiB

  • スプリット:

スプリット
'test' 1,000
'train' 1,000
'validation' 1,000

ウィキアン/ガン

  • 構成の説明: Wikiann gan のトレーニング/開発/テストの分割

  • データセットサイズ: 45.24 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100

ウィキアン/ガ

  • 構成の説明: Wikiann ga train/dev/test 分割

  • データセットサイズ: 544.53 KiB

  • スプリット:

スプリット
'test' 1,000
'train' 1,000
'validation' 1,000

wikiann/gd

  • 構成の説明: Wikiann gd train/dev/test 分割

  • データセットサイズ: 50.07 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100

wikiann/gl

  • 構成の説明: Wikiann gl train/dev/test 分割

  • データセットのサイズ: 5.48 MiB

  • スプリット:

スプリット
'test' 10,000
'train' 15,000
'validation' 10,000

wikiann/gn

  • 構成の説明: Wikiann gn train/dev/test 分割

  • データセットサイズ: 59.81 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100

ウィキアン/区

  • 構成の説明: Wikiann gu train/dev/test 分割

  • データセットサイズ: 105.52 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100

ウィキアン/ハク

  • 構成の説明: Wikiann hak train/dev/test の分割

  • データセットサイズ: 46.47 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100

ウィキアン/彼

  • 構成の説明: Wikiann he train/dev/test の分割

  • データセットのサイズ: 8.55 MiB

  • スプリット:

スプリット
'test' 10,000
'train' 20,000
'validation' 10,000

ウィキアン/こんにちは

  • 構成の説明: Wikiann hi train/dev/test 分割

  • データセットサイズ: 1.59 MiB

  • スプリット:

スプリット
'test' 1,000
'train' 5,000
'validation' 1,000

ウィキアン/時

  • 構成の説明: Wikiann hr train/dev/test 分割

  • データセットサイズ: 7.12 MiB

  • スプリット:

スプリット
'test' 10,000
'train' 20,000
'validation' 10,000

wikiann/hsb

  • 構成の説明: Wikiann hsb のトレーニング/開発/テストの分割

  • データセットサイズ: 57.13 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100

ウィキアン/フー

  • 構成の説明: Wikiann hu train/dev/test 分割

  • データセットのサイズ: 7.69 MiB

  • スプリット:

スプリット
'test' 10,000
'train' 20,000
'validation' 10,000

ウィキアン/ハイ

  • 構成の説明: Wikiann hy train/dev/test の分割

  • データセットサイズ: 3.42 MiB

  • スプリット:

スプリット
'test' 1,000
'train' 15,000
'validation' 1,000

wikiann/ia

  • 構成の説明: Wikiann ia train/dev/test 分割

  • データセットサイズ: 69.12 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100

wikiann/id

  • 構成の説明: Wikiann id train/dev/test 分割

  • データセットサイズ: 6.14 MiB

  • スプリット:

スプリット
'test' 10,000
'train' 20,000
'validation' 10,000

wikiann/ig

  • 構成の説明: Wikiann ig train/dev/test 分割

  • データセットサイズ: 42.87 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100

ウィキアン/イロ

  • 構成の説明: Wikiann ilo のトレーニング/開発/テストの分割

  • データセットサイズ: 44.54 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100

wikiann/io

  • 構成の説明: Wikiann io train/dev/test 分割

  • データセットサイズ: 46.46 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100

wikiann/は

  • 構成の説明: Wikiann はトレーニング/開発/テストの分割です

  • データセットサイズ: 552.81 KiB

  • スプリット:

スプリット
'test' 1,000
'train' 1,000
'validation' 1,000

ウィキアン/イット

  • 構成の説明: Wikiann it train/dev/test の分割

  • データセットのサイズ: 6.86 MiB

  • スプリット:

スプリット
'test' 10,000
'train' 20,000
'validation' 10,000

wikiann/ja

  • 構成の説明: Wikiann ja train/dev/test 分割

  • データセットのサイズ: 14.80 MiB

  • スプリット:

スプリット
'test' 10,000
'train' 20,000
'validation' 10,000

wikiann/jbo

  • 構成の説明: Wikiann jbo のトレーニング/開発/テストの分割

  • データセットサイズ: 42.70 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100

wikiann/jv

  • 構成の説明: Wikiann jv train/dev/test 分割

  • データセットサイズ: 46.62 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100

wikiann/ka

  • 構成の説明: Wikiann ka train/dev/test 分割

  • データセットのサイズ: 8.47 MiB

  • スプリット:

スプリット
'test' 10,000
'train' 10,000
'validation' 10,000

wikiann/kk

  • 構成の説明: Wikiann kk train/dev/test 分割

  • データセットサイズ: 696.23 KiB

  • スプリット:

スプリット
'test' 1,000
'train' 1,000
'validation' 1,000

ウィキアン/km

  • 構成の説明: Wikiann km train/dev/test 分割

  • データセットサイズ: 90.85 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100

wikiann/kn

  • 構成の説明: Wikiann kn train/dev/test 分割

  • データセットサイズ: 87.73 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100

ウィキアン/コ

  • 構成の説明: Wikiann ko train/dev/test 分割

  • データセットのサイズ: 7.81 MiB

  • スプリット:

スプリット
'test' 10,000
'train' 20,000
'validation' 10,000

wikiann/ksh

  • 構成の説明: Wikiann ksh のトレーニング/開発/テストの分割

  • データセットサイズ: 57.31 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100

wikiann/区

  • 構成の説明: Wikiann ku train/dev/test 分割

  • データセットサイズ: 51.26 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100

wikiann/ky

  • 構成の説明: Wikiann ky の train/dev/test 分割

  • データセットサイズ: 75.74 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100

wikiann/la

  • 構成の説明: Wikiann la train/dev/test 分割

  • データセットサイズ: 1.15 MiB

  • スプリット:

スプリット
'test' 1,000
'train' 5,000
'validation' 1,000

ウィキアン/ポンド

  • 構成の説明: Wikiann lb train/dev/test 分割

  • データセットサイズ: 1.28 MiB

  • スプリット:

スプリット
'test' 1,000
'train' 5,000
'validation' 1,000

wikiann/lij

  • 構成の説明: Wikiann lij train/dev/test 分割

  • データセットサイズ: 61.82 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100

ウィキアン/リー

  • 構成の説明: Wikiann li train/dev/test 分割

  • データセットサイズ: 47.45 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100

wikiann/lmo

  • 構成の説明: Wikiann lmo train/dev/test 分割

  • データセットサイズ: 60.66 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100

wikiann/ln

  • 構成の説明: Wikiann ln train/dev/test 分割

  • データセットサイズ: 53.14 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100

wikiann/lt

  • 構成の説明: Wikiann lt train/dev/test 分割

  • データセットのサイズ: 5.09 MiB

  • スプリット:

スプリット
'test' 10,000
'train' 10,000
'validation' 10,000

wikiann/lv

  • 構成の説明: Wikiann lv train/dev/test 分割

  • データセットのサイズ: 5.07 MiB

  • スプリット:

スプリット
'test' 10,000
'train' 10,000
'validation' 10,000

wikiann/map-bms

  • 構成の説明: Wikiann map-bms train/dev/test 分割

  • データセットサイズ: 53.08 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100

ウィキアン/mg

  • 構成の説明: Wikiann mg train/dev/test 分割

  • データセットサイズ: 54.92 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100

wikiann/mhr

  • 構成の説明: Wikiann mhr の train/dev/test 分割

  • データセットサイズ: 57.46 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100

ウィキアン/分

  • 構成の説明: Wikiann min train/dev/test 分割

  • データセットサイズ: 59.47 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100

ウィキアン/マイル

  • 構成の説明: Wikiann mi train/dev/test 分割

  • データセットサイズ: 75.39 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100

wikiann/mk

  • 構成の説明: Wikiann mk train/dev/test 分割

  • データセットサイズ: 3.03 MiB

  • スプリット:

スプリット
'test' 1,000
'train' 10,000
'validation' 1,000
  • ( tfds.as_dataframe ): 最初の 100 個の構成についてのみ表示されます。

ウィキアン/ml

  • 構成の説明: Wikiann ml のトレーニング/開発/テストの分割

  • データセットサイズ: 3.68 MiB

  • スプリット:

スプリット
'test' 1,000
'train' 10,000
'validation' 1,000
  • ( tfds.as_dataframe ): 最初の 100 個の構成についてのみ表示されます。

ウィキアン/分

  • 構成の説明: Wikiann mn train/dev/test 分割

  • データセットサイズ: 57.44 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100
  • ( tfds.as_dataframe ): 最初の 100 個の構成についてのみ表示されます。

ウィキアン/ミスター

  • 構成の説明: Wikiann mr train/dev/test 分割

  • データセットサイズ: 1.88 MiB

  • スプリット:

スプリット
'test' 1,000
'train' 5,000
'validation' 1,000
  • ( tfds.as_dataframe ): 最初の 100 個の構成についてのみ表示されます。

ウィキアン/ミリ秒

  • 構成の説明: Wikiann ms train/dev/test 分割

  • データセットサイズ: 3.33 MiB

  • スプリット:

スプリット
'test' 1,000
'train' 20,000
'validation' 1,000
  • ( tfds.as_dataframe ): 最初の 100 個の構成についてのみ表示されます。

ウィキアン/mt

  • 構成の説明: Wikiann mt train/dev/test 分割

  • データセットサイズ: 56.14 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100
  • ( tfds.as_dataframe ): 最初の 100 個の構成についてのみ表示されます。

wikiann/mwl

  • 構成の説明: Wikiann mwl train/dev/test 分割

  • データセットサイズ: 90.71 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100
  • ( tfds.as_dataframe ): 最初の 100 個の構成についてのみ表示されます。

ウィキアン/私の

  • 構成の説明: Wikiann my train/dev/test splits

  • データセットサイズ: 120.06 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100
  • ( tfds.as_dataframe ): 最初の 100 個の構成についてのみ表示されます。

ウィキアン/mzn

  • 構成の説明: Wikiann mzn train/dev/test 分割

  • データセットサイズ: 60.55 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100
  • ( tfds.as_dataframe ): 最初の 100 個の構成についてのみ表示されます。

wikiann/昼寝

  • 構成の説明: Wikiann nap train/dev/test 分割

  • データセットサイズ: 54.66 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100
  • ( tfds.as_dataframe ): 最初の 100 個の構成についてのみ表示されます。

wikiann/nds

  • 構成の説明: Wikiann nds train/dev/test 分割

  • データセットサイズ: 59.27 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100
  • ( tfds.as_dataframe ): 最初の 100 個の構成についてのみ表示されます。

wikiann/ne

  • 構成の説明: Wikiann ne train/dev/test 分割

  • データセットサイズ: 86.38 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100
  • ( tfds.as_dataframe ): 最初の 100 個の構成についてのみ表示されます。

wikiann/nl

  • 構成の説明: Wikiann nl のトレーニング/開発/テストの分割

  • データセットサイズ: 7.03 MiB

  • スプリット:

スプリット
'test' 10,000
'train' 20,000
'validation' 10,000
  • ( tfds.as_dataframe ): 最初の 100 個の構成についてのみ表示されます。

wikiann/nn

  • 構成の説明: Wikiann nn のトレーニング/開発/テストの分割

  • データセットサイズ: 4.23 MiB

  • スプリット:

スプリット
'test' 1,000
'train' 20,000
'validation' 1,000
  • ( tfds.as_dataframe ): 最初の 100 個の構成についてのみ表示されます。

ウィキアン/いいえ

  • 構成の説明: Wikiann no train/dev/test splits

  • データセットのサイズ: 7.45 MiB

  • スプリット:

スプリット
'test' 10,000
'train' 20,000
'validation' 10,000
  • ( tfds.as_dataframe ): 最初の 100 個の構成についてのみ表示されます。

wikiann/nov

  • 構成の説明: Wikiann nov train/dev/test 分割

  • データセットサイズ: 41.55 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100
  • ( tfds.as_dataframe ): 最初の 100 個の構成についてのみ表示されます。

wikiann/oc

  • 構成の説明: Wikiann oc train/dev/test 分割

  • データセットサイズ: 47.08 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100
  • ( tfds.as_dataframe ): 最初の 100 個の構成についてのみ表示されます。

ウィキアン/または

  • 構成の説明: Wikiann または train/dev/test 分割

  • データセットサイズ: 78.96 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100
  • ( tfds.as_dataframe ): 最初の 100 個の構成についてのみ表示されます。

wikiann/os

  • 構成の説明: Wikiann os train/dev/test 分割

  • データセットサイズ: 64.83 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100
  • ( tfds.as_dataframe ): 最初の 100 個の構成についてのみ表示されます。

wikiann/pa

  • 構成の説明: Wikiann pa train/dev/test 分割

  • データセットサイズ: 65.44 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100
  • ( tfds.as_dataframe ): 最初の 100 個の構成についてのみ表示されます。

wikiann/pdc

  • 構成の説明: Wikiann pdc のトレーニング/開発/テストの分割

  • データセットサイズ: 54.89 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100
  • ( tfds.as_dataframe ): 最初の 100 個の構成についてのみ表示されます。

wikiann/pl

  • 構成の説明: Wikiann pl のトレーニング/開発/テストの分割

  • データセットのサイズ: 7.25 MiB

  • スプリット:

スプリット
'test' 10,000
'train' 20,000
'validation' 10,000
  • ( tfds.as_dataframe ): 最初の 100 個の構成についてのみ表示されます。

wikiann/pms

  • 構成の説明: Wikiann pms train/dev/test 分割

  • データセットサイズ: 60.25 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100
  • ( tfds.as_dataframe ): 最初の 100 個の構成についてのみ表示されます。

wikiann/pnb

  • 構成の説明: Wikiann pnb のトレーニング/開発/テストの分割

  • データセットサイズ: 51.34 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100
  • ( tfds.as_dataframe ): 最初の 100 個の構成についてのみ表示されます。

wikiann/ps

  • 構成の説明: Wikiann ps のトレーニング/開発/テストの分割

  • データセットサイズ: 102.92 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100
  • ( tfds.as_dataframe ): 最初の 100 個の構成についてのみ表示されます。

ウィキアン/ポイント

  • 構成の説明: Wikiann pt train/dev/test 分割

  • データセットサイズ: 6.24 MiB

  • スプリット:

スプリット
'test' 10,000
'train' 20,000
'validation' 10,000
  • ( tfds.as_dataframe ): 最初の 100 個の構成についてのみ表示されます。

wikiann/qu

  • 構成の説明: Wikiann qu train/dev/test 分割

  • データセットサイズ: 44.98 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100
  • ( tfds.as_dataframe ): 最初の 100 個の構成についてのみ表示されます。

wikiann/rm

  • 構成の説明: Wikiann rm のトレーニング/開発/テストの分割

  • データセットサイズ: 67.64 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100
  • ( tfds.as_dataframe ): 最初の 100 個の構成についてのみ表示されます。

wikiann/ro

  • 構成の説明: Wikiann ro train/dev/test 分割

  • データセットのサイズ: 6.57 MiB

  • スプリット:

スプリット
'test' 10,000
'train' 20,000
'validation' 10,000
  • ( tfds.as_dataframe ): 最初の 100 個の構成についてのみ表示されます。

wikiann/ru

  • 構成の説明: Wikiann ru train/dev/test 分割

  • データセットサイズ: 8.39 MiB

  • スプリット:

スプリット
'test' 10,000
'train' 20,000
'validation' 10,000
  • ( tfds.as_dataframe ): 最初の 100 個の構成についてのみ表示されます。

ウィキアン/RW

  • 構成の説明: Wikiann rw train/dev/test 分割

  • データセットサイズ: 42.88 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100
  • ( tfds.as_dataframe ): 最初の 100 個の構成についてのみ表示されます。

ウィキアン/サー

  • 構成の説明: Wikiann sah train/dev/test 分割

  • データセットサイズ: 68.91 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100
  • ( tfds.as_dataframe ): 最初の 100 個の構成についてのみ表示されます。

wikiann/sa

  • 構成の説明: Wikiann sa train/dev/test 分割

  • データセットサイズ: 120.55 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100
  • ( tfds.as_dataframe ): 最初の 100 個の構成についてのみ表示されます。

wikiann/scn

  • 構成の説明: Wikiann scn のトレーニング/開発/テストの分割

  • データセットサイズ: 47.93 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100
  • ( tfds.as_dataframe ): 最初の 100 個の構成についてのみ表示されます。

ウィキアン/スコ

  • 構成の説明: Wikiann sco のトレーニング/開発/テストの分割

  • データセットサイズ: 50.61 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100
  • ( tfds.as_dataframe ): 最初の 100 個の構成についてのみ表示されます。

ウィキアン/sd

  • 構成の説明: Wikiann sd train/dev/test 分割

  • データセットサイズ: 98.67 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100
  • ( tfds.as_dataframe ): 最初の 100 個の構成についてのみ表示されます。

wikiann/sh

  • 構成の説明: Wikiann sh train/dev/test 分割

  • データセットのサイズ: 5.86 MiB

  • スプリット:

スプリット
'test' 10,000
'train' 20,000
'validation' 10,000
  • ( tfds.as_dataframe ): 最初の 100 個の構成についてのみ表示されます。

wikiann/シンプル

  • 構成の説明: Wikiann のシンプルなトレーニング/開発/テストの分割

  • データセットサイズ: 4.23 MiB

  • スプリット:

スプリット
'test' 1,000
'train' 20,000
'validation' 1,000
  • ( tfds.as_dataframe ): 最初の 100 個の構成についてのみ表示されます。

wikiann/si

  • 構成の説明: Wikiann si train/dev/test 分割

  • データセットサイズ: 80.41 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100
  • ( tfds.as_dataframe ): 最初の 100 個の構成についてのみ表示されます。

wikiann/sk

  • 構成の説明: Wikiann sk train/dev/test 分割

  • データセットサイズ: 7.01 MiB

  • スプリット:

スプリット
'test' 10,000
'train' 20,000
'validation' 10,000
  • ( tfds.as_dataframe ): 最初の 100 個の構成についてのみ表示されます。

wikiann/sl

  • 構成の説明: Wikiann sl train/dev/test 分割

  • データセットのサイズ: 5.61 MiB

  • スプリット:

スプリット
'test' 10,000
'train' 15,000
'validation' 10,000
  • ( tfds.as_dataframe ): 最初の 100 個の構成についてのみ表示されます。

ウィキアン/そう

  • 構成の説明: Wikiann のようにトレーニング/開発/テストを分割

  • データセットサイズ: 48.82 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100
  • ( tfds.as_dataframe ): 最初の 100 個の構成についてのみ表示されます。

ウィキアン/平方

  • 構成の説明: Wikiann sq train/dev/test 分割

  • データセットサイズ: 1.11 MiB

  • スプリット:

スプリット
'test' 1,000
'train' 5,000
'validation' 1,000
  • ( tfds.as_dataframe ): 最初の 100 個の構成についてのみ表示されます。

ウィキアン/シニア

  • 構成の説明: Wikiann sr のトレーニング/開発/テストの分割

  • データセットサイズ: 8.22 MiB

  • スプリット:

スプリット
'test' 10,000
'train' 20,000
'validation' 10,000
  • ( tfds.as_dataframe ): 最初の 100 個の構成についてのみ表示されます。

wikiann/su

  • 構成の説明: Wikiann su train/dev/test 分割

  • データセットサイズ: 51.14 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100
  • ( tfds.as_dataframe ): 最初の 100 個の構成についてのみ表示されます。

ウィキアン/SV

  • 構成の説明: Wikiann sv のトレーニング/開発/テストの分割

  • データセットのサイズ: 7.70 MiB

  • スプリット:

スプリット
'test' 10,000
'train' 20,000
'validation' 10,000
  • ( tfds.as_dataframe ): 最初の 100 個の構成についてのみ表示されます。

wikiann/sw

  • 構成の説明: Wikiann sw train/dev/test 分割

  • データセットサイズ: 427.56 KiB

  • スプリット:

スプリット
'test' 1,000
'train' 1,000
'validation' 1,000
  • ( tfds.as_dataframe ): 最初の 100 個の構成についてのみ表示されます。

wikiann/szl

  • 構成の説明: Wikiann szl のトレーニング/開発/テストの分割

  • データセットサイズ: 46.39 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100
  • ( tfds.as_dataframe ): 最初の 100 個の構成についてのみ表示されます。

ウィキアン/タ

  • 構成の説明: Wikiann ta train/dev/test 分割

  • データセットサイズ: 5.08 MiB

  • スプリット:

スプリット
'test' 1,000
'train' 15,000
'validation' 1,000
  • ( tfds.as_dataframe ): 最初の 100 個の構成についてのみ表示されます。

ウィキアン/テ

  • 構成の説明: Wikiann te train/dev/test 分割

  • データセットサイズ: 906.64 KiB

  • スプリット:

スプリット
'test' 1,000
'train' 1,000
'validation' 1,000
  • ( tfds.as_dataframe ): 最初の 100 個の構成についてのみ表示されます。

wikiann/tg

  • 構成の説明: Wikiann tg train/dev/test 分割

  • データセットサイズ: 67.61 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100
  • ( tfds.as_dataframe ): 最初の 100 個の構成についてのみ表示されます。

ウィキアン/th

  • 構成の説明: Wikiann th train/dev/test 分割

  • データセットサイズ: 29.46 MiB

  • スプリット:

スプリット
'test' 10,000
'train' 20,000
'validation' 10,000
  • ( tfds.as_dataframe ): 最初の 100 個の構成についてのみ表示されます。

wikiann/tk

  • 構成の説明: Wikiann tk のトレーニング/開発/テストの分割

  • データセットサイズ: 49.70 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100
  • ( tfds.as_dataframe ): 最初の 100 個の構成についてのみ表示されます。

wikiann/tl

  • 構成の説明: Wikiann tl train/dev/test 分割

  • データセットサイズ: 1.60 MiB

  • スプリット:

スプリット
'test' 1,000
'train' 10,000
'validation' 1,000
  • ( tfds.as_dataframe ): 最初の 100 個の構成についてのみ表示されます。

wikiann/tr

  • 構成の説明: Wikiann tr train/dev/test 分割

  • データセットのサイズ: 6.94 MiB

  • スプリット:

スプリット
'test' 10,000
'train' 20,000
'validation' 10,000
  • ( tfds.as_dataframe ): 最初の 100 個の構成についてのみ表示されます。

ウィキアン/tt

  • 構成の説明: Wikiann tt のトレーニング/開発/テストの分割

  • データセットサイズ: 684.14 KiB

  • スプリット:

スプリット
'test' 1,000
'train' 1,000
'validation' 1,000
  • ( tfds.as_dataframe ): 最初の 100 個の構成についてのみ表示されます。

wikiann/ug

  • 構成の説明: Wikiann ug train/dev/test 分割

  • データセットサイズ: 75.12 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100
  • ( tfds.as_dataframe ): 最初の 100 個の構成についてのみ表示されます。

ウィキアン/英国

  • 構成の説明: Wikiann uk train/dev/test 分割

  • データセットのサイズ: 9.39 MiB

  • スプリット:

スプリット
'test' 10,000
'train' 20,000
'validation' 10,000
  • ( tfds.as_dataframe ): 最初の 100 個の構成についてのみ表示されます。

wikiann/ur

  • 構成の説明: Wikiann ur train/dev/test 分割

  • データセットのサイズ: 3.95 MiB

  • スプリット:

スプリット
'test' 1,000
'train' 20,000
'validation' 1,000
  • ( tfds.as_dataframe ): 最初の 100 個の構成についてのみ表示されます。

wikiann/uz

  • 構成の説明: Wikiann uz train/dev/test 分割

  • データセットサイズ: 469.58 KiB

  • スプリット:

スプリット
'test' 1,000
'train' 1,000
'validation' 1,000
  • ( tfds.as_dataframe ): 最初の 100 個の構成についてのみ表示されます。

wikiann/vec

  • 構成の説明: Wikiann vec トレイン/開発/テスト分割

  • データセットサイズ: 48.79 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100
  • ( tfds.as_dataframe ): 最初の 100 個の構成についてのみ表示されます。

wikiann/vep

  • 構成の説明: Wikiann vep のトレーニング/開発/テストの分割

  • データセットサイズ: 51.53 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100
  • ( tfds.as_dataframe ): 最初の 100 個の構成についてのみ表示されます。

ウィキアン/vi

  • 構成の説明: Wikiann vi train/dev/test 分割

  • データセットサイズ: 6.22 MiB

  • スプリット:

スプリット
'test' 10,000
'train' 20,000
'validation' 10,000
  • ( tfds.as_dataframe ): 最初の 100 個の構成についてのみ表示されます。

wikiann/vls

  • 構成の説明: Wikiann vls のトレーニング/開発/テストの分割

  • データセットサイズ: 59.63 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100
  • ( tfds.as_dataframe ): 最初の 100 個の構成についてのみ表示されます。

wikiann/vo

  • 構成の説明: Wikiann vo train/dev/test 分割

  • データセットサイズ: 38.88 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100
  • ( tfds.as_dataframe ): 最初の 100 個の構成についてのみ表示されます。

ウィキアン/戦争

  • 構成の説明: Wikiann war train/dev/test の分割

  • データセットサイズ: 47.04 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100
  • ( tfds.as_dataframe ): 最初の 100 個の構成についてのみ表示されます。

ウィキアン/ワ

  • 構成の説明: Wikiann は train/dev/test 分割

  • データセットサイズ: 50.23 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100
  • ( tfds.as_dataframe ): 最初の 100 個の構成についてのみ表示されます。

ウィキアン/ウー

  • 構成の説明: Wikiann wuu train/dev/test 分割

  • データセットサイズ: 48.28 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100
  • ( tfds.as_dataframe ): 最初の 100 個の構成についてのみ表示されます。

ウィキアン/xmf

  • 構成の説明: Wikiann xmf train/dev/test 分割

  • データセットサイズ: 92.71 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100
  • ( tfds.as_dataframe ): 最初の 100 個の構成についてのみ表示されます。

ウィキアン/イー

  • 構成の説明: Wikiann yi train/dev/test 分割

  • データセットサイズ: 63.57 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100
  • ( tfds.as_dataframe ): 最初の 100 個の構成についてのみ表示されます。

ウィキアン/よ

  • 構成の説明: Wikiann yo train/dev/test の分割

  • データセットサイズ: 47.97 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100
  • ( tfds.as_dataframe ): 最初の 100 個の構成についてのみ表示されます。

ウィキアン/ゼア

  • 構成の説明: Wikiann zea train/dev/test の分割

  • データセットサイズ: 53.35 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100
  • ( tfds.as_dataframe ): 最初の 100 個の構成についてのみ表示されます。

wikiann/zh-クラシック

  • 構成の説明: Wikiann zh-classical train/dev/test の分割

  • データセットサイズ: 129.73 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100
  • ( tfds.as_dataframe ): 最初の 100 個の構成についてのみ表示されます。

wikiann/zh-min-nan

  • 構成の説明: Wikiann zh-min-nan train/dev/test 分割

  • データセットサイズ: 59.82 KiB

  • スプリット:

スプリット
'test' 100
'train' 100
'validation' 100
  • ( tfds.as_dataframe ): 最初の 100 個の構成についてのみ表示されます。

wikiann/zh

  • 構成の説明: Wikiann zh train/dev/test 分割

  • データセットのサイズ: 10.87 MiB

  • スプリット:

スプリット
'test' 10,000
'train' 20,000
'validation' 10,000
  • ( tfds.as_dataframe ): 最初の 100 個の構成についてのみ表示されます。

wikiann/zh-yue

  • 構成の説明: Wikiann zh-yue train/dev/test 分割

  • データセットサイズ: 12.62 MiB

  • スプリット:

スプリット
'test' 10,000
'train' 20,000
'validation' 10,000
  • ( tfds.as_dataframe ): 最初の 100 個の構成についてのみ表示されます。