- 説明:
Universal Dependencies (UD) は、さまざまな人間の言語間で文法 (品詞、形態学的特徴、および構文の依存関係) の一貫した注釈を付けるためのフレームワークです。 UD は、70 以上の言語で 100 以上のツリーバンクを作成する 200 人以上の貢献者によるオープン コミュニティの取り組みです。 UD を初めて使用する場合は、まず概要の最初の部分を読んでから、注釈のガイドラインを参照してください。
ソース コード:
tfds.datasets.xtreme_pos.Builder
バージョン:
-
1.0.0
(デフォルト): 初期リリース。
-
ダウンロードサイズ:
338.76 MiB
自動キャッシュ(ドキュメント): はい
機能構造:
FeaturesDict({
'tokens': Sequence(Text(shape=(), dtype=string)),
'upos': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=18)),
})
- 機能のドキュメント:
特徴 | クラス | 形 | Dtype | 説明 |
---|---|---|---|---|
特徴辞書 | ||||
トークン | シーケンス(テキスト) | (なし、) | ストリング | |
ウポス | シーケンス(クラスラベル) | (なし、) | int64 |
監視されたキー(
as_supervised
docを参照):None
図( tfds.show_examples ): サポートされていません。
引用:
@article{nivre2018universal,
title={Universal Dependencies 2.2},
author={Nivre, Joakim and Abrams, Mitchell and Agi{'c}, {
{Z} }eljko
and Ahrenberg, Lars and Antonsen, Lene and Aranzabe, Maria Jesus and
Arutie, Gashaw and Asahara, Masayuki and Ateyah, Luma and Attia,
Mohammed and others},
year={2018}
}
xtreme_pos/xtreme_pos_af (デフォルト設定)
データセットサイズ:
445.94 KiB
スプリット:
スプリット | 例 |
---|---|
'dev' | 194 |
'test' | 425 |
'train' | 1,315 |
- 例( tfds.as_dataframe ):
xtreme_pos/xtreme_pos_ar
データセットサイズ:
3.35 MiB
スプリット:
スプリット | 例 |
---|---|
'dev' | 909 |
'test' | 1,680 |
'train' | 6,075 |
- 例( tfds.as_dataframe ):
xtreme_pos/xtreme_pos_bg
データセットサイズ:
2.14 MiB
スプリット:
スプリット | 例 |
---|---|
'dev' | 1,115 |
'test' | 1,116 |
'train' | 8,907 |
- 例( tfds.as_dataframe ):
xtreme_pos/xtreme_pos_de
データセットのサイズ:
37.62 MiB
スプリット:
スプリット | 例 |
---|---|
'dev' | 19,233 |
'test' | 22,458 |
'train' | 166,849 |
- 例( tfds.as_dataframe ):
xtreme_pos/xtreme_pos_el
データセットのサイズ:
7.17 MiB
スプリット:
スプリット | 例 |
---|---|
'dev' | 2,559 |
'test' | 2,809 |
'train' | 28,152 |
- 例( tfds.as_dataframe ):
xtreme_pos/xtreme_pos_en
データセットのサイズ:
4.67 MiB
スプリット:
スプリット | 例 |
---|---|
'dev' | 4,699 |
'test' | 6,165 |
'train' | 26,825 |
- 例( tfds.as_dataframe ):
xtreme_pos/xtreme_pos_es
データセットサイズ:
8.26 MiB
スプリット:
スプリット | 例 |
---|---|
'dev' | 3,054 |
'test' | 3,147 |
'train' | 28,492 |
- 例( tfds.as_dataframe ):
xtreme_pos/xtreme_pos_et
データセットのサイズ:
4.84 MiB
スプリット:
スプリット | 例 |
---|---|
'dev' | 3,125 |
'test' | 3,760 |
'train' | 25,749 |
- 例( tfds.as_dataframe ):
xtreme_pos/xtreme_pos_eu
データセットサイズ:
1.27 MiB
スプリット:
スプリット | 例 |
---|---|
'dev' | 1,798 |
'test' | 1,799 |
'train' | 5,396 |
- 例( tfds.as_dataframe ):
xtreme_pos/xtreme_pos_fa
データセットサイズ:
1.73 MiB
スプリット:
スプリット | 例 |
---|---|
'dev' | 599 |
'test' | 600 |
'train' | 4,798 |
- 例( tfds.as_dataframe ):
xtreme_pos/xtreme_pos_fi
データセットのサイズ:
4.48 MiB
スプリット:
スプリット | 例 |
---|---|
'dev' | 3,239 |
'test' | 4,422 |
'train' | 27,198 |
- 例( tfds.as_dataframe ):
xtreme_pos/xtreme_pos_fr
データセットのサイズ:
7.28 MiB
スプリット:
スプリット | 例 |
---|---|
'dev' | 5,979 |
'test' | 9,465 |
'train' | 47,308 |
- 例( tfds.as_dataframe ):
xtreme_pos/xtreme_pos_he
データセットサイズ:
1.57 MiB
スプリット:
スプリット | 例 |
---|---|
'dev' | 484 |
'test' | 491 |
'train' | 5,241 |
- 例( tfds.as_dataframe ):
xtreme_pos/xtreme_pos_hi
データセットのサイズ:
5.78 MiB
スプリット:
スプリット | 例 |
---|---|
'dev' | 1,884 |
'test' | 2,909 |
'train' | 14,752 |
- 例( tfds.as_dataframe ):
xtreme_pos/xtreme_pos_hu
データセットサイズ:
438.07 KiB
スプリット:
スプリット | 例 |
---|---|
'dev' | 441 |
'test' | 449 |
'train' | 910 |
- 例( tfds.as_dataframe ):
xtreme_pos/xtreme_pos_id
データセットサイズ:
1.31 MiB
スプリット:
スプリット | 例 |
---|---|
'dev' | 559 |
'test' | 1,557 |
'train' | 4,477 |
- 例( tfds.as_dataframe ):
xtreme_pos/xtreme_pos_it
データセットのサイズ:
6.85 MiB
スプリット:
スプリット | 例 |
---|---|
'dev' | 2,278 |
'test' | 3,518 |
'train' | 29,685 |
- 例( tfds.as_dataframe ):
xtreme_pos/xtreme_pos_ja
データセットのサイズ:
3.57 MiB
スプリット:
スプリット | 例 |
---|---|
'dev' | 8,938 |
'test' | 10,253 |
'train' | 47,926 |
- 例( tfds.as_dataframe ):
xtreme_pos/xtreme_pos_kk
データセットサイズ:
167.15 KiB
スプリット:
スプリット | 例 |
---|---|
'test' | 1,047人 |
'train' | 31 |
- 例( tfds.as_dataframe ):
xtreme_pos/xtreme_pos_ko
データセットのサイズ:
5.82 MiB
スプリット:
スプリット | 例 |
---|---|
'dev' | 3,016 |
'test' | 4,276 |
'train' | 27,410 |
- 例( tfds.as_dataframe ):
xtreme_pos/xtreme_pos_mr
データセットサイズ:
56.14 KiB
スプリット:
スプリット | 例 |
---|---|
'dev' | 46 |
'test' | 47 |
'train' | 373 |
- 例( tfds.as_dataframe ):
xtreme_pos/xtreme_pos_nl
データセットのサイズ:
2.90 MiB
スプリット:
スプリット | 例 |
---|---|
'dev' | 1,394 |
'test' | 1,471 |
'train' | 18,051 |
- 例( tfds.as_dataframe ):
xtreme_pos/xtreme_pos_pt
データセットのサイズ:
4.65 MiB
スプリット:
スプリット | 例 |
---|---|
'dev' | 1,770 |
'test' | 2,681 |
'train' | 17,992 |
- 例( tfds.as_dataframe ):
xtreme_pos/xtreme_pos_ru
データセットのサイズ:
20.25 MiB
スプリット:
スプリット | 例 |
---|---|
'dev' | 9,960 |
'test' | 11,336 |
'train' | 67,435 |
- 例( tfds.as_dataframe ):
xtreme_pos/xtreme_pos_ta
データセットサイズ:
3.65 KiB
スプリット:
スプリット | 例 |
---|---|
'test' | 55 |
- 例( tfds.as_dataframe ):
xtreme_pos/xtreme_pos_te
データセットサイズ:
143.77 KiB
スプリット:
スプリット | 例 |
---|---|
'dev' | 131 |
'test' | 146 |
'train' | 1,051 |
- 例( tfds.as_dataframe ):
xtreme_pos/xtreme_pos_th
データセットサイズ:
377.24 KiB
スプリット:
スプリット | 例 |
---|---|
'test' | 1,000 |
- 例( tfds.as_dataframe ):
xtreme_pos/xtreme_pos_tl
データセットサイズ:
228.78 KiB
スプリット:
スプリット | 例 |
---|---|
'dev' | 80 |
'test' | 120 |
'train' | 400 |
- 例( tfds.as_dataframe ):
xtreme_pos/xtreme_pos_tr
データセットサイズ:
1.06 MiB
スプリット:
スプリット | 例 |
---|---|
'dev' | 988 |
'test' | 4,785 |
'train' | 3,664 |
- 例( tfds.as_dataframe ):
xtreme_pos/xtreme_pos_ur
データセットサイズ:
1.50 MiB
スプリット:
スプリット | 例 |
---|---|
'dev' | 552 |
'test' | 535 |
'train' | 4,043 |
- 例( tfds.as_dataframe ):
xtreme_pos/xtreme_pos_vi
データセットサイズ:
454.32 KiB
スプリット:
スプリット | 例 |
---|---|
'dev' | 800 |
'test' | 800 |
'train' | 1,400 |
- 例( tfds.as_dataframe ):
xtreme_pos/xtreme_pos_yo
データセットサイズ:
22.65 KiB
スプリット:
スプリット | 例 |
---|---|
'test' | 100 |
- 例( tfds.as_dataframe ):
xtreme_pos/xtreme_pos_zh
データセットのサイズ:
3.29 MiB
スプリット:
スプリット | 例 |
---|---|
'dev' | 3,038 |
'test' | 5,528 |
'train' | 18,998 |
- 例( tfds.as_dataframe ):