- 説明:
CoNLL-2003 の共有タスクは、言語に依存しない名前付きエンティティの認識に関係し、前の 3 つのグループに属さない個人、場所、組織、およびその他のエンティティの名前の 4 種類の名前付きエンティティに集中しています。
ホームページ: https ://www.aclweb.org/anthology/W03-0419/
ソースコード:
tfds.text.conll2003.Conll2003
バージョン:
-
1.0.0
(デフォルト): 初期リリース。
-
ダウンロードサイズ:
959.94 KiB
データセットのサイズ:
3.87 MiB
自動キャッシュ(ドキュメント): はい
スプリット:
スプリット | 例 |
---|---|
'dev' | 3,251 |
'test' | 3,454 |
'train' | 14,042 |
- 機能構造:
FeaturesDict({
'chunks': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=23)),
'ner': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=9)),
'pos': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=47)),
'tokens': Sequence(Text(shape=(), dtype=string)),
})
- 機能のドキュメント:
特徴 | クラス | 形 | Dtype | 説明 |
---|---|---|---|---|
特徴辞書 | ||||
チャンク | シーケンス(クラスラベル) | (なし、) | int64 | |
ナー | シーケンス(クラスラベル) | (なし、) | int64 | |
位置 | シーケンス(クラスラベル) | (なし、) | int64 | |
トークン | シーケンス(テキスト) | (なし、) | ストリング |
監視されたキー(
as_supervised
docを参照):None
図( tfds.show_examples ): サポートされていません。
例( tfds.as_dataframe ):
- 引用:
@inproceedings{tjong-kim-sang-de-meulder-2003-introduction,
title = "Introduction to the {C}o{NLL}-2003 Shared Task: Language-Independent Named Entity Recognition",
author = "Tjong Kim Sang, Erik F. and
De Meulder, Fien",
booktitle = "Proceedings of the Seventh Conference on Natural Language Learning at {HLT}-{NAACL} 2003",
year = "2003",
url = "https://www.aclweb.org/anthology/W03-0419",
pages = "142--147",
}
conll2003/conll2003 (デフォルト設定)
、- 説明:
CoNLL-2003 の共有タスクは、言語に依存しない名前付きエンティティの認識に関係し、前の 3 つのグループに属さない個人、場所、組織、およびその他のエンティティの名前の 4 種類の名前付きエンティティに集中しています。
ホームページ: https ://www.aclweb.org/anthology/W03-0419/
ソースコード:
tfds.text.conll2003.Conll2003
バージョン:
-
1.0.0
(デフォルト): 初期リリース。
-
ダウンロードサイズ:
959.94 KiB
データセットのサイズ:
3.87 MiB
自動キャッシュ(ドキュメント): はい
スプリット:
スプリット | 例 |
---|---|
'dev' | 3,251 |
'test' | 3,454 |
'train' | 14,042 |
- 機能構造:
FeaturesDict({
'chunks': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=23)),
'ner': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=9)),
'pos': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=47)),
'tokens': Sequence(Text(shape=(), dtype=string)),
})
- 機能のドキュメント:
特徴 | クラス | 形 | Dtype | 説明 |
---|---|---|---|---|
特徴辞書 | ||||
チャンク | シーケンス(クラスラベル) | (なし、) | int64 | |
ナー | シーケンス(クラスラベル) | (なし、) | int64 | |
位置 | シーケンス(クラスラベル) | (なし、) | int64 | |
トークン | シーケンス(テキスト) | (なし、) | ストリング |
監視されたキー(
as_supervised
docを参照):None
図( tfds.show_examples ): サポートされていません。
例( tfds.as_dataframe ):
- 引用:
@inproceedings{tjong-kim-sang-de-meulder-2003-introduction,
title = "Introduction to the {C}o{NLL}-2003 Shared Task: Language-Independent Named Entity Recognition",
author = "Tjong Kim Sang, Erik F. and
De Meulder, Fien",
booktitle = "Proceedings of the Seventh Conference on Natural Language Learning at {HLT}-{NAACL} 2003",
year = "2003",
url = "https://www.aclweb.org/anthology/W03-0419",
pages = "142--147",
}