- Açıklama :
CoNLL-2002'nin paylaşılan görevi, dilden bağımsız adlandırılmış varlık tanıma ile ilgilidir. Adlandırılmış varlık türleri şunları içerir: önceki üç gruba ait olmayan kişiler, yerler, kuruluşlar ve çeşitli varlıkların adları. Paylaşılan görevin katılımcılarına en az iki dil için eğitim ve test verileri sunuldu. Bu paylaşılan görevde eğitim verileri dışındaki bilgi kaynakları kullanılmış olabilir.
Anasayfa : https://aclanthology.org/W02-2024/
Kaynak kodu :
tfds.text.conll2002.Conll2002
sürümler :
-
1.0.0
(varsayılan): İlk sürüm.
-
Otomatik önbelleğe alınmış ( belgeleme ): Evet
Denetlenen anahtarlar (Bkz
as_supervised
doc ):None
Şekil ( tfds.show_examples ): Desteklenmiyor.
Alıntı :
@inproceedings{tjong-kim-sang-2002-introduction,
title = "Introduction to the {C}o{NLL}-2002 Shared Task: Language-Independent Named Entity Recognition",
author = "Tjong Kim Sang, Erik F.",
booktitle = "{COLING}-02: The 6th Conference on Natural Language Learning 2002 ({C}o{NLL}-2002)",
year = "2002",
url = "https://aclanthology.org/W02-2024",
}
conll2002/es (varsayılan yapılandırma)
İndirme boyutu :
3.95 MiB
Veri kümesi boyutu :
3.52 MiB
bölmeler :
Bölmek | örnekler |
---|---|
'dev' | 1.916 |
'test' | 1.518 |
'train' | 8.324 |
- Özellik yapısı :
FeaturesDict({
'ner': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=9)),
'pos': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=60)),
'tokens': Sequence(Text(shape=(), dtype=string)),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Açıklama |
---|---|---|---|---|
ÖzelliklerDict | ||||
ner | Sıra(SınıfEtiketi) | (Hiçbiri,) | int64 | |
pozisyon | Sıra(SınıfEtiketi) | (Hiçbiri,) | int64 | |
belirteçler | Sıra(Metin) | (Hiçbiri,) | sicim |
- Örnekler ( tfds.as_dataframe ):
conll2002/nl
İndirme boyutu :
3.47 MiB
Veri kümesi boyutu :
3.55 MiB
bölmeler :
Bölmek | örnekler |
---|---|
'dev' | 2.896 |
'test' | 5.196 |
'train' | 15.807 |
- Özellik yapısı :
FeaturesDict({
'ner': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=9)),
'pos': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=12)),
'tokens': Sequence(Text(shape=(), dtype=string)),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Açıklama |
---|---|---|---|---|
ÖzelliklerDict | ||||
ner | Sıra(SınıfEtiketi) | (Hiçbiri,) | int64 | |
pozisyon | Sıra(SınıfEtiketi) | (Hiçbiri,) | int64 | |
belirteçler | Sıra(Metin) | (Hiçbiri,) | sicim |
- Örnekler ( tfds.as_dataframe ):