- توضیحات :
وظیفه مشترک CoNLL-2003 مربوط به تشخیص موجودیت نامگذاری شده مستقل از زبان است و بر چهار نوع موجودیت نامگذاری شده متمرکز است: افراد، مکانها، سازمانها و نامهای موجودیتهای متفرقه که به سه گروه قبلی تعلق ندارند.
صفحه اصلی : https://www.aclweb.org/anthology/W03-0419/
کد منبع :
tfds.text.conll2003.Conll2003
نسخه ها :
-
1.0.0
(پیش فرض): انتشار اولیه.
-
حجم دانلود :
959.94 KiB
حجم مجموعه داده :
3.87 MiB
ذخیره خودکار ( اسناد ): بله
تقسیم ها :
شکاف | مثال ها |
---|---|
'dev' | 3,251 |
'test' | 3,454 |
'train' | 14,042 |
- ساختار ویژگی :
FeaturesDict({
'chunks': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=23)),
'ner': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=9)),
'pos': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=47)),
'tokens': Sequence(Text(shape=(), dtype=string)),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
تکه ها | دنباله (ClassLabel) | (هیچ یک،) | int64 | |
ner | دنباله (ClassLabel) | (هیچ یک،) | int64 | |
pos | دنباله (ClassLabel) | (هیچ یک،) | int64 | |
توکن ها | دنباله (متن) | (هیچ یک،) | رشته |
کلیدهای نظارت شده (به
as_supervised
doc مراجعه کنید):None
شکل ( tfds.show_examples ): پشتیبانی نمی شود.
مثالها ( tfds.as_dataframe ):
- نقل قول :
@inproceedings{tjong-kim-sang-de-meulder-2003-introduction,
title = "Introduction to the {C}o{NLL}-2003 Shared Task: Language-Independent Named Entity Recognition",
author = "Tjong Kim Sang, Erik F. and
De Meulder, Fien",
booktitle = "Proceedings of the Seventh Conference on Natural Language Learning at {HLT}-{NAACL} 2003",
year = "2003",
url = "https://www.aclweb.org/anthology/W03-0419",
pages = "142--147",
}
conll2003/conll2003 (پیکربندی پیش فرض)
،- توضیحات :
وظیفه مشترک CoNLL-2003 مربوط به تشخیص موجودیت نامگذاری شده مستقل از زبان است و بر چهار نوع موجودیت نامگذاری شده متمرکز است: افراد، مکانها، سازمانها و نامهای موجودیتهای متفرقه که به سه گروه قبلی تعلق ندارند.
صفحه اصلی : https://www.aclweb.org/anthology/W03-0419/
کد منبع :
tfds.text.conll2003.Conll2003
نسخه ها :
-
1.0.0
(پیش فرض): انتشار اولیه.
-
حجم دانلود :
959.94 KiB
حجم مجموعه داده :
3.87 MiB
ذخیره خودکار ( اسناد ): بله
تقسیم ها :
شکاف | مثال ها |
---|---|
'dev' | 3,251 |
'test' | 3,454 |
'train' | 14,042 |
- ساختار ویژگی :
FeaturesDict({
'chunks': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=23)),
'ner': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=9)),
'pos': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=47)),
'tokens': Sequence(Text(shape=(), dtype=string)),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
تکه ها | دنباله (ClassLabel) | (هیچ یک،) | int64 | |
ner | دنباله (ClassLabel) | (هیچ یک،) | int64 | |
pos | دنباله (ClassLabel) | (هیچ یک،) | int64 | |
توکن ها | دنباله (متن) | (هیچ یک،) | رشته |
کلیدهای نظارت شده (به
as_supervised
doc مراجعه کنید):None
شکل ( tfds.show_examples ): پشتیبانی نمی شود.
مثالها ( tfds.as_dataframe ):
- نقل قول :
@inproceedings{tjong-kim-sang-de-meulder-2003-introduction,
title = "Introduction to the {C}o{NLL}-2003 Shared Task: Language-Independent Named Entity Recognition",
author = "Tjong Kim Sang, Erik F. and
De Meulder, Fien",
booktitle = "Proceedings of the Seventh Conference on Natural Language Learning at {HLT}-{NAACL} 2003",
year = "2003",
url = "https://www.aclweb.org/anthology/W03-0419",
pages = "142--147",
}