- الوصف :
تتعلق المهمة المشتركة لـ CoNLL-2003 بالتعرف على الكيانات المسماة المستقلة عن اللغة وتركز على أربعة أنواع من الكيانات المسماة: الأشخاص والمواقع والمؤسسات وأسماء الكيانات المتنوعة التي لا تنتمي إلى المجموعات الثلاث السابقة.
الصفحة الرئيسية https://www.aclweb.org/anthology/W03-0419/
كود المصدر :
tfds.text.conll2003.Conll2003
إصدارات :
-
1.0.0
(افتراضي): الإصدار الأولي.
-
حجم التحميل :
959.94 KiB
حجم مجموعة البيانات :
3.87 MiB
التخزين المؤقت التلقائي ( الوثائق ): نعم
الانقسامات :
انشق، مزق | أمثلة |
---|---|
'dev' | 3،251 |
'test' | 3،454 |
'train' | 14،042 |
- هيكل الميزة :
FeaturesDict({
'chunks': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=23)),
'ner': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=9)),
'pos': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=47)),
'tokens': Sequence(Text(shape=(), dtype=string)),
})
- وثائق الميزة :
ميزة | فصل | شكل | نوع | وصف |
---|---|---|---|---|
الميزات | ||||
قطع | تسلسل (ClassLabel) | (لا أحد،) | int64 | |
نير | تسلسل (ClassLabel) | (لا أحد،) | int64 | |
نقاط البيع | تسلسل (ClassLabel) | (لا أحد،) | int64 | |
الرموز | تسلسل (نص) | (لا أحد،) | سلسلة |
المفاتيح الخاضعة للإشراف (انظر المستند
as_supervised
):None
الشكل ( tfds.show_examples ): غير مدعوم.
أمثلة ( tfds.as_dataframe ):
- الاقتباس :
@inproceedings{tjong-kim-sang-de-meulder-2003-introduction,
title = "Introduction to the {C}o{NLL}-2003 Shared Task: Language-Independent Named Entity Recognition",
author = "Tjong Kim Sang, Erik F. and
De Meulder, Fien",
booktitle = "Proceedings of the Seventh Conference on Natural Language Learning at {HLT}-{NAACL} 2003",
year = "2003",
url = "https://www.aclweb.org/anthology/W03-0419",
pages = "142--147",
}
conll2003 / conll2003 (التكوين الافتراضي)
و- الوصف :
تتعلق المهمة المشتركة لـ CoNLL-2003 بالتعرف على الكيانات المسماة المستقلة عن اللغة وتركز على أربعة أنواع من الكيانات المسماة: الأشخاص والمواقع والمؤسسات وأسماء الكيانات المتنوعة التي لا تنتمي إلى المجموعات الثلاث السابقة.
الصفحة الرئيسية https://www.aclweb.org/anthology/W03-0419/
كود المصدر :
tfds.text.conll2003.Conll2003
إصدارات :
-
1.0.0
(افتراضي): الإصدار الأولي.
-
حجم التحميل :
959.94 KiB
حجم مجموعة البيانات :
3.87 MiB
التخزين المؤقت التلقائي ( الوثائق ): نعم
الانقسامات :
انشق، مزق | أمثلة |
---|---|
'dev' | 3،251 |
'test' | 3،454 |
'train' | 14،042 |
- هيكل الميزة :
FeaturesDict({
'chunks': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=23)),
'ner': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=9)),
'pos': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=47)),
'tokens': Sequence(Text(shape=(), dtype=string)),
})
- وثائق الميزة :
ميزة | فصل | شكل | نوع | وصف |
---|---|---|---|---|
الميزات | ||||
قطع | تسلسل (ClassLabel) | (لا أحد،) | int64 | |
نير | تسلسل (ClassLabel) | (لا أحد،) | int64 | |
نقاط البيع | تسلسل (ClassLabel) | (لا أحد،) | int64 | |
الرموز | تسلسل (نص) | (لا أحد،) | سلسلة |
المفاتيح الخاضعة للإشراف (انظر المستند
as_supervised
):None
الشكل ( tfds.show_examples ): غير مدعوم.
أمثلة ( tfds.as_dataframe ):
- الاقتباس :
@inproceedings{tjong-kim-sang-de-meulder-2003-introduction,
title = "Introduction to the {C}o{NLL}-2003 Shared Task: Language-Independent Named Entity Recognition",
author = "Tjong Kim Sang, Erik F. and
De Meulder, Fien",
booktitle = "Proceedings of the Seventh Conference on Natural Language Learning at {HLT}-{NAACL} 2003",
year = "2003",
url = "https://www.aclweb.org/anthology/W03-0419",
pages = "142--147",
}