- विवरण :
CoNLL-2003 का साझा कार्य भाषा-स्वतंत्र नामित इकाई मान्यता से संबंधित है और चार प्रकार की नामित संस्थाओं पर ध्यान केंद्रित करता है: व्यक्ति, स्थान, संगठन और विविध संस्थाओं के नाम जो पिछले तीन समूहों से संबंधित नहीं हैं।
स्रोत कोड :
tfds.text.conll2003.Conll2003
संस्करण :
-
1.0.0
(डिफ़ॉल्ट): प्रारंभिक रिलीज़।
-
डाउनलोड आकार :
959.94 KiB
डेटासेट का आकार :
3.87 MiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): हाँ
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'dev' | 3,251 |
'test' | 3,454 |
'train' | 14,042 |
- फ़ीचर संरचना :
FeaturesDict({
'chunks': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=23)),
'ner': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=9)),
'pos': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=47)),
'tokens': Sequence(Text(shape=(), dtype=string)),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
विशेषताएं डिक्ट | ||||
हिस्सा | अनुक्रम (कक्षा लेबल) | (कोई भी नहीं,) | int64 | |
नेर | अनुक्रम (कक्षा लेबल) | (कोई भी नहीं,) | int64 | |
स्थिति | अनुक्रम (कक्षा लेबल) | (कोई भी नहीं,) | int64 | |
टोकन | अनुक्रम (पाठ) | (कोई भी नहीं,) | डोरी |
पर्यवेक्षित कुंजियाँ (
as_supervised
doc देखें):None
चित्र ( tfds.show_examples ): समर्थित नहीं है।
उदाहरण ( tfds.as_dataframe ):
- उद्धरण :
@inproceedings{tjong-kim-sang-de-meulder-2003-introduction,
title = "Introduction to the {C}o{NLL}-2003 Shared Task: Language-Independent Named Entity Recognition",
author = "Tjong Kim Sang, Erik F. and
De Meulder, Fien",
booktitle = "Proceedings of the Seventh Conference on Natural Language Learning at {HLT}-{NAACL} 2003",
year = "2003",
url = "https://www.aclweb.org/anthology/W03-0419",
pages = "142--147",
}
conll2003/conll2003 (डिफ़ॉल्ट कॉन्फ़िगरेशन)
,- विवरण :
CoNLL-2003 का साझा कार्य भाषा-स्वतंत्र नामित इकाई मान्यता से संबंधित है और चार प्रकार की नामित संस्थाओं पर ध्यान केंद्रित करता है: व्यक्ति, स्थान, संगठन और विविध संस्थाओं के नाम जो पिछले तीन समूहों से संबंधित नहीं हैं।
स्रोत कोड :
tfds.text.conll2003.Conll2003
संस्करण :
-
1.0.0
(डिफ़ॉल्ट): प्रारंभिक रिलीज़।
-
डाउनलोड आकार :
959.94 KiB
डेटासेट का आकार :
3.87 MiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): हाँ
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'dev' | 3,251 |
'test' | 3,454 |
'train' | 14,042 |
- फ़ीचर संरचना :
FeaturesDict({
'chunks': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=23)),
'ner': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=9)),
'pos': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=47)),
'tokens': Sequence(Text(shape=(), dtype=string)),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
विशेषताएं डिक्ट | ||||
हिस्सा | अनुक्रम (कक्षा लेबल) | (कोई भी नहीं,) | int64 | |
नेर | अनुक्रम (कक्षा लेबल) | (कोई भी नहीं,) | int64 | |
स्थिति | अनुक्रम (कक्षा लेबल) | (कोई भी नहीं,) | int64 | |
टोकन | अनुक्रम (पाठ) | (कोई भी नहीं,) | डोरी |
पर्यवेक्षित कुंजियाँ (
as_supervised
doc देखें):None
चित्र ( tfds.show_examples ): समर्थित नहीं है।
उदाहरण ( tfds.as_dataframe ):
- उद्धरण :
@inproceedings{tjong-kim-sang-de-meulder-2003-introduction,
title = "Introduction to the {C}o{NLL}-2003 Shared Task: Language-Independent Named Entity Recognition",
author = "Tjong Kim Sang, Erik F. and
De Meulder, Fien",
booktitle = "Proceedings of the Seventh Conference on Natural Language Learning at {HLT}-{NAACL} 2003",
year = "2003",
url = "https://www.aclweb.org/anthology/W03-0419",
pages = "142--147",
}