- คำอธิบาย :
งานที่ใช้ร่วมกันของ CoNLL-2003 เกี่ยวข้องกับการรับรู้เอนทิตีที่มีชื่อโดยไม่ขึ้นกับภาษา และมุ่งเน้นไปที่เอนทิตีที่มีชื่อสี่ประเภท ได้แก่ บุคคล สถานที่ องค์กร และชื่อของเอนทิตีเบ็ดเตล็ดที่ไม่ได้อยู่ในสามกลุ่มก่อนหน้านี้
รหัสที่มา :
tfds.text.conll2003.Conll2003
รุ่น :
-
1.0.0
(ค่าเริ่มต้น): การเปิดตัวครั้งแรก
-
ขนาดการดาวน์โหลด :
959.94 KiB
ขนาดชุดข้อมูล :
3.87 MiB
แคชอัตโนมัติ ( เอกสาร ): ใช่
แยก :
แยก | ตัวอย่าง |
---|---|
'dev' | 3,251 |
'test' | 3,454 |
'train' | 14,042 |
- โครงสร้างคุณลักษณะ :
FeaturesDict({
'chunks': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=23)),
'ner': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=9)),
'pos': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=47)),
'tokens': Sequence(Text(shape=(), dtype=string)),
})
- เอกสารคุณสมบัติ :
คุณสมบัติ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
---|---|---|---|---|
คุณสมบัติDict | ||||
ชิ้น | ลำดับ (ClassLabel) | (ไม่มี,) | int64 | |
เนิร์ด | ลำดับ (ClassLabel) | (ไม่มี,) | int64 | |
ตำแหน่ง | ลำดับ (ClassLabel) | (ไม่มี,) | int64 | |
โทเค็น | ลำดับ (ข้อความ) | (ไม่มี,) | สตริง |
คีย์ภายใต้การดูแล (ดู
as_supervised
doc ):None
รูปภาพ ( tfds.show_examples ): ไม่รองรับ
ตัวอย่าง ( tfds.as_dataframe ):
- การอ้างอิง :
@inproceedings{tjong-kim-sang-de-meulder-2003-introduction,
title = "Introduction to the {C}o{NLL}-2003 Shared Task: Language-Independent Named Entity Recognition",
author = "Tjong Kim Sang, Erik F. and
De Meulder, Fien",
booktitle = "Proceedings of the Seventh Conference on Natural Language Learning at {HLT}-{NAACL} 2003",
year = "2003",
url = "https://www.aclweb.org/anthology/W03-0419",
pages = "142--147",
}
conll2003/conll2003 (ค่าเริ่มต้น)
,- คำอธิบาย :
งานที่ใช้ร่วมกันของ CoNLL-2003 เกี่ยวข้องกับการรับรู้เอนทิตีที่มีชื่อโดยไม่ขึ้นกับภาษา และมุ่งเน้นไปที่เอนทิตีที่มีชื่อสี่ประเภท ได้แก่ บุคคล สถานที่ องค์กร และชื่อของเอนทิตีเบ็ดเตล็ดที่ไม่ได้อยู่ในสามกลุ่มก่อนหน้านี้
รหัสที่มา :
tfds.text.conll2003.Conll2003
รุ่น :
-
1.0.0
(ค่าเริ่มต้น): การเปิดตัวครั้งแรก
-
ขนาดการดาวน์โหลด :
959.94 KiB
ขนาดชุดข้อมูล :
3.87 MiB
แคชอัตโนมัติ ( เอกสาร ): ใช่
แยก :
แยก | ตัวอย่าง |
---|---|
'dev' | 3,251 |
'test' | 3,454 |
'train' | 14,042 |
- โครงสร้างคุณลักษณะ :
FeaturesDict({
'chunks': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=23)),
'ner': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=9)),
'pos': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=47)),
'tokens': Sequence(Text(shape=(), dtype=string)),
})
- เอกสารคุณสมบัติ :
คุณสมบัติ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
---|---|---|---|---|
คุณสมบัติDict | ||||
ชิ้น | ลำดับ (ClassLabel) | (ไม่มี,) | int64 | |
เนิร์ด | ลำดับ (ClassLabel) | (ไม่มี,) | int64 | |
ตำแหน่ง | ลำดับ (ClassLabel) | (ไม่มี,) | int64 | |
โทเค็น | ลำดับ (ข้อความ) | (ไม่มี,) | สตริง |
คีย์ภายใต้การดูแล (ดู
as_supervised
doc ):None
รูปภาพ ( tfds.show_examples ): ไม่รองรับ
ตัวอย่าง ( tfds.as_dataframe ):
- การอ้างอิง :
@inproceedings{tjong-kim-sang-de-meulder-2003-introduction,
title = "Introduction to the {C}o{NLL}-2003 Shared Task: Language-Independent Named Entity Recognition",
author = "Tjong Kim Sang, Erik F. and
De Meulder, Fien",
booktitle = "Proceedings of the Seventh Conference on Natural Language Learning at {HLT}-{NAACL} 2003",
year = "2003",
url = "https://www.aclweb.org/anthology/W03-0419",
pages = "142--147",
}