- Mô tả :
Nhiệm vụ chung của CoNLL-2003 liên quan đến nhận dạng thực thể được đặt tên độc lập với ngôn ngữ và tập trung vào bốn loại thực thể được đặt tên: người, địa điểm, tổ chức và tên của các thực thể linh tinh không thuộc ba nhóm trước đó.
Trang chủ : https://www.aclweb.org/anthology/W03-0419/
Mã nguồn :
tfds.text.conll2003.Conll2003
Phiên bản :
-
1.0.0
(mặc định): Bản phát hành đầu tiên.
-
Kích thước tải xuống :
959.94 KiB
Kích thước tập dữ liệu :
3.87 MiB
Tự động lưu vào bộ đệm ( tài liệu ): Có
Chia tách :
Tách ra | ví dụ |
---|---|
'dev' | 3,251 |
'test' | 3,454 |
'train' | 14,042 |
- Cấu trúc tính năng :
FeaturesDict({
'chunks': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=23)),
'ner': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=9)),
'pos': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=47)),
'tokens': Sequence(Text(shape=(), dtype=string)),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Dtype | Sự miêu tả |
---|---|---|---|---|
Tính năngDict | ||||
miếng, mảnh nhỏ | Trình tự (Nhãn lớp) | (Không có,) | int64 | |
ner | Trình tự (Nhãn lớp) | (Không có,) | int64 | |
tư thế | Trình tự (Nhãn lớp) | (Không có,) | int64 | |
mã thông báo | Trình tự (Văn bản) | (Không có,) | chuỗi |
Các khóa được giám sát (Xem
as_supervised
doc ):None
Hình ( tfds.show_examples ): Không được hỗ trợ.
Ví dụ ( tfds.as_dataframe ):
- trích dẫn :
@inproceedings{tjong-kim-sang-de-meulder-2003-introduction,
title = "Introduction to the {C}o{NLL}-2003 Shared Task: Language-Independent Named Entity Recognition",
author = "Tjong Kim Sang, Erik F. and
De Meulder, Fien",
booktitle = "Proceedings of the Seventh Conference on Natural Language Learning at {HLT}-{NAACL} 2003",
year = "2003",
url = "https://www.aclweb.org/anthology/W03-0419",
pages = "142--147",
}
conll2003/conll2003 (cấu hình mặc định)
,- Mô tả :
Nhiệm vụ chung của CoNLL-2003 liên quan đến nhận dạng thực thể được đặt tên độc lập với ngôn ngữ và tập trung vào bốn loại thực thể được đặt tên: người, địa điểm, tổ chức và tên của các thực thể linh tinh không thuộc ba nhóm trước đó.
Trang chủ : https://www.aclweb.org/anthology/W03-0419/
Mã nguồn :
tfds.text.conll2003.Conll2003
Phiên bản :
-
1.0.0
(mặc định): Bản phát hành đầu tiên.
-
Kích thước tải xuống :
959.94 KiB
Kích thước tập dữ liệu :
3.87 MiB
Tự động lưu vào bộ đệm ( tài liệu ): Có
Chia tách :
Tách ra | ví dụ |
---|---|
'dev' | 3,251 |
'test' | 3,454 |
'train' | 14,042 |
- Cấu trúc tính năng :
FeaturesDict({
'chunks': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=23)),
'ner': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=9)),
'pos': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=47)),
'tokens': Sequence(Text(shape=(), dtype=string)),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Dtype | Sự miêu tả |
---|---|---|---|---|
Tính năngDict | ||||
miếng, mảnh nhỏ | Trình tự (Nhãn lớp) | (Không có,) | int64 | |
ner | Trình tự (Nhãn lớp) | (Không có,) | int64 | |
tư thế | Trình tự (Nhãn lớp) | (Không có,) | int64 | |
mã thông báo | Trình tự (Văn bản) | (Không có,) | chuỗi |
Các khóa được giám sát (Xem
as_supervised
doc ):None
Hình ( tfds.show_examples ): Không được hỗ trợ.
Ví dụ ( tfds.as_dataframe ):
- trích dẫn :
@inproceedings{tjong-kim-sang-de-meulder-2003-introduction,
title = "Introduction to the {C}o{NLL}-2003 Shared Task: Language-Independent Named Entity Recognition",
author = "Tjong Kim Sang, Erik F. and
De Meulder, Fien",
booktitle = "Proceedings of the Seventh Conference on Natural Language Learning at {HLT}-{NAACL} 2003",
year = "2003",
url = "https://www.aclweb.org/anthology/W03-0419",
pages = "142--147",
}