- বর্ণনা :
CoNLL-2003-এর ভাগ করা কাজটি ভাষা-স্বাধীন নামকৃত সত্তার স্বীকৃতি নিয়ে উদ্বিগ্ন এবং চার ধরনের নামধারী সত্তার উপর মনোনিবেশ করে: ব্যক্তি, অবস্থান, সংস্থা এবং বিবিধ সত্ত্বার নাম যা পূর্ববর্তী তিনটি গোষ্ঠীর অন্তর্গত নয়।
সোর্স কোড :
tfds.text.conll2003.Conll2003
সংস্করণ :
-
1.0.0
(ডিফল্ট): প্রাথমিক প্রকাশ।
-
ডাউনলোড সাইজ :
959.94 KiB
ডেটাসেটের আকার :
3.87 MiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'dev' | 3,251 |
'test' | ৩,৪৫৪ |
'train' | 14,042 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'chunks': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=23)),
'ner': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=9)),
'pos': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=47)),
'tokens': Sequence(Text(shape=(), dtype=string)),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
খণ্ড | সিকোয়েন্স (ক্লাসলেবেল) | (কোনটিই নয়,) | int64 | |
ner | সিকোয়েন্স (ক্লাসলেবেল) | (কোনটিই নয়,) | int64 | |
অবস্থান | সিকোয়েন্স (ক্লাসলেবেল) | (কোনটিই নয়,) | int64 | |
টোকেন | ক্রম (পাঠ্য) | (কোনটিই নয়,) | স্ট্রিং |
তত্ত্বাবধান করা কী (দেখুন
as_supervised
doc ):None
চিত্র ( tfds.show_examples ): সমর্থিত নয়।
উদাহরণ ( tfds.as_dataframe ):
- উদ্ধৃতি :
@inproceedings{tjong-kim-sang-de-meulder-2003-introduction,
title = "Introduction to the {C}o{NLL}-2003 Shared Task: Language-Independent Named Entity Recognition",
author = "Tjong Kim Sang, Erik F. and
De Meulder, Fien",
booktitle = "Proceedings of the Seventh Conference on Natural Language Learning at {HLT}-{NAACL} 2003",
year = "2003",
url = "https://www.aclweb.org/anthology/W03-0419",
pages = "142--147",
}
conll2003/conll2003 (ডিফল্ট কনফিগারেশন)
,- বর্ণনা :
CoNLL-2003-এর ভাগ করা কাজটি ভাষা-স্বাধীন নামকৃত সত্তার স্বীকৃতি নিয়ে উদ্বিগ্ন এবং চার ধরনের নামধারী সত্তার উপর মনোনিবেশ করে: ব্যক্তি, অবস্থান, সংস্থা এবং বিবিধ সত্ত্বার নাম যা পূর্ববর্তী তিনটি গোষ্ঠীর অন্তর্গত নয়।
সোর্স কোড :
tfds.text.conll2003.Conll2003
সংস্করণ :
-
1.0.0
(ডিফল্ট): প্রাথমিক প্রকাশ।
-
ডাউনলোড সাইজ :
959.94 KiB
ডেটাসেটের আকার :
3.87 MiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'dev' | 3,251 |
'test' | ৩,৪৫৪ |
'train' | 14,042 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'chunks': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=23)),
'ner': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=9)),
'pos': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=47)),
'tokens': Sequence(Text(shape=(), dtype=string)),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
খণ্ড | সিকোয়েন্স (ক্লাসলেবেল) | (কোনটিই নয়,) | int64 | |
ner | সিকোয়েন্স (ক্লাসলেবেল) | (কোনটিই নয়,) | int64 | |
অবস্থান | সিকোয়েন্স (ক্লাসলেবেল) | (কোনটিই নয়,) | int64 | |
টোকেন | ক্রম (পাঠ্য) | (কোনটিই নয়,) | স্ট্রিং |
তত্ত্বাবধান করা কী (দেখুন
as_supervised
doc ):None
চিত্র ( tfds.show_examples ): সমর্থিত নয়।
উদাহরণ ( tfds.as_dataframe ):
- উদ্ধৃতি :
@inproceedings{tjong-kim-sang-de-meulder-2003-introduction,
title = "Introduction to the {C}o{NLL}-2003 Shared Task: Language-Independent Named Entity Recognition",
author = "Tjong Kim Sang, Erik F. and
De Meulder, Fien",
booktitle = "Proceedings of the Seventh Conference on Natural Language Learning at {HLT}-{NAACL} 2003",
year = "2003",
url = "https://www.aclweb.org/anthology/W03-0419",
pages = "142--147",
}