قام Huggingface بتشكيل TFDS ويوفر الكثير من مجموعات البيانات النصية. انظر هنا لمزيد من الوثائق. بعد ذلك ، يمكنك العثور على قائمة بجميع مجموعات البيانات التي يمكن استخدامها مع TFDS.
- تحديد الاختصار
- ade_corpus_v2
- ad_glue
- adversarial_qa
- اسلك
- afrikaans_ner_corpus
- ag_news
- ai2_arc
- حوار جوي
- ajgt_twitter_ar
- التعليقات_اللفظية
- التخصيص
- بديل
- قطبية الأمازون
- amazon_reviews_multi
- amazon_us_reviews
- ambig_qa
- americas_nli
- عامي
- أمتل
- anli
- app_reviews
- aqua_rat
- أكواموس
- ar_cov19
- ar_res_reviews
- ar_sarcasm
- المليار_العربية
- arabic_pos_dialect
- الخطاب العربي
- ARCD
- arsentd_lev
- فن
- arxiv_dataset
- صعود_كب
- aslg_pc12
- أسنق
- أصل
- أسين
- assin2
- الذري
- أوتوماتو
- babi_qa
- البنوك 77
- bbaw_egyptian
- bbc_hindi_nli
- bc2gm_corpus
- فول
- أفضل 2009
- بيان
- الكتاب المقدس
- براءة الاختراع الكبيرة
- بيجبينش
- بيلوم
- bing_coronavirus_query_set
- بيومرك
- السير
- biwi_kinect_head_pose
- blbooks
- blbooksgenre
- المهارة المخلوطة
- شخص ساذج
- blog_authorship_corpus
- bn_hate_speech
- الصحف
- مكتبة
- bookcorpusopen
- بولق
- bprec
- break_data
- برواك
- bsd_ja_ar
- بسواك
- ج 3
- ج 4
- كايل 2018
- كانر
- الرؤوس
- كازينو
- استقلال كاتالونيا
- cats_vs_dogs
- كواك
- العلاج المعرفي السلوكي
- سي سي 100
- cc_news
- ccaligned_multilingual
- قرص مضغوط
- سي دي تي
- سيدر
- cfq
- chr_ar
- سيفار 10
- سيفار 100
- حوالي
- تعليقات مدنية
- clickbait_news_bg
- حمى المناخ
- clinc_oos
- فكرة
- cmrc2018
- cmu_hinglish_dog
- cnn_dailymail
- Coached_conv_pref
- الخطاب الخشن
- كوداه
- code_search_net
- code_x_glue_cc_clone_detection_big_clone_bench
- code_x_glue_cc_clone_detection_poj104
- code_x_glue_cc_cloze_testing_all
- code_x_glue_cc_cloze_testing_maxmin
- code_x_glue_cc_code_completion_line
- code_x_glue_cc_code_completion_token
- code_x_glue_cc_code_refinement
- code_x_glue_cc_code_to_code_trans
- code_x_glue_cc_defect_detection
- code_x_glue_ct_code_to_text
- code_x_glue_tc_nl_code_search_adv
- code_x_glue_tc_text_to_code
- code_x_glue_tt_text_to_text
- com_qa
- gen_gen
- لغة مشتركة
- الصوت المشترك
- commonsense_qa
- المنافسة_الرياضيات
- compguess ما
- مفهوم الشبكة 5
- المفاهيمي_12 م
- المفاهيم_التعليقات
- conll2000
- conll2002
- conll2003
- conll2012_ontonotesv5
- محادثة
- شكاوى - تمويل المستهلك
- Conv_ai
- conv_ai_2
- conv_ai_3
- أسئلة التحويل
- قوقا
- الحبل 19
- كورنيل فيلم
- cos_e
- cosmos_qa
- يعداد
- covid_qa_castorini
- covid_qa_deepset
- covid_qa_ucsd
- covid_tweets_japanese
- كوفوست 2
- CPE-5
- craigslist_bargains
- crawl_domain
- crd3
- الجريمة والعقاب
- crows_pairs
- كريبتونيت
- cs_restaurants
- كواد
- curiosity_dialogs
- الحوار اليومي
- داين
- تعليقات danish_political
- سهم
- datacommons_factcheck
- dbpedia_14
- dbrd
- deal_or_no_dialog
- حل_مؤكّد_مؤكّد_حل
- حمى الضنك
- مربع الحوار
- الدبلوماسية
- رسائل_استجابة_الكوارث
- تجاهل
- اكتشاف
- disfl_qa
- doc2dial
- docred
- دوقا
- حلم
- يسقط
- دورك
- هولندي اجتماعي
- ديك
- e2e_nlg
- e2e_nlg_cleaned
- ecb
- ecthr_cases
- إيدوج
- ehealth_kd
- eitb_parcc
- electric_load_dagrams
- eli5
- eli5_category
- القرهيزكتيك
- emea
- ايمو
- المشاعر
- emotone_ar
- الحوارات الوجدانية
- rich_web_nlg
- enwik8
- الممحاة
- esnli
- eth_py150_open
- روح
- إلخ
- eu_regulatory_ir
- يورلكس
- يورونيوز
- europa_eac_tm
- europa_ecdc_tm
- europarl_bilingual
- event2Mind
- علاج الأدلة
- الامتحانات
- فاكتكبر
- اخبار وهمية
- filipino_filipino
- farsi_news
- Fashion_mnist
- حُمى
- عدد قليل
- Financial_phrasebank
- أدق
- فلوريس
- المداخن
- طعام 101
- fquad
- freebase_qa
- الفارق
- جوهرة
- مولدة_مراجعات_العاشر
- Generics_kb
- التعرف على الهوية_الألمانية_القانونية
- ألماني
- الجراثيم 14
- جيجا_فرن
- جيجاورد
- الجلوكوز
- صمغ
- جناد 10
- انفعالات
- جوواق
- google_formed_query
- grail_qa
- great_code
- greek_legal_code
- gsm8k
- الوصي
- gutenberg_time
- هانز
- hansards
- الصعب
- حريم
- has_part
- الكراهية
- خطاب الكراهية 18
- hate_speech_filipino
- hate_speech_offensive
- hate_speech_pl
- hate_speech_portuguese
- قبعة شرح
- hausa_voa_ner
- hausa_voa_topics
- hda_nli_hindi
- head_qa
- صحة_حقيقة
- hebrew_projectbenyehuda
- المشاعر العبرية
- العبرية_هذا_العالم
- هيلاسواج
- hendrycks_test
- hind_encorp
- hindi_discourse
- قرن العقرب
- هيككانكور
- hlgd
- أمل
- hotpot_qa
- يحوم
- hrenwac_para
- hrwac
- هيوميكروديت
- hybrid_qa
- hyperpartisan_news_detection
- iapp_wiki_qa_squad
- id_clickbait
- معرف_ليبوتان 6
- id_nergrit_corpus
- id_newspapers_2018
- id_panl_bppt
- id_puisi
- igbo_english_machine_translation
- igbo_monolingual
- igbo_ner
- الأول قائمة
- imagenet-1k
- imagenet_sketch
- imdb
- imdb_urdu_reviews
- يبرز
- indic_glue
- إندونلي
- إندونلو
- فضولي_ qg
- interpress_news_category_tr
- interpress_news_category_tr_lite
- irc_disentangle
- isixhosa_ner_corpus
- isizulu_ner_corpus
- iwslt2017
- خطر
- جفليج
- jigsaw_toxicity_pred
- jigsaw_unintended_bias
- jnlpba
- أسئلة_الصحفيين
- kan_hope
- kannada_news
- kd_conv
- kde4
- كيلم
- kilt_tasks
- kilt_wikipedia
- kinnews_kirnews
- كلو
- kor_3i4k
- kor_hate
- kor_ner
- kor_nli
- kor_nlu
- kor_qpair
- kor_sae
- سخرية
- لابر
- لاما
- امبادا
- كبير_الإسباني العقرب
- لاروسيدا
- lc_quad
- lccc
- lener_br
- lex_glue
- كذاب
- librispeech_asr
- librispeech_lm
- حد
- يرخي
- لينيوس
- ليفيكا
- lj_speech
- lm1b
- lst20
- م_لاما
- ماك_مورفو
- مخزن
- مساكنر
- math_dataset
- math_qa
- matinf
- mbpp
- مولودية 4
- mc_taco
- md_gender_bias
- mdd
- med_hop
- ميدالية
- الحوار الطبي
- أسئلة_طبية
- مدمقا
- menyo20k_mt
- meta_woz
- metashift
- ميتوما
- متروك
- ميام
- مكب
- مقا
- ملقا
- ملسم
- mnist
- موكا
- monash_tsf
- المغرب
- movie_rationales
- مرقا
- ms_marco
- ms_terms
- msr_genomics_kbcomp
- msr_sqa
- msr_text_compression
- msr_zhen_translation_parity
- msra_ner
- mt_eng_vietnamese
- موثوسين
- متعدد الكتب
- mult_eurlex
- mult_news
- multi_nli
- multi_nli_mismatch
- الزحف متعدد الأجزاء
- multi_re_qa
- multi_woz_v22
- mult_x_science_sum
- متعدد الوسائط
- متعدد اللغات
- الاصدقاء المشتركه
- mwsc
- myanmar_news
- السردية
- السرد
- أسئلة_طبيعية
- ncbi_disease
- نخلت
- ncslgr
- نيل
- neural_code_search
- news_commentary
- مجموعة الأخبار
- newsph
- newsph_nli
- صحيفة
- newsqa
- غرفة الأخبار
- nkjp- نير
- nli_tr
- nlu_evaluation_data
- نوريك
- نورن
- norwegian_ner
- nq_open
- nsmc
- numer_sense
- numeric_fused_head
- أوكلار
- أوفكومبر
- جريمة
- مخالفة
- ofis_publik
- محسوم
- أولي
- omp
- onestop_english
- onestop_qa
- open_subtitles
- openai_humaneval
- openbookqa
- يفتح
- openwebtext
- الرأي
- التأليف 100
- opus_books
- opus_dgt
- opus_dogc
- opus_elhuyar
- opus_euconst
- opus_finlex
- opus_fiskmo
- opus_gnome
- opus_infopankki
- opus_memat
- opus_montenegrinsubs
- opus_openoffice
- opus_paracrawl
- opus_rf
- opus_tedtalks
- opus_ubuntu
- opus_wikipedia
- opus_xhosanavy
- مجموعة أورانج
- أوسكار
- الفقرة_crawl
- الفقرة_بات
- parsinlu_reading_comprehension
- يمر
- الكفوف
- الكفوف- x
- بيك
- مقروء الأقران
- الشعوب_اليوم_السنة
- لكل إرسال
- الفارسي
- الصفحة 19
- بي أتش بي
- بياف
- pib
- بياقة
- pn_summary
- poem_sentiment
- بوليمو 2
- poleval2019_ التنمر عبر الإنترنت
- poleval2019_mt
- بولسوم
- متعدد اللغات
- براشاتاي
- براجميفال
- proto_qa
- psc
- ptb_text_only
- تم النشر
- pubmed_qa
- py_ast
- qa4mre
- qa_srl
- qa_zre
- كنغر
- قانتا
- qasc
- قصبر
- قيد
- qed_amara
- quac
- طائر السمان
- تشاجر
- كوارتز
- رسم سريع
- كورا
- الشريعة
- سباق
- إعادة الطلب
- المنطق_bg
- recipe_nlg
- ريكلور
- red_caps
- رديت
- reddit_tifu
- تجديد
- رويترز 21578
- riddle_sense
- ro_sent
- ro_sts
- ro_sts_parallel
- roman_urdu
- roman_urdu_hate_speech
- رونيك
- الحبال
- طماطم فاسدة
- Russian_super_glue
- rvl_cdip
- s2orc
- samsum
- السنسكريتية_الكلاسيكية
- saudinewsnet
- سبركواد
- sbu_captions
- مسح
- scb_mt_enth_2020
- scene_parse_150
- مخطط_إرشاد_dstc8
- scicite
- scielo
- أوراق علمية
- scifact
- sciq
- scitail
- scitldr
- search_qa
- سيد
- سلقا
- sem_eval_2010_task_8
- sem_eval_2014_task_1
- sem_eval_2018_task_1
- sem_eval_2020_task_11
- sent_comp
- سينتيليكس
- أرسل
- المشاعر 140
- sepedi_ner
- sesotho_ner_corpus
- تعيينات
- مجموعات سوانا_نر_كوربوس
- شارك
- Sharc_modified
- مرض
- سيليكون
- أسئلة_بسيطة_v2
- siswati_ner_corpus
- سمارتداتا
- sms_spam
- snips_built_in_intents
- snli
- snow_simplified_japanese_corpus
- so_stacksample
- إطارات_الاجتماعية
- Social_i_qa
- sofc_materials_articles
- sogou_news
- مليار_كلمة_إسبانية
- spc
- الأنواع_800
- أوامر الكلام
- العنكبوت
- فريق
- فريق_القصة
- فرق
- Squad_it
- Squad_kor_v1
- squad_kor_v2
- فريق_v1_pt
- فريق_v2
- Squadshifts
- srwac
- sst
- ستيريو
- قصة_كلوز
- stsb_mt_sv
- stsb_multi_mt
- style_change_detection (كشف_تغيير_النمط)
- subjqa
- صمغ ممتاز
- رائع
- سفهن
- غنيمة
- السواحيلية
- السواحيلية
- swda
- swedish_medical_ner
- swedish_ner_corpus
- swedish_reviews
- swiss_judiation_prediction. التنبؤ_
- tab_fact
- مزيج التاميل
- التنزيل
- تاباكو
- تشكيله
- مدير المهام 1
- مدير المهام 2
- مدير المهام 3
- تتويبا
- تيد_هرلر
- تيد_يوست 2013
- تيد
- ted_talks_iwslt
- كتب_التيلوغو
- telugu_news
- tep_ar_fa_para
- text2log
- textvqa
- thai_toxicity_tweet
- ثاينر
- thaiqa_squad
- التيسوم
- كومة
- the_pile_books3
- 2
- the_pile_stack_exchange
- تيلدا
- الوقت_الطلب
- مرات_من_الهند_الاخبار_الخطوط
- timit_asr
- صغير شكسبير
- Tlc
- tmu_gfm_dataset
- tne
- أخبر ر
- توتو
- trec
- trivia_qa
- صدق_قا
- tsac
- تي تي سي 4900
- تونس
- tuple_ie
- ترك
- turkic_xwmt
- الفيلم التركي
- التركية
- turkish_product_reviews
- الانكماش_التركي
- turku_ner_corpus
- tweet_eval
- tweet_qa
- تويت_ar_ar_parallel
- tweets_hate_speech_detection
- twi_text_c3
- twi_wordsim353
- تديقة
- ubuntu_dialogs_corpus
- udhr
- um005
- un_ga
- un_multi
- un_pc
- التبعيات العالمية
- العالمية_الأشكال
- urdu_fake_news
- urdu_sentiment_corpus
- vctk
- visual_genome
- vivos
- web_nlg
- web_of_science
- أسئلة على الويب
- weibo_ner
- wi_locness
- على نطاق أوسع
- ويكي 40 ب
- wiki_asp
- wiki_atomic_edits
- wiki_auto
- wiki_bio
- wiki_dpr
- ويكي شوب
- wiki_lingua
- ويكي أفلام
- wiki_qa
- wiki_qa_ar
- wiki_snippets
- ويكي
- wiki_split
- wiki_summary
- ويكيان
- ويكي العقرب
- ويكي هاو
- ويكيبيديا
- ويكي
- أسئلة ويكي
- ويكي نص
- wikitext_tl39
- wili_2018
- wino_bias
- winograd_wsc
- وينوجراندي
- وِقا
- wisesight1000
- المشاعر الحكيمة
- wmt14
- wmt15
- wmt16
- wmt17
- wmt18
- wmt19
- wmt20_mlqe_task1
- wmt20_mlqe_task2
- wmt20_mlqe_task3
- wmt_t2t
- wnut_17
- wongnai_reviews
- woz_dialogue
- وربسك
- x_stance
- xcopa
- xcsr
- xed_en_fi
- xglue
- xnli
- xor_tydi_qa
- xquad
- xquad_r
- xsum
- xsum_factuality
- إكستريم
- yahoo_answers_qa
- yahoo_answers_topics
- الصرخة
- yelp_review_full
- yoruba_bbc_topics
- yoruba_gv_ner
- yoruba_text_c3
- yoruba_wordsim353
- youtube_caption_corrections
- شهية