हगिंगफेस ने टीएफडीएस को फोर्क किया है और बहुत सारे टेक्स्ट डेटासेट प्रदान करता है। अधिक दस्तावेज़ीकरण के लिए यहां देखें। आगे आप उन सभी डेटासेट की सूची पा सकते हैं जिनका उपयोग TFDS के साथ किया जा सकता है।
- संक्षिप्तिकरण_पहचान
- ade_corpus_v2
- सलाह_गोंद
- प्रतिकूल_क्यूए
- एईएसएलसी
- afrikaans_ner_corpus
- ag_news
- ai2_arc
- air_dialogue
- ajgt_twitter_ar
- allegro_reviews
- एलोसीन
- Alt
- अमेज़न_ध्रुवीयता
- amazon_reviews_multi
- amazon_us_reviews
- अंबिग_क्यूए
- americas_nli
- अमी
- एएमटीटीएलई
- अनलि
- app_reviews
- एक्वा_राट
- एक्वाम्यूज
- ar_cov19
- ar_res_reviews
- ar_sarcasm
- अरबी_अरब_शब्द
- arabic_pos_dialect
- अरबी_भाषण_कॉर्पस
- आर्कडी
- arsentd_lev
- कला
- arxiv_dataset
- चढ़ाई_केबी
- aslg_pc12
- एएसएनक्यू
- संपत्ति
- असिन
- assin2
- परमाणु
- आशुमातो
- बाबी_क्यूए
- बैंकिंग77
- bbaw_मिस्र
- bbc_hindi_nli
- bc2gm_corpus
- फलियां
- बेस्ट2009
- बिनेत
- बाइबिल_पैरा
- बड़ा पेटेंट
- बिगबेंच
- बिलसुम
- bing_coronavirus_query_set
- बायोमआरसी
- जीव
- biwi_kinect_head_pose
- बीएलबुक्स
- blbooksgenre
- मिश्रित_कौशल_बात
- ब्लींप
- blog_authorship_corpus
- bn_hate_speech
- bnl_समाचार पत्र
- बुककॉर्पस
- बुककॉर्पसओपेन
- बूलक़
- बीपीआरईसी
- ब्रेक_डेटा
- ब्रवाक
- bsd_ja_en
- बीएसडब्ल्यूएसी
- सी 3
- सी 4
- cail2018
- कनेर
- केप्स
- कैसीनो
- कैटेलोनिया_स्वतंत्रता
- Cats_vs_dogs
- कावाक
- सीबीटी
- सीसी100
- cc_news
- ccaligned_multilingual
- सीडीएससी
- सीडीटी
- देवदार
- सीएफक्यू
- chr_en
- सिफार10
- सिफार100
- लगभग
- नागरिक_टिप्पणियां
- clickbait_news_bg
- जलवायु_बुखार
- clinc_oos
- संकेत
- सेमीआरसी2018
- cmu_hinglish_dog
- cnn_दैनिक मेल
- कोचिंग_कॉनव_प्रेफ
- मोटे_प्रवचन
- कोडाह
- code_search_net
- code_x_glue_cc_clone_detection_big_clone_bench
- code_x_glue_cc_clone_detection_poj104
- code_x_glue_cc_cloze_testing_all
- code_x_glue_cc_cloze_testing_maxmin
- code_x_glue_cc_code_completion_line
- code_x_glue_cc_code_completion_token
- code_x_glue_cc_code_refinement
- code_x_glue_cc_code_to_code_trans
- code_x_glue_cc_defect_detection
- code_x_glue_ct_code_to_text
- code_x_glue_tc_nl_code_search_adv
- code_x_glue_tc_text_to_code
- code_x_glue_tt_text_to_text
- com_qa
- आम_जीन
- आम भाषा
- आम आवाज
- सामान्य ज्ञान_क्यूए
- प्रतियोगिता_गणित
- अनुमान लगाना क्या
- कॉन्सेप्टनेट5
- वैचारिक_12m
- वैचारिक_कैप्शन
- conll2000
- conll2002
- conll2003
- conll2012_ontonotesv5
- conllpp
- उपभोक्ता-वित्त-शिकायतें
- conv_ai
- conv_ai_2
- conv_ai_3
- रूपा_प्रश्न
- कोका
- कॉर्ड19
- कॉर्नेल_मूवी_डायलॉग
- cos_e
- ब्रह्मांड_क्यूए
- विरोध करना
- covid_qa_castorini
- covid_qa_deepset
- covid_qa_ucsd
- covid_tweets_japanese
- कोवोस्ट2
- सीपीपीई-5
- क्रेगलिस्ट_सौदा
- क्रॉल_डोमेन
- सीआरडी3
- अपराध_और_दंड
- कौवे_जोड़े
- क्रिप्टोनाइट
- cs_रेस्तरां
- कुआडी
- जिज्ञासा_संवाद
- दैनिक_संवाद
- डेन
- danish_political_comments
- तीव्र गति
- datacommons_factcheck
- डीबीपीडिया_14
- डीबीआरडी
- Deal_or_no_dialog
- निश्चित_सर्वनाम_संकल्प
- डेंगू_फिलिपिनो
- डायलॉग_रे
- कूटनीति_पहचान
- आपदा_प्रतिक्रिया_संदेश
- डिस्कोफ्यूज़
- खोज
- disfl_qa
- doc2डायल
- डॉक्रेड
- दोक़ा
- सपना
- बूंद
- डुओरसी
- डच_सामाजिक
- डाइक
- e2e_nlg
- e2e_nlg_cleaned
- ईसीबी
- ecthr_केस
- eduge
- ehealth_kd
- eitb_parcc
- बिजली_लोड_आरेख
- एली5
- eli5_श्रेणी
- एल्करहिज़्केताकी
- ईएमईए
- भावनाएं
- भावना
- इमोटोन_आर
- सहानुभूति_संवाद
- समृद्ध_वेब_एनएलजी
- enwik8
- इरेज़र_मल्टी_आरसी
- एस्नलि
- eth_py150_open
- प्रकृति
- ET
- eu_regulatory_ir
- यूरोलेक्स
- यूरोन्यूज
- Europa_eac_tm
- Europa_ecdc_tm
- Europarl_द्विभाषी
- घटना 2 मन
- सबूत_इनफर_उपचार
- परीक्षा
- फैक्टकब्री
- नकली_समाचार_अंग्रेज़ी
- नकली_समाचार_फिलिपिनो
- फ़ारसी_न्यूज़
- Fashion_mnist
- बुखार
- कुछ_रेल
- वित्तीय_वाक्यांशबैंक
- महीन
- फ्लोरेस
- ग्रिप
- भोजन101
- fquad
- फ्रीबेस_क्यूए
- अंतर
- रत्न
- जेनरेट_समीक्षा_एंथ
- जेनरिक_केबी
- जर्मन_कानूनी_इकाई_मान्यता
- जर्मनर
- जर्मेवल_14
- गीगा_फ्रेन
- गिगावर्ड
- शर्करा
- गोंद
- gnad10
- गो_इमोशन्स
- गूआक
- google_wellformed_query
- ग्रिल_क्यूए
- महान_कोड
- ग्रीक_कानूनी_कोड
- जीएसएम8के
- संरक्षक_लेखकत्व
- गुटेनबर्ग_टाइम
- हंस
- हैन्सर्ड्स
- कठिन
- हरेम
- has_part
- हेट_ऑफेंसिव
- नफरत_भाषण18
- हेट_स्पीच_फिलिपिनो
- नफरत_भाषण_आपत्तिजनक
- हेट_स्पीच_पीएल
- नफरत_भाषण_पुर्तगाली
- हेटएक्सप्लेन
- हौसा_वोआ_नेर
- हौसा_वोआ_टॉपिक्स
- hda_nli_हिंदी
- हेड_क्यूए
- स्वास्थ्य_तथ्य
- हिब्रू_प्रोजेक्टबेनेहुडा
- हिब्रू भावना
- हिब्रू_यह_दुनिया
- हेलस्वाग
- हेंड्रिक्स_टेस्ट
- hind_encorp
- हिंदी_प्रवचन
- हिप्पोकॉर्पस
- hkcancor
- एचएलजीडी
- आशा_एडी
- हॉटपॉट_क्यूए
- मंडराना
- हरेनवाक_पैरा
- ह्र्वाक
- ह्यूमिक्रोएडिट
- संकर_क्यूए
- हाइपरपार्टिसन_न्यूज_डिटेक्शन
- iapp_wiki_qa_squad
- id_clickbait
- id_liputan6
- id_nergrit_corpus
- id_newspapers_2018
- id_panl_bppt
- id_puisi
- igbo_english_machine_translation
- इग्बो_मोनोलिंगुअल
- igbo_ner
- इलिस्ट
- इमेजनेट-1k
- इमेजनेट_स्केच
- आईएमडीबी
- imdb_urdu_reviews
- प्रभावित करना
- इंडिक_ग्लू
- इंडोन्लि
- इंडोनलु
- जिज्ञासु_क्यूजी
- Interpress_news_category_tr
- इंटरप्रेस_समाचार_श्रेणी_tr_lite
- irc_disentangle
- isixhosa_ner_corpus
- isizulu_ner_corpus
- iwslt2017
- ख़तरा
- jfleg
- jigsaw_toxicity_pred
- jigsaw_unintended_bias
- जेएनएलपीबीए
- पत्रकार_प्रश्न
- कन_होप
- कन्नड़_समाचार
- kd_conv
- केडीई 4
- केल्मो
- kilt_tasks
- kilt_विकिपीडिया
- kinnews_kirnews
- क्लू
- कोर_3i4k
- कोर_हेट
- कोर_नेर
- kor_nli
- kor_nlu
- कोर_क्यूपेयर
- kor_sae
- kor_sarcasm
- लेब्रा
- लामा
- लम्बाडा
- लार्ज_स्पैनिश_कॉर्पस
- लारोसेडा
- lc_quad
- एलसीसीसी
- lener_br
- लेक्स_ग्लू
- झूठा
- librispeech_asr
- librispeech_lm
- सीमा
- लिंस
- लिनिअस
- लाइवका
- lj_speech
- एलएम1बी
- एलएसटी20
- म_लामा
- mac_morpho
- मखज़ानी
- मसाखानेर
- गणित_डेटासेट
- गणित_क्यूए
- मैटिन्फ़
- एमबीपीपी
- एमसी4
- mc_taco
- md_gender_bias
- एमडीडी
- मेड_हॉप
- पदक
- चिकित्सा_संवाद
- चिकित्सा_प्रश्न_जोड़े
- मेडएमसीक्यूए
- menyo20k_mt
- मेटा_वोज़
- मेटाशिफ्ट
- मेटोमा
- मीटरेक
- मियामी
- एमकेबी
- एमकेक्यूए
- एमएलक्यूए
- एमएलएसयूएम
- Mnist
- कहवा
- मोनाश_tsf
- मोरक्को
- movie_rationales
- एमआरक्यूए
- ms_marco
- ms_terms
- msr_genomics_kbcomp
- msr_sqa
- msr_text_compression
- msr_zhen_translation_parity
- msra_ner
- mt_eng_वियतनामी
- मुचोसिन
- मल्टी_बुक्ड
- multi_eurlex
- multi_news
- multi_nli
- multi_nli_mismatch
- मल्टी_पैरा_क्रॉल
- multi_re_qa
- multi_woz_v22
- बहु_x_विज्ञान_योग
- मल्टीडॉक2डायल
- बहुभाषी_लाइब्रिस्पीच
- परस्पर मित्र
- एमडब्ल्यूएससी
- म्यांमार_समाचार
- नैरेटिवका
- कथाका_मैनुअल
- प्राकृतिक_प्रश्न
- एनसीबीआई_रोग
- एनसीएचएलटी
- एनसीएसएलजीआर
- नेल
- तंत्रिका_कोड_खोज
- news_commentary
- समाचार समूह
- समाचार पत्र
- Newsph_nli
- समाचार पत्र
- न्यूजक्यूए
- न्यूज रूम
- एनकेजेपी-नेर
- nli_tr
- nlu_evaluation_data
- नोरेक
- नोर्न
- नॉर्वेजियन_नेर
- nq_open
- एनएसएमसी
- numer_sense
- न्यूमेरिक_फ्यूज्ड_हेड
- ओक्लार
- ऑफकॉम्ब्रे
- अपराध val2020_tr
- अपराधवल_द्रविड़ियन
- ऑफ़िस_पब्लिक
- ओहसुमेद
- ओली
- ओएमपी
- वनस्टॉप_अंग्रेज़ी
- वनस्टॉप_क्यूए
- open_subtitles
- openai_humaneval
- ओपनबुकका
- खुलता है
- ओपनवेबटेक्स्ट
- ओपिनोसिस
- काम 100
- ओपस_किताबें
- opus_dgt
- opus_dogc
- opus_elhuyar
- opus_euconst
- opus_finlex
- opus_fiskmo
- opus_gnome
- opus_infopankki
- opus_memat
- opus_montenegrinssubs
- opus_openoffice
- काम_पैराक्रॉल
- opus_rf
- opus_tedtalks
- opus_ubuntu
- opus_wikipedia
- opus_xhosanvy
- ऑरेंज_सम
- ऑस्कर
- पैरा_क्रॉल
- पैरा_पाट
- पार्सिनलू_रीडिंग_कंप्रिहेंशन
- रास्ता
- पंजे
- पंजे-x
- पीईसी
- पीयर_रीड
- लोग_दैनिक_नेर
- प्रति_भेजा
- फ़ारसी_नेर
- पीजी19
- पीएचपी
- पियाफ़
- पिब
- पिका
- pn_summary
- कविता_भावना
- पोलेमो2
- पोलवल2019_साइबरबुलिंग
- पोलवल2019_mt
- पोलसम
- पॉलीग्लॉट_नर
- प्रचथाई67k
- प्राग्मेवल
- प्रोटो_क्यूए
- पीएससी
- ptb_text_only
- PubMed
- pubmed_qa
- py_ast
- qa4mre
- qa_srl
- qa_zre
- कंगारू
- क्वांटा
- qasc
- कास्पर
- क्यूईडी
- qed_amara
- quac
- बटेर
- झगड़ा
- क्वार्ट्ज
- जल्द आकर्षित
- कोरा
- कोरेफ़
- जाति
- री_डायल
- रीजनिंग_बीजी
- नुस्खा_nlg
- पुनरावर्ती
- red_caps
- reddit_tifu
- ताज़ा करें
- रायटर21578
- पहेली_संवेदना
- ro_sent
- ro_sts
- ro_sts_parallel
- roman_urdu
- roman_urdu_hate_speech
- रोनेक
- रस्सियों
- सड़े टमाटर
- रशियन_सुपर_ग्लू
- rvl_cdip
- s2orc
- SAMSUNG
- संस्कृत_क्लासिक
- सऊदीन्यूज़नेट
- सेबरक्वाड
- sbu_captions
- स्कैन
- scb_mt_enth_2020
- दृश्य_पार्स_150
- schema_guided_dstc8
- scicite
- Scielo
- वैज्ञानिक पत्र
- विज्ञान
- विज्ञान
- स्किटैल
- स्किटल्डर
- search_qa
- सेडे
- सेल्का
- sem_eval_2010_task_8
- sem_eval_2014_task_1
- sem_eval_2018_task_1
- sem_eval_2020_task_11
- भेजा_कंप
- सेंटी_लेक्स
- सेंटी_डब्ल्यूएस
- भावना140
- सेपेडी_नेर
- सेसोथो_नर_कॉर्पस
- समय
- सेटवाना_नेर_कॉर्पस
- शार्क
- शार्क_संशोधित
- बीमार
- सिलिकॉन
- सरल_प्रश्न_v2
- सिसवती_नेर_कॉर्पस
- स्मार्टडेटा
- एसएमएस_स्पैम
- snips_built_in_intents
- स्नलि
- स्नो_सरलीकृत_जापानी_कॉर्पस
- so_stacksनमूना
- सोशल_बायस_फ्रेम्स
- सामाजिक_i_qa
- sofc_materials_articles
- sogou_news
- स्पेनिश_अरब_शब्द
- छठे वेतन आयोग
- प्रजाति_800
- भाषण_आदेश
- मकड़ी
- दस्ता
- स्क्वाड_एडवर्सेरियल
- दस्ते_es
- दस्ते_आईटी
- दस्ते_कोर_v1
- दस्ते_कोर_v2
- दस्ते_v1_pt
- दस्ते_v2
- दस्ते की पाली
- सरवाक
- एसएसटी
- स्टीरियोसेट
- कहानी_बंद
- stsb_mt_sv
- stsb_multi_mt
- स्टाइल_चेंज_डिटेक्शन
- सब्जका
- सुपर गोंद
- शानदार
- svhn
- लूट
- swahili
- स्वाहिली_समाचार
- स्वदा
- स्वीडिश_मेडिकल_नेर
- स्वीडिश_नर_कॉर्पस
- स्वीडिश_समीक्षा
- स्विस_जजमेंट_भविष्यवाणी
- टैब_तथ्य
- तमिल मिक्स सेंटीमेंट
- में tanzil
- तपको
- ताशकीला
- टास्कमास्टर1
- टास्कमास्टर2
- टास्कमास्टर3
- तातोइबा
- ted_hrlr
- ted_iwlst2013
- टेड_मल्टी
- ted_talks_iwslt
- तेलुगु_किताबें
- तेलुगू समाचार
- तप_hi_fa_para
- टेक्स्ट2लॉग
- टेक्स्टवका
- थाई_टॉक्सिसिटी_ट्वीट
- थानेर
- thaiqa_squad
- थैसुम
- ढेर
- the_pile_books3
- the_pile_openwebtext2
- the_पाइल_स्टैक_एक्सचेंज
- tilde_model
- टाइम_डायल
- Times_of_india_news_headlines
- timit_asr
- नन्हा_शेक्सपियर
- टीएलसी
- tmu_gfm_dataset
- tne
- कहा-भाई
- पूर्ण
- ट्रेक
- सामान्य ज्ञान
- ट्रुथफुल_क्यूए
- टीएसीसी
- टीटीसी4900
- टुनिज़ि
- tuple_ie
- तुर्क
- तुर्किक_xwmt
- turkish_movie_sentiment
- तुर्की_नेर
- turkish_product_reviews
- तुर्की_सिकुड़_नेर
- turku_ner_corpus
- ट्वीट_eval
- ट्वीट_क्यूए
- ट्वीट्स_ar_hi_समानांतर
- ट्वीट्स_नफरत_भाषण_पहचान
- twi_text_c3
- twi_wordsim353
- तिदिका
- ubuntu_dialogs_corpus
- यूडीएचआर
- उम005
- un_ga
- un_multi
- un_pc
- सार्वभौम_निर्भरता
- यूनिवर्सल_मॉर्फोलॉजी
- urdu_fake_news
- urdu_sentiment_corpus
- वीसीटीके
- विजुअल_जीनोम
- विवोस
- web_nlg
- वेब ऑफ़ साइंस
- वेब_प्रश्न
- वीबो_नर
- wi_locness
- चौड़ा_चेहरा
- विकी40बी
- विकी_एएसपी
- विकि_परमाणु_संपादन
- विकी_ऑटो
- विकी_बायो
- विकी_डीपीआर
- विकी_हॉप
- विकी_लिंगुआ
- wiki_movies
- wiki_qa
- wiki_qa_ar
- wiki_snippets
- विकि_स्रोत
- विकि_विभाजन
- विकी_सारांश
- विकियान
- विकिकॉर्पस
- विकिहाउ
- विकिपीडिया
- विकीस्क्ल
- विकिटेबल प्रश्न
- विकिटेक्स्ट
- wikitext_tl39
- विली_2018
- wino_bias
- विनोग्रैड_डब्ल्यूएससी
- विनोग्रांडे
- वाइक़ा
- समझदारी1000
- बुद्धिमानी_भावना
- डब्ल्यूएमटी14
- डब्ल्यूएमटी15
- डब्ल्यूएमटी16
- डब्ल्यूएमटी17
- डब्ल्यूएमटी18
- डब्ल्यूएमटी19
- wmt20_mlqe_task1
- wmt20_mlqe_task2
- wmt20_mlqe_task3
- wmt_t2t
- अखरोट_17
- वोंगनै_समीक्षा
- woz_dialogue
- डब्ल्यूआरबीएससी
- x_stance
- एक्सकोपा
- एक्ससीएसआर
- xed_en_fi
- गोंद
- xnli
- xor_tydi_qa
- xquad
- xquad_r
- xsum
- xsum_तथ्यात्मकता
- चरम
- याहू_answers_qa
- yahoo_answers_topics
- yelp_polarity
- yelp_review_full
- योरूबा_bbc_topics
- योरूबा_जीवी_नेर
- योरूबा_टेक्स्ट_c3
- योरूबा_वर्डसिम353
- youtube_caption_सुधार
- उत्तेजकता