Huggingface, TFDS'yi çatalladı ve birçok metin veri seti sağlıyor. Daha fazla belge için buraya bakın. Ardından, TFDS ile kullanılabilecek tüm veri kümelerinin listesini bulabilirsiniz.
- kısaltma_kimliği
- ade_corpus_v2
- adv_glue
- hasım_qa
- aeslc
- afrikaans_ner_corpus
- ag_news
- ai2_arc
- air_dialogue
- ajgt_twitter_ar
- allegro_reviews
- alosine
- alt
- amazon_polarity
- amazon_reviews_multi
- amazon_us_reviews
- ambig_qa
- americas_nli
- ben miyim
- amttl
- anlı
- app_reviews
- aqua_rat
- akvaryum
- ar_cov19
- ar_res_reviews
- ar_sarcasm
- arapça_milyar_kelimeler
- arap_pos_dialect
- arapça_speech_corpus
- yay
- arsend_lev
- Sanat
- arxiv_veri kümesi
- ascent_kb
- aslg_pc12
- asnq
- varlık
- göt
- göt2
- atomik
- otshumato
- babi_qa
- bankacılık77
- bbaw_egyptian
- bbc_hindi_nli
- bc2gm_corpus
- Fasulyeler
- en iyi2009
- bianet
- İncil_para
- big_patent
- büyük tezgah
- fatura
- bing_coronavirus_query_set
- biyomrc
- canlılar
- biwi_kinect_head_pose
- blbook'lar
- blbooks türü
- blended_skill_talk
- keşif balonu
- blog_authorship_corpus
- bn_hate_speech
- bnl_newspapers
- kitap topluluğu
- kitap derlemesi
- boolq
- bprec
- break_data
- brwac
- bsd_ja_tr
- bswac
- c3
- c4
- cail2018
- caner
- pelerinler
- kumarhane
- catalonia_independence
- cat_vs_dogs
- kavak
- TCMB
- cc100
- cc_news
- ccaligned_multilingual
- cdsc
- cdt
- sedir
- cfq
- chr_tr
- cifar10
- cifar100
- yaklaşık
- sivil_yorumlar
- clickbait_news_bg
- iklim_ateşi
- clinc_oos
- ipucu
- cmrc2018
- cmu_hinglish_dog
- cnn_dailymail
- Coached_conv_pref
- kaba_söylem
- koda
- code_search_net
- code_x_glue_cc_clone_detection_big_clone_bench
- code_x_glue_cc_clone_detection_poj104
- code_x_glue_cc_cloze_testing_all
- code_x_glue_cc_cloze_testing_maxmin
- code_x_glue_cc_code_completion_line
- code_x_glue_cc_code_completion_token
- code_x_glue_cc_code_arıtma
- code_x_glue_cc_code_to_code_trans
- code_x_glue_cc_defect_detection
- code_x_glue_ct_code_to_text
- code_x_glue_tc_nl_code_search_adv
- code_x_glue_tc_text_to_code
- code_x_glue_tt_text_to_text
- com_qa
- ortak_gen
- ortak dil
- ortak ses
- sağduyu_qa
- rekabet_matematiği
- sövmek ne
- kavram ağı5
- kavramsal_12m
- kavramsal_başlıklar
- conll2000
- conll2002
- conll2003
- conll2012_ontonotesv5
- conllpp
- tüketici-finans-şikayetleri
- conv_ai
- conv_ai_2
- conv_ai_3
- conv_questions
- koka
- kordon19
- cornell_movie_dialog
- cos_e
- kozmos_qa
- tezgah
- covid_qa_castorini
- covid_qa_deepset
- covid_qa_ucsd
- covid_tweets_japanese
- covost2
- cppe-5
- craigslist_bargains
- tarama_alanı
- crd3
- Crime_and_punish
- kargalar_çiftleri
- kriptonit
- cs_restaurants
- kuad
- merak_diyalogları
- Daily_dialog
- Danimarkalı
- danish_politik_yorumlar
- Dart oyunu
- datacommons_factcheck
- dbpedia_14
- dbrd
- anlaşma_or_no_dialog
- kesin_zamir_çözünürlük
- dang_filipino
- dialog_re
- diplomacy_detection
- felaket_response_messages
- dağılmak
- keşif
- disfl_qa
- doc2dial
- belgelenmiş
- doka
- rüya
- düşürmek
- çift
- hollandalı_sosyal
- lezbiyen
- e2e_nlg
- e2e_nlg_cleaned
- ecb
- ecthr_cases
- kızdırmak
- ehealth_kd
- eitb_parcc
- elektrik_yük_diyagramları
- eli5
- eli5_category
- elkarhizketak
- emea
- emo
- duygu
- emotone_ar
- empatik_diyaloglar
- riched_web_nlg
- enwik8
- silgi_multi_rc
- esnli
- eth_py150_open
- ahlak
- ett
- eu_regulatory_ir
- eurlex
- euronews
- europa_eac_tm
- europa_ecdc_tm
- europarl_bilingual
- event2Mind
- Kanıt_infer_tedavisi
- sınavlar
- factckbr
- fake_news_english
- fake_news_filipino
- farsi_news
- moda_mnist
- ateş
- birkaç_rel
- Financial_phrasebank
- daha ince
- çiçekler
- baca
- yemek101
- fquad
- freebase_qa
- açıklık
- mücevher
- oluşturulan_reviews_enth
- jenerik_kb
- german_legal_entity_recognition
- alman
- germeval_14
- giga_fren
- gigaword
- glikoz
- zamk
- gnad10
- go_emotions
- gooaq
- google_wellformed_query
- grail_qa
- harika_kod
- greek_legal_code
- gsm8k
- Guardian_authorship
- gutenberg_time
- hanlar
- hansardlar
- sert
- harem
- has_part
- hat_offensive
- nefret_speech18
- Hat_speech_filipino
- Hat_speech_offensive
- hat_speech_pl
- Hat_speech_portuguese
- açıkla
- hausa_voa_ner
- hausa_voa_topics
- hda_nli_hindi
- head_qa
- sağlık_gerçek
- ibranice_projectbenyehuda
- İbranice_duygu
- ibranice_this_world
- saçmalık
- hendrycks_test
- hind_encorp
- hindi_discourse
- hipokorpus
- hkcancor
- hlgd
- umut_edi
- hotpot_qa
- üzerine gelmek
- hrenwac_para
- hrwac
- hummicroedit
- melez_qa
- hyperpartisan_news_detection
- iapp_wiki_qa_squad
- id_clickbait
- id_liputan6
- id_nergrit_corpus
- id_newspapers_2018
- id_panl_bppt
- id_puisi
- igbo_english_machine_translation
- ibo_tek dilli
- ibo_ner
- ilist
- imagenet-1k
- imagenet_sketch
- imdb
- imdb_urdu_reviews
- etkilemek
- indic_glue
- Hintli
- indonlu
- meraklı_qg
- interpress_news_category_tr
- interpress_news_category_tr_lite
- irc_disentangle
- isixhosa_ner_corpus
- isizulu_ner_corpus
- iwslt2017
- tehlike
- jfleg
- yapboz_toksisite_pred
- yapboz_unintenended_bias
- jnlpba
- gazeteciler_soruları
- kan_hope
- kannada_news
- kd_conv
- kde4
- kelm
- kilt_tasks
- kilt_wikipedia
- kinnews_kirnews
- ipucu
- kor_3i4k
- kor_hate
- kor_ner
- kor_nli
- kor_nlu
- kor_qpair
- kor_sae
- kor_sarcasm
- labr
- lama
- lambada
- büyük_spanish_corpus
- laroseda
- lc_quad
- lccc
- lener_br
- lex_glue
- yalancı
- librispeech_asr
- librispeech_lm
- sınır
- keten
- keten
- liveqa
- lj_speech
- lm1b
- lst20
- m_lama
- mac_morpho
- mahzen
- masahaner
- matematik_veri kümesi
- matematik_qa
- matinf
- mbpp
- mc4
- mc_taco
- md_gender_bias
- mdd
- med_hop
- madalya
- medikal_dialog
- medikal_questions_pairs
- medmcqa
- menyo20k_mt
- meta_woz
- meta kaydırma
- metoom
- metrec
- miam
- mkb
- mkqa
- mlqa
- mlsum
- az önce
- moka
- monash_tsf
- Fas
- film_rasyonelleri
- mrqa
- ms_marco
- ms_terms
- msr_genomics_kbcomp
- msr_sqa
- msr_text_compression
- msr_zhen_translation_parity
- msra_ner
- mt_eng_vietnamese
- çokosin
- multi_booked
- multi_eurlex
- multi_news
- multi_nli
- multi_nli_mismatch
- multi_para_crawl
- multi_re_qa
- multi_woz_v22
- multi_x_science_sum
- multidoc2dial
- çok dilli_librispeech
- ortak arkadaşlar
- mwsc
- myanmar_news
- anlatı
- anlatıqa_manual
- natural_questions
- ncbi_disease
- chlt
- ncslgr
- nell
- neural_code_search
- news_commentary
- yeni Grup
- haber
- Newsph_nli
- haber poposu
- haber
- haber odası
- nkjp-ner
- nli_tr
- nlu_evaluation_data
- norek
- norne
- norwegian_ner
- nq_open
- nsmc
- numer_sense
- sayısal_fused_head
- oklar
- kapalı
- hücumval2020_tr
- hücumval_dravidian
- ofis_publik
- özetlenmiş
- ollie
- omp
- onestop_english
- onestop_qa
- open_subtitles
- openai_humaneval
- açık kitapka
- Openslr
- açık web metni
- görüş
- opus100
- opus_books
- opus_dgt
- opus_dogc
- opus_elhuyar
- opus_euconst
- opus_finlex
- opus_fiskmo
- opus_gnome
- opus_infopankki
- opus_memat
- opus_montenegrinsubs
- opus_openoffice
- opus_paracrawl
- opus_rf
- opus_tedtalks
- opus_ubuntu
- opus_wikipedia
- opus_xhosanavy
- turuncu_sum
- oscar
- para_crawl
- para_pat
- parsinlu_reading_comprehension
- geçmek
- patiler
- patiler-x
- pek
- peer_read
- Peoples_daily_ner
- per_sent
- farsça_ner
- pg19
- php
- piaf
- pib
- pika
- pn_özet
- poet_sentiment
- polemo2
- poleval2019_siber zorbalık
- poleval2019_mt
- polsum
- çok dilli_ner
- prachathai67k
- pragmaval
- proto_qa
- psc
- ptb_text_only
- yayınlanmış
- pubmed_qa
- py_ast
- qa4mre
- qa_srl
- qa_zre
- kanguru
- kanta
- qasc
- kasper
- qed
- qed_amara
- quac
- Bıldırcın
- kavga
- kuvars
- hızlı çizim
- quora
- quoref
- yarış
- yeniden arama
- muhakeme_bg
- yemek tarifi_nlg
- kayıt
- red_caps
- reddit_tifu
- yeniden
- reuters21578
- bilmece_sense
- ro_sent
- ro_sts
- ro_sts_paralel
- roman_urdu
- roman_urdu_hate_speech
- ronec
- halatlar
- çürük domates
- russian_super_glue
- rvl_cdip
- s2orc
- samsum
- sanskritçe_klasik
- saudinewsnet
- sberquad
- sbu_captions
- tarama
- scb_mt_enth_2020
- sahne_parse_150
- schema_guided_dstc8
- bilim
- scielo
- bilimsel belgeler
- bilim
- sciq
- scitail
- scitldr
- search_qa
- sede
- selka
- sem_eval_2010_task_8
- sem_eval_2014_task_1
- sem_eval_2018_task_1
- sem_eval_2020_task_11
- send_comp
- senti_lex
- senti_ws
- duygu140
- seped_ner
- sesotho_ner_corpus
- setler
- setwana_ner_corpus
- şark
- sharc_modified
- hasta
- silikon
- simple_questions_v2
- siswati_ner_corpus
- akıllı veri
- sms_spam
- snips_built_in_intents
- snli
- snow_simplified_japanese_corpus
- so_stackörnek
- Social_bias_frames
- sosyal_i_qa
- sofc_materials_articles
- sogou_news
- İspanyolca_milyar_kelimeler
- özel
- türler_800
- konuşma_komutları
- örümcek
- Tayfa
- takım_adversarial
- takımlar
- takım_it
- takım_kor_v1
- takım_kor_v2
- takım_v1_pt
- takım_v2
- ekip değişiklikleri
- srwac
- sst
- stereo set
- story_cloze
- stsb_mt_sv
- stsb_multi_mt
- style_change_detection
- subjqa
- Süper yapıştırıcı
- süper
- svhn
- yağma
- svahili
- svahili_news
- swda
- swedish_medical_ner
- swedish_ner_corpus
- swedish_reviews
- swiss_judgment_tahmin
- tab_fact
- tamilmixduygu
- tanzil
- tapako
- tashkeela
- görev yöneticisi1
- görev yöneticisi2
- görev yöneticisi3
- tatoeba
- ted_hrlr
- ted_iwlst2013
- ted_multi
- ted_talks_iwslt
- telugu_books
- telugu_news
- tep_en_fa_para
- metin2log
- metinvqa
- thai_toksisite_tweet
- thainer
- thaiqa_squad
- Tayland
- yığın
- the_pile_books3
- the_pile_openwebtext2
- the_pile_stack_exchange
- tilde_model
- time_dial
- times_of_india_news_headlines
- timit_asr
- minik_shakespeare
- tlc
- tmu_gfm_veri kümesi
- tne
- söyledi-br
- toto
- trek
- önemsiz şey
- doğru_qa
- tsac
- ttc4900
- tunus
- tuple_ie
- Türk
- turkic_xwmt
- turkish_movie_sentiment
- turk_ner
- turkish_product_reviews
- turkish_shrinked_ner
- turku_ner_corpus
- tweet_eval
- tweet_qa
- tweets_ar_en_parallel
- tweets_hate_speech_detection
- twi_text_c3
- twi_wordsim353
- tidika
- ubuntu_dialogs_corpus
- uhr
- um005
- un_ga
- un_multi
- un_pc
- evrensel_bağımlılıklar
- evrensel_morfolojiler
- urdu_fake_news
- urdu_sentiment_corpus
- vctk
- görsel_genom
- canlılar
- web_nlg
- Bilim Ağı
- web_questions
- weibo_ner
- wi_locness
- daha geniş_yüz
- wiki40b
- wiki_asp
- wiki_atomic_edits
- wiki_auto
- wiki_bio
- wiki_dpr
- wiki_hop
- wiki_lingua
- wiki_movies
- wiki_qa
- wiki_qa_ar
- wiki_snippets
- wiki_source
- wiki_split
- wiki_summary
- wikiann
- wikicorpus
- wikihow
- wikipedia
- wikisql
- wikitablesorular
- vikimetin
- wikitext_tl39
- wili_2018
- wino_bias
- winograd_wsc
- şaraphane
- wiqa
- bilge 1000
- wisesight_sentiment
- wmt14
- wmt15
- wmt16
- wmt17
- wmt18
- wmt19
- wmt20_mlqe_task1
- wmt20_mlqe_task2
- wmt20_mlqe_task3
- wmt_t2t
- wnut_17
- wongnai_reviews
- woz_diyalog
- wrbsc
- x_stance
- xcopa
- xcsr
- xed_en_fi
- yapıştırıcı
- xnli
- xor_tydi_qa
- dörtlü
- xquad_r
- x toplam
- xsum_factuality
- aşırı
- yahoo_answers_qa
- yahoo_answers_topics
- yelp_polarity
- yelp_review_full
- yoruba_bbc_topics
- yoruba_gv_ner
- yoruba_text_c3
- yoruba_wordsim353
- youtube_caption_corrections
- lezzet