참고자료:
위키텍스트-tl-39
TFDS에 이 데이터세트를 로드하려면 다음 명령어를 사용하세요.
ds = tfds.load('huggingface:wikitext_tl39/wikitext-tl-39')
- 설명 :
Large scale, unlabeled text dataset with 39 Million tokens in the training set. Inspired by the original WikiText Long Term Dependency dataset (Merity et al., 2016). TL means "Tagalog." Originally published in Cruz & Cheng (2019).
- 라이센스 : GPL-3.0
- 버전 : 1.0.0
- 분할 :
나뉘다 | 예 |
---|---|
'test' | 376737 |
'train' | 1766072 |
'validation' | 381763 |
- 특징 :
{
"text": {
"dtype": "string",
"id": null,
"_type": "Value"
}
}