- 설명 :
하나는 자원이 많고 다른 하나는 자원이 적은 유사한 언어 쌍을 비교하기 위해 TED 대화 기록에서 파생된 데이터 세트입니다.
버전 :
-
1.0.0
(기본값): 새로운 분할 API( https://tensorflow.org/datasets/splits )
-
다운로드 크기 :
124.94 MiB
자동 캐시 ( 문서 ): 예
그림 ( tfds.show_examples ): 지원되지 않습니다.
인용 :
@inproceedings{Ye2018WordEmbeddings,
author = {Ye, Qi and Devendra, Sachan and Matthieu, Felix and Sarguna, Padmanabhan and Graham, Neubig},
title = {When and Why are pre-trained word embeddings useful for Neural Machine Translation},
booktitle = {HLT-NAACL},
year = {2018},
}
ted_hrlr_translate/az_to_en(기본 구성)
구성 설명 : az에서 en으로의 일반 텍스트 변환 데이터 세트입니다.
데이터 세트 크기 :
1.61 MiB
분할 :
나뉘다 | 예 |
---|---|
'test' | 903 |
'train' | 5,946 |
'validation' | 671 |
- 기능 구조 :
Translation({
'az': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- 기능 문서 :
특징 | 수업 | 모양 | D타입 | 설명 |
---|---|---|---|---|
번역 | ||||
아즈 | 텍스트 | 끈 | ||
ko | 텍스트 | 끈 |
감독 키 (
as_supervised
문서 참조):('az', 'en')
예 ( tfds.as_dataframe ):
ted_hrlr_translate/aztr_to_en
구성 설명 : az_tr에서 일반 텍스트로 en으로 변환 데이터 세트입니다.
데이터 세트 크기 :
42.54 MiB
분할 :
나뉘다 | 예 |
---|---|
'test' | 903 |
'train' | 188,396 |
'validation' | 671 |
- 기능 구조 :
Translation({
'az_tr': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- 기능 문서 :
특징 | 수업 | 모양 | D타입 | 설명 |
---|---|---|---|---|
번역 | ||||
az_tr | 텍스트 | 끈 | ||
ko | 텍스트 | 끈 |
감독 키 (
as_supervised
문서 참조):('az_tr', 'en')
예 ( tfds.as_dataframe ):
ted_hrlr_translate/be_to_en
구성 설명 : be에서 en으로의 일반 텍스트 번역 데이터 세트입니다.
데이터 세트 크기 :
1.47 MiB
분할 :
나뉘다 | 예 |
---|---|
'test' | 664 |
'train' | 4,509 |
'validation' | 248 |
- 기능 구조 :
Translation({
'be': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- 기능 문서 :
특징 | 수업 | 모양 | D타입 | 설명 |
---|---|---|---|---|
번역 | ||||
BE | 텍스트 | 끈 | ||
ko | 텍스트 | 끈 |
감독 키 (
as_supervised
문서 참조):('be', 'en')
예 ( tfds.as_dataframe ):
ted_hrlr_translate/beru_to_en
구성 설명 : be_ru에서 일반 텍스트로 en으로 변환 데이터 세트입니다.
데이터 세트 크기 :
62.45 MiB
분할 :
나뉘다 | 예 |
---|---|
'test' | 664 |
'train' | 212,614 |
'validation' | 248 |
- 기능 구조 :
Translation({
'be_ru': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- 기능 문서 :
특징 | 수업 | 모양 | D타입 | 설명 |
---|---|---|---|---|
번역 | ||||
be_ru | 텍스트 | 끈 | ||
ko | 텍스트 | 끈 |
감독 키 (
as_supervised
문서 참조):('be_ru', 'en')
예 ( tfds.as_dataframe ):
ted_hrlr_translate/es_to_pt
구성 설명 : es에서 pt로의 일반 텍스트 변환 데이터 세트입니다.
데이터 세트 크기 :
9.62 MiB
분할 :
나뉘다 | 예 |
---|---|
'test' | 1,763 |
'train' | 44,938 |
'validation' | 1,016 |
- 기능 구조 :
Translation({
'es': Text(shape=(), dtype=string),
'pt': Text(shape=(), dtype=string),
})
- 기능 문서 :
특징 | 수업 | 모양 | D타입 | 설명 |
---|---|---|---|---|
번역 | ||||
예 | 텍스트 | 끈 | ||
태평양 표준시 | 텍스트 | 끈 |
감독 키 (
as_supervised
문서 참조):('es', 'pt')
예 ( tfds.as_dataframe ):
ted_hrlr_translate/fr_to_pt
구성 설명 : fr에서 pt로의 일반 텍스트 변환 데이터 세트입니다.
데이터 세트 크기 :
9.74 MiB
분할 :
나뉘다 | 예 |
---|---|
'test' | 1,494 |
'train' | 43,873 |
'validation' | 1,131 |
- 기능 구조 :
Translation({
'fr': Text(shape=(), dtype=string),
'pt': Text(shape=(), dtype=string),
})
- 기능 문서 :
특징 | 수업 | 모양 | D타입 | 설명 |
---|---|---|---|---|
번역 | ||||
정말로 | 텍스트 | 끈 | ||
태평양 표준시 | 텍스트 | 끈 |
감독 키 (
as_supervised
문서 참조):('fr', 'pt')
예 ( tfds.as_dataframe ):
ted_hrlr_translate/gl_to_en
구성 설명 : 일반 텍스트에서 gl에서 en으로의 변환 데이터 세트입니다.
데이터 세트 크기 :
2.41 MiB
분할 :
나뉘다 | 예 |
---|---|
'test' | 1,007 |
'train' | 10,017 |
'validation' | 682 |
- 기능 구조 :
Translation({
'en': Text(shape=(), dtype=string),
'gl': Text(shape=(), dtype=string),
})
- 기능 문서 :
특징 | 수업 | 모양 | D타입 | 설명 |
---|---|---|---|---|
번역 | ||||
ko | 텍스트 | 끈 | ||
GL | 텍스트 | 끈 |
감독 키 (
as_supervised
문서 참조):('gl', 'en')
예 ( tfds.as_dataframe ):
ted_hrlr_translate/glpt_to_en
구성 설명 : 일반 텍스트에서 gl_pt에서 en으로의 번역 데이터 세트입니다.
데이터 세트 크기 :
12.90 MiB
분할 :
나뉘다 | 예 |
---|---|
'test' | 1,007 |
'train' | 61,802 |
'validation' | 682 |
- 기능 구조 :
Translation({
'en': Text(shape=(), dtype=string),
'gl_pt': Text(shape=(), dtype=string),
})
- 기능 문서 :
특징 | 수업 | 모양 | D타입 | 설명 |
---|---|---|---|---|
번역 | ||||
ko | 텍스트 | 끈 | ||
gl_pt | 텍스트 | 끈 |
감독 키 (
as_supervised
문서 참조):('gl_pt', 'en')
예 ( tfds.as_dataframe ):
ted_hrlr_translate/he_to_pt
구성 설명 : he에서 pt로의 일반 텍스트 번역 데이터 세트입니다.
데이터 세트 크기 :
11.71 MiB
분할 :
나뉘다 | 예 |
---|---|
'test' | 1,623 |
'train' | 48,511 |
'validation' | 1,145 |
- 기능 구조 :
Translation({
'he': Text(shape=(), dtype=string),
'pt': Text(shape=(), dtype=string),
})
- 기능 문서 :
특징 | 수업 | 모양 | D타입 | 설명 |
---|---|---|---|---|
번역 | ||||
그 | 텍스트 | 끈 | ||
태평양 표준시 | 텍스트 | 끈 |
감독 키 (
as_supervised
문서 참조):('he', 'pt')
예 ( tfds.as_dataframe ):
ted_hrlr_translate/it_to_pt
구성 설명 : 일반 텍스트에서 pt로 변환 데이터 세트입니다.
데이터 세트 크기 :
9.94 MiB
분할 :
나뉘다 | 예 |
---|---|
'test' | 1,669 |
'train' | 46,259 |
'validation' | 1,162 |
- 기능 구조 :
Translation({
'it': Text(shape=(), dtype=string),
'pt': Text(shape=(), dtype=string),
})
- 기능 문서 :
특징 | 수업 | 모양 | D타입 | 설명 |
---|---|---|---|---|
번역 | ||||
그것 | 텍스트 | 끈 | ||
태평양 표준시 | 텍스트 | 끈 |
감독된 키 (
as_supervised
문서 참조):('it', 'pt')
예 ( tfds.as_dataframe ):
ted_hrlr_translate/pt_to_en
구성 설명 : pt에서 en으로의 일반 텍스트 번역 데이터 세트입니다.
데이터 세트 크기 :
10.89 MiB
분할 :
나뉘다 | 예 |
---|---|
'test' | 1,803 |
'train' | 51,785 |
'validation' | 1,193 |
- 기능 구조 :
Translation({
'en': Text(shape=(), dtype=string),
'pt': Text(shape=(), dtype=string),
})
- 기능 문서 :
특징 | 수업 | 모양 | D타입 | 설명 |
---|---|---|---|---|
번역 | ||||
ko | 텍스트 | 끈 | ||
태평양 표준시 | 텍스트 | 끈 |
감독 키 (
as_supervised
문서 참조):('pt', 'en')
예 ( tfds.as_dataframe ):
ted_hrlr_translate/ru_to_en
구성 설명 : ru에서 en으로의 일반 텍스트 번역 데이터 세트입니다.
데이터 세트 크기 :
63.22 MiB
분할 :
나뉘다 | 예 |
---|---|
'test' | 5,476 |
'train' | 208,106 |
'validation' | 4,805 |
- 기능 구조 :
Translation({
'en': Text(shape=(), dtype=string),
'ru': Text(shape=(), dtype=string),
})
- 기능 문서 :
특징 | 수업 | 모양 | D타입 | 설명 |
---|---|---|---|---|
번역 | ||||
ko | 텍스트 | 끈 | ||
루 | 텍스트 | 끈 |
감독 키 (
as_supervised
문서 참조):('ru', 'en')
예 ( tfds.as_dataframe ):
ted_hrlr_translate/ru_to_pt
구성 설명 : ru에서 pt로의 일반 텍스트 변환 데이터 세트입니다.
데이터 세트 크기 :
13.00 MiB
분할 :
나뉘다 | 예 |
---|---|
'test' | 1,588 |
'train' | 47,278 |
'validation' | 1,184 |
- 기능 구조 :
Translation({
'pt': Text(shape=(), dtype=string),
'ru': Text(shape=(), dtype=string),
})
- 기능 문서 :
특징 | 수업 | 모양 | D타입 | 설명 |
---|---|---|---|---|
번역 | ||||
태평양 표준시 | 텍스트 | 끈 | ||
루 | 텍스트 | 끈 |
감독 키 (
as_supervised
문서 참조):('ru', 'pt')
예 ( tfds.as_dataframe ):
ted_hrlr_translate/tr_to_en
구성 설명 : 일반 텍스트에서 tr에서 en으로의 변환 데이터 세트입니다.
데이터 세트 크기 :
42.33 MiB
분할 :
나뉘다 | 예 |
---|---|
'test' | 5,029 |
'train' | 182,450 |
'validation' | 4,045 |
- 기능 구조 :
Translation({
'en': Text(shape=(), dtype=string),
'tr': Text(shape=(), dtype=string),
})
- 기능 문서 :
특징 | 수업 | 모양 | D타입 | 설명 |
---|---|---|---|---|
번역 | ||||
ko | 텍스트 | 끈 | ||
트 | 텍스트 | 끈 |
감독 키 (
as_supervised
문서 참조):('tr', 'en')
예 ( tfds.as_dataframe ):