- 설명 :
히브리어로 예 또는 아니오라고 말하는 한 개인의 60개 녹음; 각 녹음의 길이는 8단어입니다.
데이터 세트의 요점은 Kaldi 스크립트를 무료로 테스트할 수 있는 쉽고 빠른 방법을 제공하는 것입니다.
아카이브 "waves_yesno.tar.gz"에는 8kHz로 샘플링된 60개의 .wav 파일이 포함되어 있습니다. 모두 같은 남성 화자가 히브리어로 녹음했습니다. 각 파일에서 개인은 8단어를 말합니다. 각 단어는 "예" 또는 "아니오"를 의미하는 히브리어이므로 각 파일은 8개의 예-에스 또는 아니오의 임의 시퀀스입니다. 별도의 전사가 제공되지 않습니다. 시퀀스는 파일 이름에 인코딩되며 예는 1, 아니요는 0입니다.
홈페이지 : https://www.openslr.org/1/
소스 코드 :
tfds.audio.yesno.YesNo
버전 :
-
1.0.0
(기본값): 릴리스 정보가 없습니다.
-
다운로드 크기 :
4.49 MiB
데이터 세트 크기 :
16.27 MiB
자동 캐시 ( 문서 ): 예
분할 :
나뉘다 | 예 |
---|---|
'train' | 60 |
- 기능 구조 :
FeaturesDict({
'audio': Audio(shape=(None,), dtype=int64),
'audio/filename': Text(shape=(), dtype=string),
'label': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=2)),
})
- 기능 문서 :
특징 | 수업 | 모양 | D타입 | 설명 |
---|---|---|---|---|
풍모Dict | ||||
오디오 | 오디오 | (없음,) | int64 | |
오디오/파일 이름 | 텍스트 | 끈 | ||
상표 | 시퀀스(클래스 레이블) | (없음,) | int64 |
감독 키 (
as_supervised
문서 참조):('audio', 'label')
그림 ( tfds.show_examples ): 지원되지 않습니다.
예 ( tfds.as_dataframe ):
- 인용 :
@ONLINE {YesNo,
author = "Created for the Kaldi Project",
title = "YesNo",
url = "http://www.openslr.org/1/"
}