복스포지

설명 :

VoxForge는 언어 분류 데이터 세트입니다. 웹 사이트에 제출된 사용자 제출 오디오 클립으로 구성됩니다. 이 릴리스에서는 6개 언어(영어, 스페인어, 프랑스어, 독일어, 러시아어 및 이탈리아어)의 데이터가 수집됩니다. 웹사이트는 지속적으로 업데이트되고 재현성을 위해 이 릴리스에는 2020-01-01 이전에 제출된 녹음만 포함됩니다. 각 스피커의 샘플이 정확히 하나의 분할에 속하도록 샘플이 훈련, 검증 및 테스트 간에 분할됩니다.

추가 문서 : 코드가 있는 논문에서 탐색
홈페이지 : http://www.voxforge.org/
소스 코드 : tfds.audio.Voxforge
버전 :
- 1.0.0 (기본값): 릴리스 정보가 없습니다.
다운로드 크기 : Unknown size
데이터세트 크기 : Unknown size
수동 다운로드 지침 : 이 데이터 세트는 원본 데이터를 download_config.manual_dir에 수동으로 download_config.manual_dir 해야 합니다(기본값은 ~/tensorflow_datasets/downloads/manual/ ).
VoxForge는 오디오 아카이브를 수동으로 다운로드해야 합니다. 아카이브의 전체 목록은 https://storage.googleapis.com/tfds-data/downloads/voxforge/voxforge_urls.txt 에서 찾을 수 있습니다. 다음 명령을 사용하여 다운로드할 수 있습니다. wget -i voxforge_urls.txt -x 데이터 세트를 로컬로 구축하려면 ~100GB의 디스크 공간이 필요합니다(단 ~60GB만 영구적으로 사용됨).
자동 캐시 됨( 문서 ): 알 수 없음
분할 :

나뉘다	예

기능 구조 :

FeaturesDict({
    'audio': Audio(shape=(None,), dtype=int64),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=6),
    'speaker_id': string,
})

기능 문서 :

특징	수업	모양	D타입
	풍모Dict
오디오	오디오	(없음,)	int64
상표	클래스 레이블		int64
speaker_id	텐서		끈

감독 키 ( as_supervised 문서 참조): ('audio', 'label')
그림 ( tfds.show_examples ): 지원되지 않습니다.
예 ( tfds.as_dataframe ): 누락.
인용 :

@article{maclean2018voxforge,
  title={Voxforge},
  author={MacLean, Ken},
  journal={Ken MacLean.[Online]. Available: http://www.voxforge.org/home.[Acedido em 2012]},
  year={2018}
}

복스포지 컬렉션을 사용해 정리하기 내 환경설정을 기준으로 콘텐츠를 저장하고 분류하세요.

복스포지