ucf101

  • Mô tả :

Bộ dữ liệu phân loại video gồm 101 nhãn.

@article{DBLP:journals/corr/abs-1212-0402,
  author    = {Khurram Soomro and
               Amir Roshan Zamir and
               Mubarak Shah},
  title     = { {UCF101:} {A} Dataset of 101 Human Actions Classes From Videos in
               The Wild},
  journal   = {CoRR},
  volume    = {abs/1212.0402},
  year      = {2012},
  url       = {http://arxiv.org/abs/1212.0402},
  archivePrefix = {arXiv},
  eprint    = {1212.0402},
  timestamp = {Mon, 13 Aug 2018 16:47:45 +0200},
  biburl    = {https://dblp.org/rec/bib/journals/corr/abs-1212-0402},
  bibsource = {dblp computer science bibliography, https://dblp.org}
}

ucf101/ucf101_1_256 (cấu hình mặc định)

  • Mô tả cấu hình : 256x256 UCF với phần tách nhận dạng hành động đầu tiên.

  • Kích thước tập dữ liệu : 7.40 GiB

  • Chia tách :

Tách ra ví dụ
'test' 3,783
'train' 9,537
  • Cấu trúc tính năng :
FeaturesDict({
    'label': ClassLabel(shape=(), dtype=int64, num_classes=101),
    'video': Video(Image(shape=(256, 256, 3), dtype=uint8)),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
nhãn mác LớpNhãn int64
video Video(Hình ảnh) (Không, 256, 256, 3) uint8

ucf101/ucf101_1

  • Mô tả cấu hình : UCF với phân chia nhận dạng hành động #1.

  • Kích thước tập dữ liệu : 8.48 GiB

  • Chia tách :

Tách ra ví dụ
'test' 3,783
'train' 9,537
  • Cấu trúc tính năng :
FeaturesDict({
    'label': ClassLabel(shape=(), dtype=int64, num_classes=101),
    'video': Video(Image(shape=(None, None, 3), dtype=uint8)),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
nhãn mác LớpNhãn int64
video Video(Hình ảnh) (Không, Không, Không, 3) uint8

ucf101/ucf101_2

  • Mô tả cấu hình : UCF với phân chia nhận dạng hành động #2.

  • Kích thước tập dữ liệu : 8.48 GiB

  • Chia tách :

Tách ra ví dụ
'test' 3,734
'train' 9,586
  • Cấu trúc tính năng :
FeaturesDict({
    'label': ClassLabel(shape=(), dtype=int64, num_classes=101),
    'video': Video(Image(shape=(None, None, 3), dtype=uint8)),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
nhãn mác LớpNhãn int64
video Video(Hình ảnh) (Không, Không, Không, 3) uint8

ucf101/ucf101_3

  • Mô tả cấu hình : UCF với phân chia nhận dạng hành động #3.

  • Kích thước tập dữ liệu : 8.48 GiB

  • Chia tách :

Tách ra ví dụ
'test' 3,696
'train' 9,624
  • Cấu trúc tính năng :
FeaturesDict({
    'label': ClassLabel(shape=(), dtype=int64, num_classes=101),
    'video': Video(Image(shape=(None, None, 3), dtype=uint8)),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
nhãn mác LớpNhãn int64
video Video(Hình ảnh) (Không, Không, Không, 3) uint8