- Описание :
Это набор данных, использованный для Третьего международного конкурса средств обнаружения знаний и интеллектуального анализа данных, который проводился совместно с KDD-99 Пятой международной конференцией по обнаружению знаний и интеллектуальному анализу данных. Задачей конкурса было создание детектора сетевых вторжений, прогностической модели, способной различать «плохие» соединения, называемые вторжениями или атаками, и «хорошие» нормальные соединения. Эта база данных содержит стандартный набор данных для аудита, который включает широкий спектр вторжений, смоделированных в военной сетевой среде.
Дополнительная документация : изучить документы с кодом
Домашняя страница : https://kdd.ics.uci.edu/databases/kddcup99/kddcup99.html
Исходный код :
tfds.datasets.kddcup99.Builder
Версии :
-
1.0.0
: Первоначальный выпуск. -
1.0.1
(по умолчанию): исправляет синтаксический анализ логических полейland
,logged_in
,root_shell
,is_hot_login
иis_guest_login
.
-
Размер загрузки :
18.62 MiB
.Размер набора данных :
5.25 GiB
Автоматическое кэширование ( документация ): Нет
Сплиты :
Расколоть | Примеры |
---|---|
'test' | 311 029 |
'train' | 4 898 431 |
- Структура функции :
FeaturesDict({
'count': int32,
'diff_srv_rate': float32,
'dst_bytes': int32,
'dst_host_count': int32,
'dst_host_diff_srv_rate': float32,
'dst_host_rerror_rate': float32,
'dst_host_same_src_port_rate': float32,
'dst_host_same_srv_rate': float32,
'dst_host_serror_rate': float32,
'dst_host_srv_count': int32,
'dst_host_srv_diff_host_rate': float32,
'dst_host_srv_rerror_rate': float32,
'dst_host_srv_serror_rate': float32,
'duration': int32,
'flag': ClassLabel(shape=(), dtype=int64, num_classes=11),
'hot': int32,
'is_guest_login': bool,
'is_hot_login': bool,
'label': ClassLabel(shape=(), dtype=int64, num_classes=40),
'land': bool,
'logged_in': bool,
'num_access_files': int32,
'num_compromised': int32,
'num_failed_logins': int32,
'num_file_creations': int32,
'num_outbound_cmds': int32,
'num_root': int32,
'num_shells': int32,
'protocol_type': ClassLabel(shape=(), dtype=int64, num_classes=3),
'rerror_rate': float32,
'root_shell': bool,
'same_srv_rate': float32,
'serror_rate': float32,
'service': ClassLabel(shape=(), dtype=int64, num_classes=71),
'src_bytes': int32,
'srv_count': int32,
'srv_diff_host_rate': float32,
'srv_rerror_rate': float32,
'srv_serror_rate': float32,
'su_attempted': int32,
'urgent': int32,
'wrong_fragment': int32,
})
- Документация по функциям :
Особенность | Учебный класс | Форма | Dтип | Описание |
---|---|---|---|---|
ОсобенностиDict | ||||
считать | Тензор | int32 | ||
diff_srv_rate | Тензор | поплавок32 | ||
dst_bytes | Тензор | int32 | ||
dst_host_count | Тензор | int32 | ||
dst_host_diff_srv_rate | Тензор | поплавок32 | ||
dst_host_rerror_rate | Тензор | поплавок32 | ||
dst_host_same_src_port_rate | Тензор | поплавок32 | ||
dst_host_same_srv_rate | Тензор | поплавок32 | ||
dst_host_serror_rate | Тензор | поплавок32 | ||
dst_host_srv_count | Тензор | int32 | ||
dst_host_srv_diff_host_rate | Тензор | поплавок32 | ||
dst_host_srv_rerror_rate | Тензор | поплавок32 | ||
dst_host_srv_serror_rate | Тензор | поплавок32 | ||
продолжительность | Тензор | int32 | ||
флаг | Метка класса | int64 | ||
горячий | Тензор | int32 | ||
is_guest_login | Тензор | логический | ||
is_hot_login | Тензор | логический | ||
этикетка | Метка класса | int64 | ||
земельные участки | Тензор | логический | ||
logged_in | Тензор | логический | ||
num_access_files | Тензор | int32 | ||
num_compromised | Тензор | int32 | ||
num_failed_logins | Тензор | int32 | ||
num_file_creations | Тензор | int32 | ||
num_outbound_cmds | Тензор | int32 | ||
num_root | Тензор | int32 | ||
num_shells | Тензор | int32 | ||
протокол_тип | Метка класса | int64 | ||
rerror_rate | Тензор | поплавок32 | ||
root_shell | Тензор | логический | ||
тот же_srv_rate | Тензор | поплавок32 | ||
serror_rate | Тензор | поплавок32 | ||
оказание услуг | Метка класса | int64 | ||
src_bytes | Тензор | int32 | ||
srv_count | Тензор | int32 | ||
srv_diff_host_rate | Тензор | поплавок32 | ||
srv_rerror_rate | Тензор | поплавок32 | ||
srv_serror_rate | Тензор | поплавок32 | ||
su_attempted | Тензор | int32 | ||
срочный | Тензор | int32 | ||
неправильно_фрагмент | Тензор | int32 |
Ключи под наблюдением (см . документ
as_supervised
):None
Рисунок ( tfds.show_examples ): не поддерживается.
Примеры ( tfds.as_dataframe ):
- Цитата :
@misc{Dua:2019 ,
author = "Dua, Dheeru and Graff, Casey",
year = 2017,
title = "{UCI} Machine Learning Repository",
url = "http://archive.ics.uci.edu/ml",
institution = "University of California, Irvine, School of Information and
Computer Sciences"
}