- Descripción :
Este es el conjunto de datos utilizado para la Tercera Competencia Internacional de Herramientas de Descubrimiento de Conocimiento y Minería de Datos, que se llevó a cabo junto con KDD-99, la Quinta Conferencia Internacional sobre Descubrimiento de Conocimiento y Minería de Datos. La tarea de la competencia era construir un detector de intrusiones en la red, un modelo predictivo capaz de distinguir entre conexiones 'malas', llamadas intrusiones o ataques, y conexiones normales 'buenas'. Esta base de datos contiene un conjunto estándar de datos para ser auditados, que incluye una amplia variedad de intrusiones simuladas en un entorno de red militar.
Documentación adicional : Explore en Papers With Code
Página de inicio: https://kdd.ics.uci.edu/databases/kddcup99/kddcup99.html
Código fuente :
tfds.datasets.kddcup99.Builder
Versiones :
-
1.0.0
: Versión inicial. -
1.0.1
(predeterminado): corrige el análisis de los campos booleanosland
,logged_in
,root_shell
,is_hot_login
yis_guest_login
.
-
Tamaño de la descarga :
18.62 MiB
Tamaño del conjunto de datos :
5.25 GiB
Almacenamiento automático en caché ( documentación ): No
Divisiones :
Separar | Ejemplos |
---|---|
'test' | 311,029 |
'train' | 4,898,431 |
- Estructura de características :
FeaturesDict({
'count': int32,
'diff_srv_rate': float32,
'dst_bytes': int32,
'dst_host_count': int32,
'dst_host_diff_srv_rate': float32,
'dst_host_rerror_rate': float32,
'dst_host_same_src_port_rate': float32,
'dst_host_same_srv_rate': float32,
'dst_host_serror_rate': float32,
'dst_host_srv_count': int32,
'dst_host_srv_diff_host_rate': float32,
'dst_host_srv_rerror_rate': float32,
'dst_host_srv_serror_rate': float32,
'duration': int32,
'flag': ClassLabel(shape=(), dtype=int64, num_classes=11),
'hot': int32,
'is_guest_login': bool,
'is_hot_login': bool,
'label': ClassLabel(shape=(), dtype=int64, num_classes=40),
'land': bool,
'logged_in': bool,
'num_access_files': int32,
'num_compromised': int32,
'num_failed_logins': int32,
'num_file_creations': int32,
'num_outbound_cmds': int32,
'num_root': int32,
'num_shells': int32,
'protocol_type': ClassLabel(shape=(), dtype=int64, num_classes=3),
'rerror_rate': float32,
'root_shell': bool,
'same_srv_rate': float32,
'serror_rate': float32,
'service': ClassLabel(shape=(), dtype=int64, num_classes=71),
'src_bytes': int32,
'srv_count': int32,
'srv_diff_host_rate': float32,
'srv_rerror_rate': float32,
'srv_serror_rate': float32,
'su_attempted': int32,
'urgent': int32,
'wrong_fragment': int32,
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
contar | Tensor | int32 | ||
diff_srv_rate | Tensor | flotar32 | ||
dst_bytes | Tensor | int32 | ||
dst_host_count | Tensor | int32 | ||
dst_host_diff_srv_rate | Tensor | flotar32 | ||
dst_host_rerror_tasa | Tensor | flotar32 | ||
dst_host_mismo_src_port_rate | Tensor | flotar32 | ||
dst_host_mismo_tasa_srv | Tensor | flotar32 | ||
dst_host_serror_tasa | Tensor | flotar32 | ||
dst_host_srv_count | Tensor | int32 | ||
dst_host_srv_diff_tasa_host | Tensor | flotar32 | ||
dst_host_srv_rerror_tasa | Tensor | flotar32 | ||
dst_host_srv_serror_tasa | Tensor | flotar32 | ||
duración | Tensor | int32 | ||
bandera | Etiqueta de clase | int64 | ||
caliente | Tensor | int32 | ||
es_guest_login | Tensor | bool | ||
is_hot_login | Tensor | bool | ||
etiqueta | Etiqueta de clase | int64 | ||
tierra | Tensor | bool | ||
conectado | Tensor | bool | ||
num_acceso_archivos | Tensor | int32 | ||
num_comprometido | Tensor | int32 | ||
num_failed_logins | Tensor | int32 | ||
num_archivo_creaciones | Tensor | int32 | ||
num_outbound_cmds | Tensor | int32 | ||
núm_raíz | Tensor | int32 | ||
num_shells | Tensor | int32 | ||
tipo_de_protocolo | Etiqueta de clase | int64 | ||
tasa_de_error | Tensor | flotar32 | ||
root_shell | Tensor | bool | ||
misma_tarifa_srv | Tensor | flotar32 | ||
tarifa_serror | Tensor | flotar32 | ||
Servicio | Etiqueta de clase | int64 | ||
src_bytes | Tensor | int32 | ||
srv_count | Tensor | int32 | ||
tasa_host_diff_srv | Tensor | flotar32 | ||
srv_rerror_tasa | Tensor | flotar32 | ||
tasa_srv_serror | Tensor | flotar32 | ||
su_intentado | Tensor | int32 | ||
urgente | Tensor | int32 | ||
fragmento_equivocado | Tensor | int32 |
Claves supervisadas (Ver
as_supervised
doc ):None
Figura ( tfds.show_examples ): no compatible.
Ejemplos ( tfds.as_dataframe ):
- Cita :
@misc{Dua:2019 ,
author = "Dua, Dheeru and Graff, Casey",
year = 2017,
title = "{UCI} Machine Learning Repository",
url = "http://archive.ics.uci.edu/ml",
institution = "University of California, Irvine, School of Information and
Computer Sciences"
}