kddcup99

  • Descripción :

Este es el conjunto de datos utilizado para la Tercera Competencia Internacional de Herramientas de Descubrimiento de Conocimiento y Minería de Datos, que se llevó a cabo junto con KDD-99, la Quinta Conferencia Internacional sobre Descubrimiento de Conocimiento y Minería de Datos. La tarea de la competencia era construir un detector de intrusiones en la red, un modelo predictivo capaz de distinguir entre conexiones 'malas', llamadas intrusiones o ataques, y conexiones normales 'buenas'. Esta base de datos contiene un conjunto estándar de datos para ser auditados, que incluye una amplia variedad de intrusiones simuladas en un entorno de red militar.

Separar Ejemplos
'test' 311,029
'train' 4,898,431
  • Estructura de características :
FeaturesDict({
    'count': int32,
    'diff_srv_rate': float32,
    'dst_bytes': int32,
    'dst_host_count': int32,
    'dst_host_diff_srv_rate': float32,
    'dst_host_rerror_rate': float32,
    'dst_host_same_src_port_rate': float32,
    'dst_host_same_srv_rate': float32,
    'dst_host_serror_rate': float32,
    'dst_host_srv_count': int32,
    'dst_host_srv_diff_host_rate': float32,
    'dst_host_srv_rerror_rate': float32,
    'dst_host_srv_serror_rate': float32,
    'duration': int32,
    'flag': ClassLabel(shape=(), dtype=int64, num_classes=11),
    'hot': int32,
    'is_guest_login': bool,
    'is_hot_login': bool,
    'label': ClassLabel(shape=(), dtype=int64, num_classes=40),
    'land': bool,
    'logged_in': bool,
    'num_access_files': int32,
    'num_compromised': int32,
    'num_failed_logins': int32,
    'num_file_creations': int32,
    'num_outbound_cmds': int32,
    'num_root': int32,
    'num_shells': int32,
    'protocol_type': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'rerror_rate': float32,
    'root_shell': bool,
    'same_srv_rate': float32,
    'serror_rate': float32,
    'service': ClassLabel(shape=(), dtype=int64, num_classes=71),
    'src_bytes': int32,
    'srv_count': int32,
    'srv_diff_host_rate': float32,
    'srv_rerror_rate': float32,
    'srv_serror_rate': float32,
    'su_attempted': int32,
    'urgent': int32,
    'wrong_fragment': int32,
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
contar Tensor int32
diff_srv_rate Tensor flotar32
dst_bytes Tensor int32
dst_host_count Tensor int32
dst_host_diff_srv_rate Tensor flotar32
dst_host_rerror_tasa Tensor flotar32
dst_host_mismo_src_port_rate Tensor flotar32
dst_host_mismo_tasa_srv Tensor flotar32
dst_host_serror_tasa Tensor flotar32
dst_host_srv_count Tensor int32
dst_host_srv_diff_tasa_host Tensor flotar32
dst_host_srv_rerror_tasa Tensor flotar32
dst_host_srv_serror_tasa Tensor flotar32
duración Tensor int32
bandera Etiqueta de clase int64
caliente Tensor int32
es_guest_login Tensor bool
is_hot_login Tensor bool
etiqueta Etiqueta de clase int64
tierra Tensor bool
conectado Tensor bool
num_acceso_archivos Tensor int32
num_comprometido Tensor int32
num_failed_logins Tensor int32
num_archivo_creaciones Tensor int32
num_outbound_cmds Tensor int32
núm_raíz Tensor int32
num_shells Tensor int32
tipo_de_protocolo Etiqueta de clase int64
tasa_de_error Tensor flotar32
root_shell Tensor bool
misma_tarifa_srv Tensor flotar32
tarifa_serror Tensor flotar32
Servicio Etiqueta de clase int64
src_bytes Tensor int32
srv_count Tensor int32
tasa_host_diff_srv Tensor flotar32
srv_rerror_tasa Tensor flotar32
tasa_srv_serror Tensor flotar32
su_intentado Tensor int32
urgente Tensor int32
fragmento_equivocado Tensor int32
  • Cita :
@misc{Dua:2019 ,
  author = "Dua, Dheeru and Graff, Casey",
  year = 2017,
  title = "{UCI} Machine Learning Repository",
  url = "http://archive.ics.uci.edu/ml",
  institution = "University of California, Irvine, School of Information and
Computer Sciences"
}