kddcup99

  • Descrizione :

Questo è il set di dati utilizzato per la terza competizione internazionale sugli strumenti per la scoperta della conoscenza e il data mining, che si è tenuta in concomitanza con la KDD-99, la quinta conferenza internazionale sulla scoperta della conoscenza e il data mining. Il compito del concorso era costruire un rilevatore di intrusioni di rete, un modello predittivo in grado di distinguere tra connessioni "cattive", chiamate intrusioni o attacchi, e connessioni normali "buone". Questo database contiene un set standard di dati da controllare, che include un'ampia varietà di intrusioni simulate in un ambiente di rete militare.

Diviso Esempi
'test' 311.029
'train' 4.898.431
  • Struttura delle caratteristiche :
FeaturesDict({
    'count': int32,
    'diff_srv_rate': float32,
    'dst_bytes': int32,
    'dst_host_count': int32,
    'dst_host_diff_srv_rate': float32,
    'dst_host_rerror_rate': float32,
    'dst_host_same_src_port_rate': float32,
    'dst_host_same_srv_rate': float32,
    'dst_host_serror_rate': float32,
    'dst_host_srv_count': int32,
    'dst_host_srv_diff_host_rate': float32,
    'dst_host_srv_rerror_rate': float32,
    'dst_host_srv_serror_rate': float32,
    'duration': int32,
    'flag': ClassLabel(shape=(), dtype=int64, num_classes=11),
    'hot': int32,
    'is_guest_login': bool,
    'is_hot_login': bool,
    'label': ClassLabel(shape=(), dtype=int64, num_classes=40),
    'land': bool,
    'logged_in': bool,
    'num_access_files': int32,
    'num_compromised': int32,
    'num_failed_logins': int32,
    'num_file_creations': int32,
    'num_outbound_cmds': int32,
    'num_root': int32,
    'num_shells': int32,
    'protocol_type': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'rerror_rate': float32,
    'root_shell': bool,
    'same_srv_rate': float32,
    'serror_rate': float32,
    'service': ClassLabel(shape=(), dtype=int64, num_classes=71),
    'src_bytes': int32,
    'srv_count': int32,
    'srv_diff_host_rate': float32,
    'srv_rerror_rate': float32,
    'srv_serror_rate': float32,
    'su_attempted': int32,
    'urgent': int32,
    'wrong_fragment': int32,
})
  • Documentazione delle funzionalità :
Caratteristica Classe Forma Tipo D Descrizione
CaratteristicheDict
contare Tensore int32
diff_srv_rate Tensore galleggiante32
dst_byte Tensore int32
dst_host_count Tensore int32
dst_host_diff_srv_rate Tensore galleggiante32
dst_host_rerror_rate Tensore galleggiante32
dst_host_same_src_port_rate Tensore galleggiante32
dst_host_same_srv_rate Tensore galleggiante32
dst_host_serror_rate Tensore galleggiante32
dst_host_srv_count Tensore int32
dst_host_srv_diff_host_rate Tensore galleggiante32
dst_host_srv_rerror_rate Tensore galleggiante32
dst_host_srv_serror_rate Tensore galleggiante32
durata Tensore int32
bandiera ClassLabel int64
caldo Tensore int32
is_guest_login Tensore bool
is_hot_login Tensore bool
etichetta ClassLabel int64
terra Tensore bool
connesso Tensore bool
num_access_files Tensore int32
num_compromesso Tensore int32
num_login_falliti Tensore int32
num_file_creazioni Tensore int32
num_outbound_cmds Tensore int32
num_radice Tensore int32
num_shell Tensore int32
protocollo_tipo ClassLabel int64
rerror_rate Tensore galleggiante32
root_shell Tensore bool
same_srv_rate Tensore galleggiante32
tasso_serror Tensore galleggiante32
servizio ClassLabel int64
src_byte Tensore int32
srv_count Tensore int32
srv_diff_host_rate Tensore galleggiante32
srv_rerror_rate Tensore galleggiante32
srv_serror_rate Tensore galleggiante32
su_tentato Tensore int32
urgente Tensore int32
frammento_errato Tensore int32
  • Citazione :
@misc{Dua:2019 ,
  author = "Dua, Dheeru and Graff, Casey",
  year = 2017,
  title = "{UCI} Machine Learning Repository",
  url = "http://archive.ics.uci.edu/ml",
  institution = "University of California, Irvine, School of Information and
Computer Sciences"
}