- Descrizione :
Questo è il set di dati utilizzato per la terza competizione internazionale sugli strumenti per la scoperta della conoscenza e il data mining, che si è tenuta in concomitanza con la KDD-99, la quinta conferenza internazionale sulla scoperta della conoscenza e il data mining. Il compito del concorso era costruire un rilevatore di intrusioni di rete, un modello predittivo in grado di distinguere tra connessioni "cattive", chiamate intrusioni o attacchi, e connessioni normali "buone". Questo database contiene un set standard di dati da controllare, che include un'ampia varietà di intrusioni simulate in un ambiente di rete militare.
Documentazione aggiuntiva : Esplora documenti con codice
Pagina iniziale : https://kdd.ics.uci.edu/databases/kddcup99/kddcup99.html
Codice sorgente :
tfds.datasets.kddcup99.Builder
Versioni :
-
1.0.0
: Versione iniziale. -
1.0.1
(impostazione predefinita): corregge l'analisi dei campi booleaniland
,logged_in
,root_shell
,is_hot_login
eis_guest_login
.
-
Dimensione del download :
18.62 MiB
Dimensione del set di dati :
5.25 GiB
Cache automatica ( documentazione ): No
Divisioni :
Diviso | Esempi |
---|---|
'test' | 311.029 |
'train' | 4.898.431 |
- Struttura delle caratteristiche :
FeaturesDict({
'count': int32,
'diff_srv_rate': float32,
'dst_bytes': int32,
'dst_host_count': int32,
'dst_host_diff_srv_rate': float32,
'dst_host_rerror_rate': float32,
'dst_host_same_src_port_rate': float32,
'dst_host_same_srv_rate': float32,
'dst_host_serror_rate': float32,
'dst_host_srv_count': int32,
'dst_host_srv_diff_host_rate': float32,
'dst_host_srv_rerror_rate': float32,
'dst_host_srv_serror_rate': float32,
'duration': int32,
'flag': ClassLabel(shape=(), dtype=int64, num_classes=11),
'hot': int32,
'is_guest_login': bool,
'is_hot_login': bool,
'label': ClassLabel(shape=(), dtype=int64, num_classes=40),
'land': bool,
'logged_in': bool,
'num_access_files': int32,
'num_compromised': int32,
'num_failed_logins': int32,
'num_file_creations': int32,
'num_outbound_cmds': int32,
'num_root': int32,
'num_shells': int32,
'protocol_type': ClassLabel(shape=(), dtype=int64, num_classes=3),
'rerror_rate': float32,
'root_shell': bool,
'same_srv_rate': float32,
'serror_rate': float32,
'service': ClassLabel(shape=(), dtype=int64, num_classes=71),
'src_bytes': int32,
'srv_count': int32,
'srv_diff_host_rate': float32,
'srv_rerror_rate': float32,
'srv_serror_rate': float32,
'su_attempted': int32,
'urgent': int32,
'wrong_fragment': int32,
})
- Documentazione delle funzionalità :
Caratteristica | Classe | Forma | Tipo D | Descrizione |
---|---|---|---|---|
CaratteristicheDict | ||||
contare | Tensore | int32 | ||
diff_srv_rate | Tensore | galleggiante32 | ||
dst_byte | Tensore | int32 | ||
dst_host_count | Tensore | int32 | ||
dst_host_diff_srv_rate | Tensore | galleggiante32 | ||
dst_host_rerror_rate | Tensore | galleggiante32 | ||
dst_host_same_src_port_rate | Tensore | galleggiante32 | ||
dst_host_same_srv_rate | Tensore | galleggiante32 | ||
dst_host_serror_rate | Tensore | galleggiante32 | ||
dst_host_srv_count | Tensore | int32 | ||
dst_host_srv_diff_host_rate | Tensore | galleggiante32 | ||
dst_host_srv_rerror_rate | Tensore | galleggiante32 | ||
dst_host_srv_serror_rate | Tensore | galleggiante32 | ||
durata | Tensore | int32 | ||
bandiera | ClassLabel | int64 | ||
caldo | Tensore | int32 | ||
is_guest_login | Tensore | bool | ||
is_hot_login | Tensore | bool | ||
etichetta | ClassLabel | int64 | ||
terra | Tensore | bool | ||
connesso | Tensore | bool | ||
num_access_files | Tensore | int32 | ||
num_compromesso | Tensore | int32 | ||
num_login_falliti | Tensore | int32 | ||
num_file_creazioni | Tensore | int32 | ||
num_outbound_cmds | Tensore | int32 | ||
num_radice | Tensore | int32 | ||
num_shell | Tensore | int32 | ||
protocollo_tipo | ClassLabel | int64 | ||
rerror_rate | Tensore | galleggiante32 | ||
root_shell | Tensore | bool | ||
same_srv_rate | Tensore | galleggiante32 | ||
tasso_serror | Tensore | galleggiante32 | ||
servizio | ClassLabel | int64 | ||
src_byte | Tensore | int32 | ||
srv_count | Tensore | int32 | ||
srv_diff_host_rate | Tensore | galleggiante32 | ||
srv_rerror_rate | Tensore | galleggiante32 | ||
srv_serror_rate | Tensore | galleggiante32 | ||
su_tentato | Tensore | int32 | ||
urgente | Tensore | int32 | ||
frammento_errato | Tensore | int32 |
Chiavi supervisionate (Vedi
as_supervised
doc ):None
Figura ( tfds.show_examples ): non supportato.
Esempi ( tfds.as_dataframe ):
- Citazione :
@misc{Dua:2019 ,
author = "Dua, Dheeru and Graff, Casey",
year = 2017,
title = "{UCI} Machine Learning Repository",
url = "http://archive.ics.uci.edu/ml",
institution = "University of California, Irvine, School of Information and
Computer Sciences"
}