- 설명 :
KDD-99 The Fifth International Conference on Knowledge Discovery and Data Mining과 함께 개최된 The Third International Knowledge Discovery and Data Mining Tools Competition에 사용된 데이터 세트입니다. 경쟁 작업은 침입 또는 공격이라고 하는 '나쁜' 연결과 '좋은' 정상 연결을 구별할 수 있는 예측 모델인 네트워크 침입 탐지기를 구축하는 것이 었습니다. 이 데이터베이스에는 감사할 표준 데이터 세트가 포함되어 있으며 여기에는 군사 네트워크 환경에서 시뮬레이션된 다양한 침입이 포함됩니다.
홈페이지 : https://kdd.ics.uci.edu/databases/kddcup99/kddcup99.html
소스 코드 :
tfds.datasets.kddcup99.Builder
버전 :
-
1.0.0
: 최초 릴리스. -
1.0.1
(기본값): 부울 필드land
,root_shell
logged_in
is_hot_login
및is_guest_login
구문 분석을 수정합니다.
-
다운로드 크기 :
18.62 MiB
데이터세트 크기 :
5.25 GiB
자동 캐시 ( 문서 ): 아니요
분할 :
나뉘다 | 예 |
---|---|
'test' | 311,029 |
'train' | 4,898,431 |
- 기능 구조 :
FeaturesDict({
'count': int32,
'diff_srv_rate': float32,
'dst_bytes': int32,
'dst_host_count': int32,
'dst_host_diff_srv_rate': float32,
'dst_host_rerror_rate': float32,
'dst_host_same_src_port_rate': float32,
'dst_host_same_srv_rate': float32,
'dst_host_serror_rate': float32,
'dst_host_srv_count': int32,
'dst_host_srv_diff_host_rate': float32,
'dst_host_srv_rerror_rate': float32,
'dst_host_srv_serror_rate': float32,
'duration': int32,
'flag': ClassLabel(shape=(), dtype=int64, num_classes=11),
'hot': int32,
'is_guest_login': bool,
'is_hot_login': bool,
'label': ClassLabel(shape=(), dtype=int64, num_classes=40),
'land': bool,
'logged_in': bool,
'num_access_files': int32,
'num_compromised': int32,
'num_failed_logins': int32,
'num_file_creations': int32,
'num_outbound_cmds': int32,
'num_root': int32,
'num_shells': int32,
'protocol_type': ClassLabel(shape=(), dtype=int64, num_classes=3),
'rerror_rate': float32,
'root_shell': bool,
'same_srv_rate': float32,
'serror_rate': float32,
'service': ClassLabel(shape=(), dtype=int64, num_classes=71),
'src_bytes': int32,
'srv_count': int32,
'srv_diff_host_rate': float32,
'srv_rerror_rate': float32,
'srv_serror_rate': float32,
'su_attempted': int32,
'urgent': int32,
'wrong_fragment': int32,
})
- 기능 문서 :
특징 | 수업 | 모양 | D타입 | 설명 |
---|---|---|---|---|
풍모Dict | ||||
세다 | 텐서 | int32 | ||
diff_srv_rate | 텐서 | float32 | ||
dst_bytes | 텐서 | int32 | ||
dst_host_count | 텐서 | int32 | ||
dst_host_diff_srv_rate | 텐서 | float32 | ||
dst_host_rerror_rate | 텐서 | float32 | ||
dst_host_same_src_port_rate | 텐서 | float32 | ||
dst_host_same_srv_rate | 텐서 | float32 | ||
dst_host_serror_rate | 텐서 | float32 | ||
dst_host_srv_count | 텐서 | int32 | ||
dst_host_srv_diff_host_rate | 텐서 | float32 | ||
dst_host_srv_rerror_rate | 텐서 | float32 | ||
dst_host_srv_serror_rate | 텐서 | float32 | ||
지속 | 텐서 | int32 | ||
깃발 | 클래스 레이블 | int64 | ||
더운 | 텐서 | int32 | ||
is_guest_login | 텐서 | 부울 | ||
is_hot_login | 텐서 | 부울 | ||
상표 | 클래스 레이블 | int64 | ||
땅 | 텐서 | 부울 | ||
로그인 | 텐서 | 부울 | ||
num_access_files | 텐서 | int32 | ||
num_compromised | 텐서 | int32 | ||
num_failed_logins | 텐서 | int32 | ||
num_file_creations | 텐서 | int32 | ||
num_outbound_cmds | 텐서 | int32 | ||
num_root | 텐서 | int32 | ||
num_shells | 텐서 | int32 | ||
protocol_type | 클래스 레이블 | int64 | ||
오류율 | 텐서 | float32 | ||
root_shell | 텐서 | 부울 | ||
same_srv_rate | 텐서 | float32 | ||
serror_rate | 텐서 | float32 | ||
서비스 | 클래스 레이블 | int64 | ||
src_bytes | 텐서 | int32 | ||
srv_count | 텐서 | int32 | ||
srv_diff_host_rate | 텐서 | float32 | ||
srv_rerror_rate | 텐서 | float32 | ||
srv_serror_rate | 텐서 | float32 | ||
su_attempted | 텐서 | int32 | ||
긴급한 | 텐서 | int32 | ||
wrong_fragment | 텐서 | int32 |
감독된 키 (
as_supervised
문서 참조):None
그림 ( tfds.show_examples ): 지원되지 않습니다.
예 ( tfds.as_dataframe ):
- 인용 :
@misc{Dua:2019 ,
author = "Dua, Dheeru and Graff, Casey",
year = 2017,
title = "{UCI} Machine Learning Repository",
url = "http://archive.ics.uci.edu/ml",
institution = "University of California, Irvine, School of Information and
Computer Sciences"
}