- Mô tả :
Đây là bộ dữ liệu được sử dụng cho Cuộc thi Công cụ Khai thác Dữ liệu và Khám phá Tri thức Quốc tế lần thứ ba, được tổ chức cùng với KDD-99 Hội nghị Quốc tế lần thứ năm về Khám phá Tri thức và Khai thác Dữ liệu. Nhiệm vụ của cuộc thi là xây dựng một bộ phát hiện xâm nhập mạng, một mô hình dự đoán có khả năng phân biệt giữa các kết nối 'xấu', được gọi là xâm nhập hoặc tấn công và các kết nối thông thường 'tốt'. Cơ sở dữ liệu này chứa một bộ dữ liệu tiêu chuẩn sẽ được kiểm tra, bao gồm nhiều loại xâm nhập được mô phỏng trong môi trường mạng quân sự.
Tài liệu bổ sung : Khám phá trên giấy tờ với mã
Trang chủ : https://kdd.ics.uci.edu/databases/kddcup99/kddcup99.html
Mã nguồn :
tfds.datasets.kddcup99.Builder
Phiên bản :
-
1.0.0
: Bản phát hành đầu tiên. -
1.0.1
(mặc định): Sửa lỗi phân tích cú pháp của các trường booleanland
,logged_in
,root_shell
,is_hot_login
vàis_guest_login
.
-
Kích thước tải xuống :
18.62 MiB
Kích thước tập dữ liệu :
5.25 GiB
Tự động lưu vào bộ nhớ cache ( tài liệu ): Không
Chia tách :
Tách ra | ví dụ |
---|---|
'test' | 311,029 |
'train' | 4.898.431 |
- Cấu trúc tính năng :
FeaturesDict({
'count': int32,
'diff_srv_rate': float32,
'dst_bytes': int32,
'dst_host_count': int32,
'dst_host_diff_srv_rate': float32,
'dst_host_rerror_rate': float32,
'dst_host_same_src_port_rate': float32,
'dst_host_same_srv_rate': float32,
'dst_host_serror_rate': float32,
'dst_host_srv_count': int32,
'dst_host_srv_diff_host_rate': float32,
'dst_host_srv_rerror_rate': float32,
'dst_host_srv_serror_rate': float32,
'duration': int32,
'flag': ClassLabel(shape=(), dtype=int64, num_classes=11),
'hot': int32,
'is_guest_login': bool,
'is_hot_login': bool,
'label': ClassLabel(shape=(), dtype=int64, num_classes=40),
'land': bool,
'logged_in': bool,
'num_access_files': int32,
'num_compromised': int32,
'num_failed_logins': int32,
'num_file_creations': int32,
'num_outbound_cmds': int32,
'num_root': int32,
'num_shells': int32,
'protocol_type': ClassLabel(shape=(), dtype=int64, num_classes=3),
'rerror_rate': float32,
'root_shell': bool,
'same_srv_rate': float32,
'serror_rate': float32,
'service': ClassLabel(shape=(), dtype=int64, num_classes=71),
'src_bytes': int32,
'srv_count': int32,
'srv_diff_host_rate': float32,
'srv_rerror_rate': float32,
'srv_serror_rate': float32,
'su_attempted': int32,
'urgent': int32,
'wrong_fragment': int32,
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Dtype | Sự miêu tả |
---|---|---|---|---|
Tính năngDict | ||||
đếm | tenxơ | int32 | ||
diff_srv_rate | tenxơ | phao32 | ||
dst_byte | tenxơ | int32 | ||
dst_host_count | tenxơ | int32 | ||
dst_host_diff_srv_rate | tenxơ | phao32 | ||
dst_host_rerror_rate | tenxơ | phao32 | ||
dst_host_same_src_port_rate | tenxơ | phao32 | ||
dst_host_same_srv_rate | tenxơ | phao32 | ||
dst_host_serror_rate | tenxơ | phao32 | ||
dst_host_srv_count | tenxơ | int32 | ||
dst_host_srv_diff_host_rate | tenxơ | phao32 | ||
dst_host_srv_rerror_rate | tenxơ | phao32 | ||
dst_host_srv_serror_rate | tenxơ | phao32 | ||
khoảng thời gian | tenxơ | int32 | ||
lá cờ | LớpNhãn | int64 | ||
nóng bức | tenxơ | int32 | ||
is_guest_login | tenxơ | bool | ||
is_hot_login | tenxơ | bool | ||
nhãn mác | LớpNhãn | int64 | ||
đất | tenxơ | bool | ||
đăng nhập | tenxơ | bool | ||
num_access_files | tenxơ | int32 | ||
num_compromised | tenxơ | int32 | ||
num_failed_logins | tenxơ | int32 | ||
num_file_creations | tenxơ | int32 | ||
num_outbound_cmds | tenxơ | int32 | ||
số_root | tenxơ | int32 | ||
num_shells | tenxơ | int32 | ||
giao thức_type | LớpNhãn | int64 | ||
rerror_rate | tenxơ | phao32 | ||
Vỏ rễ | tenxơ | bool | ||
same_srv_rate | tenxơ | phao32 | ||
serror_rate | tenxơ | phao32 | ||
dịch vụ | LớpNhãn | int64 | ||
src_byte | tenxơ | int32 | ||
srv_count | tenxơ | int32 | ||
srv_diff_host_rate | tenxơ | phao32 | ||
srv_rerror_rate | tenxơ | phao32 | ||
srv_serror_rate | tenxơ | phao32 | ||
su_attempted | tenxơ | int32 | ||
cấp bách | tenxơ | int32 | ||
sai_đoạn | tenxơ | int32 |
Các khóa được giám sát (Xem
as_supervised
doc ):None
Hình ( tfds.show_examples ): Không được hỗ trợ.
Ví dụ ( tfds.as_dataframe ):
- trích dẫn :
@misc{Dua:2019 ,
author = "Dua, Dheeru and Graff, Casey",
year = 2017,
title = "{UCI} Machine Learning Repository",
url = "http://archive.ics.uci.edu/ml",
institution = "University of California, Irvine, School of Information and
Computer Sciences"
}