- विवरण :
यह तीसरे अंतर्राष्ट्रीय ज्ञान खोज और डेटा खनन उपकरण प्रतियोगिता के लिए उपयोग किया जाने वाला डेटा सेट है, जो ज्ञान खोज और डेटा खनन पर KDD-99 पांचवें अंतर्राष्ट्रीय सम्मेलन के संयोजन में आयोजित किया गया था। प्रतियोगिता का कार्य एक नेटवर्क घुसपैठ डिटेक्टर का निर्माण करना था, जो 'खराब' कनेक्शन, जिसे घुसपैठ या हमले कहा जाता है, और 'अच्छे' सामान्य कनेक्शन के बीच भेद करने में सक्षम एक भविष्य कहनेवाला मॉडल है। इस डेटाबेस में ऑडिट किए जाने वाले डेटा का एक मानक सेट होता है, जिसमें एक सैन्य नेटवर्क वातावरण में सिम्युलेटेड घुसपैठ की एक विस्तृत विविधता शामिल होती है।
होमपेज : https://kdd.ics.uci.edu/databases/kddcup99/kddcup99.html
स्रोत कोड :
tfds.datasets.kddcup99.Builder
संस्करण :
-
1.0.0
: प्रारंभिक रिलीज। -
1.0.1
(डिफ़ॉल्ट): बूलियन फ़ील्डland
,logged_in
,root_shell
,is_hot_login
औरis_guest_login
की पार्सिंग ठीक करता है।
-
डाउनलोड आकार :
18.62 MiB
डेटासेट का आकार :
5.25 GiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'test' | 311,029 |
'train' | 4,898,431 |
- फ़ीचर संरचना :
FeaturesDict({
'count': int32,
'diff_srv_rate': float32,
'dst_bytes': int32,
'dst_host_count': int32,
'dst_host_diff_srv_rate': float32,
'dst_host_rerror_rate': float32,
'dst_host_same_src_port_rate': float32,
'dst_host_same_srv_rate': float32,
'dst_host_serror_rate': float32,
'dst_host_srv_count': int32,
'dst_host_srv_diff_host_rate': float32,
'dst_host_srv_rerror_rate': float32,
'dst_host_srv_serror_rate': float32,
'duration': int32,
'flag': ClassLabel(shape=(), dtype=int64, num_classes=11),
'hot': int32,
'is_guest_login': bool,
'is_hot_login': bool,
'label': ClassLabel(shape=(), dtype=int64, num_classes=40),
'land': bool,
'logged_in': bool,
'num_access_files': int32,
'num_compromised': int32,
'num_failed_logins': int32,
'num_file_creations': int32,
'num_outbound_cmds': int32,
'num_root': int32,
'num_shells': int32,
'protocol_type': ClassLabel(shape=(), dtype=int64, num_classes=3),
'rerror_rate': float32,
'root_shell': bool,
'same_srv_rate': float32,
'serror_rate': float32,
'service': ClassLabel(shape=(), dtype=int64, num_classes=71),
'src_bytes': int32,
'srv_count': int32,
'srv_diff_host_rate': float32,
'srv_rerror_rate': float32,
'srv_serror_rate': float32,
'su_attempted': int32,
'urgent': int32,
'wrong_fragment': int32,
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
विशेषताएं डिक्ट | ||||
गिनती करना | टेन्सर | int32 | ||
diff_srv_rate | टेन्सर | फ्लोट32 | ||
dst_बाइट्स | टेन्सर | int32 | ||
dst_host_count | टेन्सर | int32 | ||
dst_host_diff_srv_rate | टेन्सर | फ्लोट32 | ||
dst_host_rerror_rate | टेन्सर | फ्लोट32 | ||
dst_host_same_src_port_rate | टेन्सर | फ्लोट32 | ||
dst_host_same_srv_rate | टेन्सर | फ्लोट32 | ||
dst_host_serror_rate | टेन्सर | फ्लोट32 | ||
dst_host_srv_count | टेन्सर | int32 | ||
dst_host_srv_diff_host_rate | टेन्सर | फ्लोट32 | ||
dst_host_srv_rerror_rate | टेन्सर | फ्लोट32 | ||
dst_host_srv_serror_rate | टेन्सर | फ्लोट32 | ||
समयांतराल | टेन्सर | int32 | ||
झंडा | क्लासलेबल | int64 | ||
गरम | टेन्सर | int32 | ||
is_guest_login | टेन्सर | बूल | ||
is_hot_login | टेन्सर | बूल | ||
लेबल | क्लासलेबल | int64 | ||
भूमि | टेन्सर | बूल | ||
में लॉग इन | टेन्सर | बूल | ||
num_access_files | टेन्सर | int32 | ||
num_compromised | टेन्सर | int32 | ||
num_failed_logins | टेन्सर | int32 | ||
num_file_creations | टेन्सर | int32 | ||
num_outbound_cmds | टेन्सर | int32 | ||
num_root | टेन्सर | int32 | ||
num_shells | टेन्सर | int32 | ||
प्रोटोकॉल_प्रकार | क्लासलेबल | int64 | ||
rerror_rate | टेन्सर | फ्लोट32 | ||
root_shell | टेन्सर | बूल | ||
समान_एसआरवी_दर | टेन्सर | फ्लोट32 | ||
serror_rate | टेन्सर | फ्लोट32 | ||
सेवा | क्लासलेबल | int64 | ||
src_बाइट्स | टेन्सर | int32 | ||
srv_count | टेन्सर | int32 | ||
srv_diff_host_rate | टेन्सर | फ्लोट32 | ||
srv_rerror_rate | टेन्सर | फ्लोट32 | ||
srv_serror_rate | टेन्सर | फ्लोट32 | ||
su_कोशिश की | टेन्सर | int32 | ||
अति आवश्यक | टेन्सर | int32 | ||
गलत_टुकड़ा | टेन्सर | int32 |
पर्यवेक्षित कुंजियाँ (
as_supervised
doc देखें):None
चित्र ( tfds.show_examples ): समर्थित नहीं है।
उदाहरण ( tfds.as_dataframe ):
- उद्धरण :
@misc{Dua:2019 ,
author = "Dua, Dheeru and Graff, Casey",
year = 2017,
title = "{UCI} Machine Learning Repository",
url = "http://archive.ics.uci.edu/ml",
institution = "University of California, Irvine, School of Information and
Computer Sciences"
}