- الوصف :
هذه هي مجموعة البيانات المستخدمة في المسابقة الدولية الثالثة لاكتشاف المعرفة وأدوات التنقيب عن البيانات ، والتي عقدت بالتزامن مع KDD-99 المؤتمر الدولي الخامس لاكتشاف المعرفة واستخراج البيانات. كانت مهمة المنافسة هي بناء كاشف اقتحام الشبكة ، وهو نموذج تنبؤي قادر على التمييز بين الاتصالات "السيئة" ، التي تسمى التدخلات أو الهجمات ، والاتصالات العادية "الجيدة". تحتوي قاعدة البيانات هذه على مجموعة قياسية من البيانات المراد تدقيقها ، والتي تتضمن مجموعة متنوعة من عمليات الاقتحام التي تمت محاكاتها في بيئة شبكة عسكرية.
وثائق إضافية : استكشف في الأوراق باستخدام الرمز
الصفحة الرئيسية : https://kdd.ics.uci.edu/databases/kddcup99/kddcup99.html
كود المصدر :
tfds.datasets.kddcup99.Builder
إصدارات :
-
1.0.0
: الإصدار الأولي. -
1.0.1
(افتراضي): إصلاحات تحليل الحقول المنطقيةland
وlogged_in
وroot_shell
وis_hot_login
وis_guest_login
.
-
حجم التحميل :
18.62 MiB
حجم مجموعة البيانات :
5.25 GiB
التخزين المؤقت التلقائي ( التوثيق ): لا
الانقسامات :
انشق، مزق | أمثلة |
---|---|
'test' | 311029 |
'train' | 4،898،431 |
- هيكل الميزة :
FeaturesDict({
'count': int32,
'diff_srv_rate': float32,
'dst_bytes': int32,
'dst_host_count': int32,
'dst_host_diff_srv_rate': float32,
'dst_host_rerror_rate': float32,
'dst_host_same_src_port_rate': float32,
'dst_host_same_srv_rate': float32,
'dst_host_serror_rate': float32,
'dst_host_srv_count': int32,
'dst_host_srv_diff_host_rate': float32,
'dst_host_srv_rerror_rate': float32,
'dst_host_srv_serror_rate': float32,
'duration': int32,
'flag': ClassLabel(shape=(), dtype=int64, num_classes=11),
'hot': int32,
'is_guest_login': bool,
'is_hot_login': bool,
'label': ClassLabel(shape=(), dtype=int64, num_classes=40),
'land': bool,
'logged_in': bool,
'num_access_files': int32,
'num_compromised': int32,
'num_failed_logins': int32,
'num_file_creations': int32,
'num_outbound_cmds': int32,
'num_root': int32,
'num_shells': int32,
'protocol_type': ClassLabel(shape=(), dtype=int64, num_classes=3),
'rerror_rate': float32,
'root_shell': bool,
'same_srv_rate': float32,
'serror_rate': float32,
'service': ClassLabel(shape=(), dtype=int64, num_classes=71),
'src_bytes': int32,
'srv_count': int32,
'srv_diff_host_rate': float32,
'srv_rerror_rate': float32,
'srv_serror_rate': float32,
'su_attempted': int32,
'urgent': int32,
'wrong_fragment': int32,
})
- وثائق الميزة :
ميزة | فصل | شكل | نوع | وصف |
---|---|---|---|---|
الميزات | ||||
عدد | موتر | int32 | ||
diff_srv_rate | موتر | تعويم 32 | ||
dst_bytes | موتر | int32 | ||
dst_host_count | موتر | int32 | ||
dst_host_diff_srv_rate | موتر | تعويم 32 | ||
dst_host_rerror_rate | موتر | تعويم 32 | ||
dst_host_same_src_port_rate | موتر | تعويم 32 | ||
dst_host_same_srv_rate | موتر | تعويم 32 | ||
dst_host_serror_rate | موتر | تعويم 32 | ||
dst_host_srv_count | موتر | int32 | ||
dst_host_srv_diff_host_rate | موتر | تعويم 32 | ||
dst_host_srv_rerror_rate | موتر | تعويم 32 | ||
dst_host_srv_serror_rate | موتر | تعويم 32 | ||
المدة الزمنية | موتر | int32 | ||
علَم | ClassLabel | int64 | ||
الحار | موتر | int32 | ||
is_guest_login | موتر | منطقي | ||
is_hot_login | موتر | منطقي | ||
ضع الكلمة المناسبة | ClassLabel | int64 | ||
الأرض | موتر | منطقي | ||
logged_in | موتر | منطقي | ||
عدد_الوصول_الملفات | موتر | int32 | ||
عدد_المسومة | موتر | int32 | ||
num_failed_logins | موتر | int32 | ||
عدد_الملف_الإبداعات | موتر | int32 | ||
عدد_السماء_المتجهة | موتر | int32 | ||
عدد_الجذور | موتر | int32 | ||
عدد_القذائف | موتر | int32 | ||
نوع البروتوكول | ClassLabel | int64 | ||
معدل الخطأ | موتر | تعويم 32 | ||
هيكل الجذر | موتر | منطقي | ||
same_srv_rate | موتر | تعويم 32 | ||
معدل الخطأ | موتر | تعويم 32 | ||
الخدمات | ClassLabel | int64 | ||
src_bytes | موتر | int32 | ||
srv_count | موتر | int32 | ||
srv_diff_host_rate | موتر | تعويم 32 | ||
srv_rerror_rate | موتر | تعويم 32 | ||
srv_serror_rate | موتر | تعويم 32 | ||
محاولة | موتر | int32 | ||
العاجلة | موتر | int32 | ||
جزء خاطئ | موتر | int32 |
المفاتيح الخاضعة للإشراف (انظر المستند
as_supervised
):None
الشكل ( tfds.show_examples ): غير مدعوم.
أمثلة ( tfds.as_dataframe ):
- الاقتباس :
@misc{Dua:2019 ,
author = "Dua, Dheeru and Graff, Casey",
year = 2017,
title = "{UCI} Machine Learning Repository",
url = "http://archive.ics.uci.edu/ml",
institution = "University of California, Irvine, School of Information and
Computer Sciences"
}