- বর্ণনা :
এটি তৃতীয় আন্তর্জাতিক জ্ঞান আবিষ্কার এবং ডেটা মাইনিং সরঞ্জাম প্রতিযোগিতার জন্য ব্যবহৃত ডেটা সেট, যা KDD-99 জ্ঞান আবিষ্কার এবং ডেটা মাইনিং-এর পঞ্চম আন্তর্জাতিক সম্মেলনের সাথে একযোগে অনুষ্ঠিত হয়েছিল। প্রতিযোগিতার কাজটি ছিল একটি নেটওয়ার্ক ইনট্রুশন ডিটেক্টর তৈরি করা, একটি ভবিষ্যদ্বাণীমূলক মডেল যা 'খারাপ' সংযোগগুলির মধ্যে পার্থক্য করতে সক্ষম, যাকে অনুপ্রবেশ বা আক্রমণ বলা হয় এবং 'ভাল' স্বাভাবিক সংযোগ। এই ডাটাবেসে নিরীক্ষা করার জন্য ডেটার একটি মানক সেট রয়েছে, যার মধ্যে সামরিক নেটওয়ার্ক পরিবেশে অনুকরণ করা বিভিন্ন ধরণের অনুপ্রবেশ অন্তর্ভুক্ত রয়েছে।
হোমপেজ : https://kdd.ics.uci.edu/databases/kddcup99/kddcup99.html
সোর্স কোড :
tfds.datasets.kddcup99.Builder
সংস্করণ :
-
1.0.0
: প্রাথমিক প্রকাশ। -
1.0.1
(ডিফল্ট): বুলিয়ান ফিল্ডland
,logged_in
,root_shell
,is_hot_login
এবংis_guest_login
এর পার্সিং সংশোধন করে।
-
ডাউনলোড আকার :
18.62 MiB
ডেটাসেটের আকার :
5.25 GiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'test' | 311,029 |
'train' | ৪,৮৯৮,৪৩১ |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'count': int32,
'diff_srv_rate': float32,
'dst_bytes': int32,
'dst_host_count': int32,
'dst_host_diff_srv_rate': float32,
'dst_host_rerror_rate': float32,
'dst_host_same_src_port_rate': float32,
'dst_host_same_srv_rate': float32,
'dst_host_serror_rate': float32,
'dst_host_srv_count': int32,
'dst_host_srv_diff_host_rate': float32,
'dst_host_srv_rerror_rate': float32,
'dst_host_srv_serror_rate': float32,
'duration': int32,
'flag': ClassLabel(shape=(), dtype=int64, num_classes=11),
'hot': int32,
'is_guest_login': bool,
'is_hot_login': bool,
'label': ClassLabel(shape=(), dtype=int64, num_classes=40),
'land': bool,
'logged_in': bool,
'num_access_files': int32,
'num_compromised': int32,
'num_failed_logins': int32,
'num_file_creations': int32,
'num_outbound_cmds': int32,
'num_root': int32,
'num_shells': int32,
'protocol_type': ClassLabel(shape=(), dtype=int64, num_classes=3),
'rerror_rate': float32,
'root_shell': bool,
'same_srv_rate': float32,
'serror_rate': float32,
'service': ClassLabel(shape=(), dtype=int64, num_classes=71),
'src_bytes': int32,
'srv_count': int32,
'srv_diff_host_rate': float32,
'srv_rerror_rate': float32,
'srv_serror_rate': float32,
'su_attempted': int32,
'urgent': int32,
'wrong_fragment': int32,
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
গণনা | টেনসর | int32 | ||
diff_srv_rate | টেনসর | float32 | ||
dst_bytes | টেনসর | int32 | ||
dst_host_count | টেনসর | int32 | ||
dst_host_diff_srv_rate | টেনসর | float32 | ||
dst_host_rerror_rate | টেনসর | float32 | ||
dst_host_same_src_port_rate | টেনসর | float32 | ||
dst_host_same_srv_রেট | টেনসর | float32 | ||
dst_host_serror_rate | টেনসর | float32 | ||
dst_host_srv_count | টেনসর | int32 | ||
dst_host_srv_diff_host_rate | টেনসর | float32 | ||
dst_host_srv_rerror_rate | টেনসর | float32 | ||
dst_host_srv_serror_rate | টেনসর | float32 | ||
সময়কাল | টেনসর | int32 | ||
পতাকা | ক্লাসলেবেল | int64 | ||
গরম | টেনসর | int32 | ||
হল_অতিথি_লগইন | টেনসর | bool | ||
হল_হট_লগইন | টেনসর | bool | ||
লেবেল | ক্লাসলেবেল | int64 | ||
জমি | টেনসর | bool | ||
লগ ইন | টেনসর | bool | ||
num_access_files | টেনসর | int32 | ||
num_compromised | টেনসর | int32 | ||
num_failed_logins | টেনসর | int32 | ||
num_file_creations | টেনসর | int32 | ||
num_outbound_cmds | টেনসর | int32 | ||
সংখ্যা_মূল | টেনসর | int32 | ||
num_shells | টেনসর | int32 | ||
প্রোটোকল_টাইপ | ক্লাসলেবেল | int64 | ||
ত্রুটি_হার | টেনসর | float32 | ||
root_shell | টেনসর | bool | ||
একই_srv_রেট | টেনসর | float32 | ||
ত্রুটি_হার | টেনসর | float32 | ||
সেবা | ক্লাসলেবেল | int64 | ||
src_bytes | টেনসর | int32 | ||
srv_count | টেনসর | int32 | ||
srv_diff_host_rate | টেনসর | float32 | ||
srv_rerror_rate | টেনসর | float32 | ||
srv_serror_rate | টেনসর | float32 | ||
su_ প্রচেষ্টা | টেনসর | int32 | ||
জরুরী | টেনসর | int32 | ||
ভুল_খণ্ড | টেনসর | int32 |
তত্ত্বাবধান করা কী (দেখুন
as_supervised
doc ):None
চিত্র ( tfds.show_examples ): সমর্থিত নয়।
উদাহরণ ( tfds.as_dataframe ):
- উদ্ধৃতি :
@misc{Dua:2019 ,
author = "Dua, Dheeru and Graff, Casey",
year = 2017,
title = "{UCI} Machine Learning Repository",
url = "http://archive.ics.uci.edu/ml",
institution = "University of California, Irvine, School of Information and
Computer Sciences"
}