kddcup99

  • বর্ণনা :

এটি তৃতীয় আন্তর্জাতিক জ্ঞান আবিষ্কার এবং ডেটা মাইনিং সরঞ্জাম প্রতিযোগিতার জন্য ব্যবহৃত ডেটা সেট, যা KDD-99 জ্ঞান আবিষ্কার এবং ডেটা মাইনিং-এর পঞ্চম আন্তর্জাতিক সম্মেলনের সাথে একযোগে অনুষ্ঠিত হয়েছিল। প্রতিযোগিতার কাজটি ছিল একটি নেটওয়ার্ক ইনট্রুশন ডিটেক্টর তৈরি করা, একটি ভবিষ্যদ্বাণীমূলক মডেল যা 'খারাপ' সংযোগগুলির মধ্যে পার্থক্য করতে সক্ষম, যাকে অনুপ্রবেশ বা আক্রমণ বলা হয় এবং 'ভাল' স্বাভাবিক সংযোগ। এই ডাটাবেসে নিরীক্ষা করার জন্য ডেটার একটি মানক সেট রয়েছে, যার মধ্যে সামরিক নেটওয়ার্ক পরিবেশে অনুকরণ করা বিভিন্ন ধরণের অনুপ্রবেশ অন্তর্ভুক্ত রয়েছে।

বিভক্ত উদাহরণ
'test' 311,029
'train' ৪,৮৯৮,৪৩১
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'count': int32,
    'diff_srv_rate': float32,
    'dst_bytes': int32,
    'dst_host_count': int32,
    'dst_host_diff_srv_rate': float32,
    'dst_host_rerror_rate': float32,
    'dst_host_same_src_port_rate': float32,
    'dst_host_same_srv_rate': float32,
    'dst_host_serror_rate': float32,
    'dst_host_srv_count': int32,
    'dst_host_srv_diff_host_rate': float32,
    'dst_host_srv_rerror_rate': float32,
    'dst_host_srv_serror_rate': float32,
    'duration': int32,
    'flag': ClassLabel(shape=(), dtype=int64, num_classes=11),
    'hot': int32,
    'is_guest_login': bool,
    'is_hot_login': bool,
    'label': ClassLabel(shape=(), dtype=int64, num_classes=40),
    'land': bool,
    'logged_in': bool,
    'num_access_files': int32,
    'num_compromised': int32,
    'num_failed_logins': int32,
    'num_file_creations': int32,
    'num_outbound_cmds': int32,
    'num_root': int32,
    'num_shells': int32,
    'protocol_type': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'rerror_rate': float32,
    'root_shell': bool,
    'same_srv_rate': float32,
    'serror_rate': float32,
    'service': ClassLabel(shape=(), dtype=int64, num_classes=71),
    'src_bytes': int32,
    'srv_count': int32,
    'srv_diff_host_rate': float32,
    'srv_rerror_rate': float32,
    'srv_serror_rate': float32,
    'su_attempted': int32,
    'urgent': int32,
    'wrong_fragment': int32,
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
গণনা টেনসর int32
diff_srv_rate টেনসর float32
dst_bytes টেনসর int32
dst_host_count টেনসর int32
dst_host_diff_srv_rate টেনসর float32
dst_host_rerror_rate টেনসর float32
dst_host_same_src_port_rate টেনসর float32
dst_host_same_srv_রেট টেনসর float32
dst_host_serror_rate টেনসর float32
dst_host_srv_count টেনসর int32
dst_host_srv_diff_host_rate টেনসর float32
dst_host_srv_rerror_rate টেনসর float32
dst_host_srv_serror_rate টেনসর float32
সময়কাল টেনসর int32
পতাকা ক্লাসলেবেল int64
গরম টেনসর int32
হল_অতিথি_লগইন টেনসর bool
হল_হট_লগইন টেনসর bool
লেবেল ক্লাসলেবেল int64
জমি টেনসর bool
লগ ইন টেনসর bool
num_access_files টেনসর int32
num_compromised টেনসর int32
num_failed_logins টেনসর int32
num_file_creations টেনসর int32
num_outbound_cmds টেনসর int32
সংখ্যা_মূল টেনসর int32
num_shells টেনসর int32
প্রোটোকল_টাইপ ক্লাসলেবেল int64
ত্রুটি_হার টেনসর float32
root_shell টেনসর bool
একই_srv_রেট টেনসর float32
ত্রুটি_হার টেনসর float32
সেবা ক্লাসলেবেল int64
src_bytes টেনসর int32
srv_count টেনসর int32
srv_diff_host_rate টেনসর float32
srv_rerror_rate টেনসর float32
srv_serror_rate টেনসর float32
su_ প্রচেষ্টা টেনসর int32
জরুরী টেনসর int32
ভুল_খণ্ড টেনসর int32
  • উদ্ধৃতি :
@misc{Dua:2019 ,
  author = "Dua, Dheeru and Graff, Casey",
  year = 2017,
  title = "{UCI} Machine Learning Repository",
  url = "http://archive.ics.uci.edu/ml",
  institution = "University of California, Irvine, School of Information and
Computer Sciences"
}