- 説明:
これは、KDD-99 The Fifth International Conference on Knowledge Discovery and Data Mining と併せて開催された The Third International Knowledge Discovery and Data Mining Tools Competition で使用されたデータ セットです。競技課題は、侵入または攻撃と呼ばれる「悪い」接続と「良い」通常の接続を区別できる予測モデルである、ネットワーク侵入検出器を構築することでした。このデータベースには、軍事ネットワーク環境でシミュレートされたさまざまな侵入を含む、監査対象の標準的なデータ セットが含まれています。
追加のドキュメント:コード を使用したペーパーの探索
ホームページ: https://kdd.ics.uci.edu/databases/kddcup99/kddcup99.html
ソース コード:
tfds.datasets.kddcup99.Builder
バージョン:
-
1.0.0
: 初期リリース。 -
1.0.1
(デフォルト): ブール フィールドland
、logged_in
、root_shell
、is_hot_login
、is_guest_login
の解析を修正します。
-
ダウンロードサイズ:
18.62 MiB
データセットサイズ:
5.25 GiB
自動キャッシュ(ドキュメント): いいえ
スプリット:
スプリット | 例 |
---|---|
'test' | 311,029 |
'train' | 4,898,431 |
- 機能構造:
FeaturesDict({
'count': int32,
'diff_srv_rate': float32,
'dst_bytes': int32,
'dst_host_count': int32,
'dst_host_diff_srv_rate': float32,
'dst_host_rerror_rate': float32,
'dst_host_same_src_port_rate': float32,
'dst_host_same_srv_rate': float32,
'dst_host_serror_rate': float32,
'dst_host_srv_count': int32,
'dst_host_srv_diff_host_rate': float32,
'dst_host_srv_rerror_rate': float32,
'dst_host_srv_serror_rate': float32,
'duration': int32,
'flag': ClassLabel(shape=(), dtype=int64, num_classes=11),
'hot': int32,
'is_guest_login': bool,
'is_hot_login': bool,
'label': ClassLabel(shape=(), dtype=int64, num_classes=40),
'land': bool,
'logged_in': bool,
'num_access_files': int32,
'num_compromised': int32,
'num_failed_logins': int32,
'num_file_creations': int32,
'num_outbound_cmds': int32,
'num_root': int32,
'num_shells': int32,
'protocol_type': ClassLabel(shape=(), dtype=int64, num_classes=3),
'rerror_rate': float32,
'root_shell': bool,
'same_srv_rate': float32,
'serror_rate': float32,
'service': ClassLabel(shape=(), dtype=int64, num_classes=71),
'src_bytes': int32,
'srv_count': int32,
'srv_diff_host_rate': float32,
'srv_rerror_rate': float32,
'srv_serror_rate': float32,
'su_attempted': int32,
'urgent': int32,
'wrong_fragment': int32,
})
- 機能のドキュメント:
特徴 | クラス | 形 | Dtype | 説明 |
---|---|---|---|---|
特徴辞書 | ||||
カウント | テンソル | int32 | ||
diff_srv_rate | テンソル | float32 | ||
dst_bytes | テンソル | int32 | ||
dst_host_count | テンソル | int32 | ||
dst_host_diff_srv_rate | テンソル | float32 | ||
dst_host_rerror_rate | テンソル | float32 | ||
dst_host_same_src_port_rate | テンソル | float32 | ||
dst_host_same_srv_rate | テンソル | float32 | ||
dst_host_serror_rate | テンソル | float32 | ||
dst_host_srv_count | テンソル | int32 | ||
dst_host_srv_diff_host_rate | テンソル | float32 | ||
dst_host_srv_rerror_rate | テンソル | float32 | ||
dst_host_srv_serror_rate | テンソル | float32 | ||
間隔 | テンソル | int32 | ||
国旗 | クラスラベル | int64 | ||
ホット | テンソル | int32 | ||
is_guest_login | テンソル | ブール | ||
is_hot_login | テンソル | ブール | ||
ラベル | クラスラベル | int64 | ||
土地 | テンソル | ブール | ||
ログイン済み | テンソル | ブール | ||
num_access_files | テンソル | int32 | ||
num_compromised | テンソル | int32 | ||
num_failed_logins | テンソル | int32 | ||
num_file_creations | テンソル | int32 | ||
num_outbound_cmds | テンソル | int32 | ||
num_root | テンソル | int32 | ||
num_shells | テンソル | int32 | ||
protocol_type | クラスラベル | int64 | ||
rerror_rate | テンソル | float32 | ||
root_shell | テンソル | ブール | ||
same_srv_rate | テンソル | float32 | ||
serror_rate | テンソル | float32 | ||
サービス | クラスラベル | int64 | ||
src_bytes | テンソル | int32 | ||
srv_count | テンソル | int32 | ||
srv_diff_host_rate | テンソル | float32 | ||
srv_rerror_rate | テンソル | float32 | ||
srv_serror_rate | テンソル | float32 | ||
su_attempted | テンソル | int32 | ||
急 | テンソル | int32 | ||
wrong_fragment | テンソル | int32 |
監視されたキー(
as_supervised
docを参照):None
図( tfds.show_examples ): サポートされていません。
例( tfds.as_dataframe ):
- 引用:
@misc{Dua:2019 ,
author = "Dua, Dheeru and Graff, Casey",
year = 2017,
title = "{UCI} Machine Learning Repository",
url = "http://archive.ics.uci.edu/ml",
institution = "University of California, Irvine, School of Information and
Computer Sciences"
}