- 説明:
タイタニック号の個々の乗客の生存状況を説明するデータセット。元のデータセットの欠損値は、? を使用して表されます。 float と int の欠損値は -1 に置き換えられ、文字列の欠損値は「不明」に置き換えられます。
ホームページ: https://www.openml.org/d/40945
ソース コード:
tfds.datasets.titanic.Builder
バージョン:
-
2.0.0
: 新しい分割 API ( https://tensorflow.org/datasets/splits ) -
3.0.0
: データセットのフィーチャの標準フラット ディクショナリを使用します。as_supervised=True
を使用して、データセットを(features_dict, survived)
タプルに分割します。 -
4.0.0
(デフォルト): 3.0.0 で反転されていた反転ラベルを修正します。
-
ダウンロードサイズ:
114.98 KiB
データセットサイズ:
382.58 KiB
自動キャッシュ(ドキュメント): はい
スプリット:
スプリット | 例 |
---|---|
'train' | 1,309 |
- 機能構造:
FeaturesDict({
'age': float32,
'boat': string,
'body': int32,
'cabin': string,
'embarked': ClassLabel(shape=(), dtype=int64, num_classes=4),
'fare': float32,
'home.dest': string,
'name': string,
'parch': int32,
'pclass': ClassLabel(shape=(), dtype=int64, num_classes=3),
'sex': ClassLabel(shape=(), dtype=int64, num_classes=2),
'sibsp': int32,
'survived': ClassLabel(shape=(), dtype=int64, num_classes=2),
'ticket': string,
})
- 機能のドキュメント:
特徴 | クラス | 形 | Dtype | 説明 |
---|---|---|---|---|
特徴辞書 | ||||
年 | テンソル | float32 | ||
ボート | テンソル | 弦 | ||
体 | テンソル | int32 | ||
キャビン | テンソル | 弦 | ||
乗り出した | クラスラベル | int64 | ||
運賃 | テンソル | float32 | ||
ホーム.宛先 | テンソル | 弦 | ||
名前 | テンソル | 弦 | ||
乾いた | テンソル | int32 | ||
pclass | クラスラベル | int64 | ||
セックス | クラスラベル | int64 | ||
シブスプ | テンソル | int32 | ||
生き残った | クラスラベル | int64 | ||
チケット | テンソル | 弦 |
監視キー(
as_supervised
docを参照):({'age': 'age', 'boat': 'boat', 'body': 'body', 'cabin': 'cabin', 'embarked': 'embarked', 'fare': 'fare', 'home.dest': 'home.dest', 'name': 'name', 'parch': 'parch', 'pclass': 'pclass', 'sex': 'sex', 'sibsp': 'sibsp', 'ticket': 'ticket'}, 'survived')
図( tfds.show_examples ): サポートされていません。
例( tfds.as_dataframe ):
- 引用:
@ONLINE {titanic,
author = "Frank E. Harrell Jr., Thomas Cason",
title = "Titanic dataset",
month = "oct",
year = "2017",
url = "https://www.openml.org/d/40945"
}
, - 説明:
タイタニック号の個々の乗客の生存状況を説明するデータセット。元のデータセットの欠損値は、? を使用して表されます。 float と int の欠損値は -1 に置き換えられ、文字列の欠損値は「不明」に置き換えられます。
ホームページ: https://www.openml.org/d/40945
ソース コード:
tfds.datasets.titanic.Builder
バージョン:
-
2.0.0
: 新しい分割 API ( https://tensorflow.org/datasets/splits ) -
3.0.0
: データセットのフィーチャの標準フラット ディクショナリを使用します。as_supervised=True
を使用して、データセットを(features_dict, survived)
タプルに分割します。 -
4.0.0
(デフォルト): 3.0.0 で反転されていた反転ラベルを修正します。
-
ダウンロードサイズ:
114.98 KiB
データセットサイズ:
382.58 KiB
自動キャッシュ(ドキュメント): はい
スプリット:
スプリット | 例 |
---|---|
'train' | 1,309 |
- 機能構造:
FeaturesDict({
'age': float32,
'boat': string,
'body': int32,
'cabin': string,
'embarked': ClassLabel(shape=(), dtype=int64, num_classes=4),
'fare': float32,
'home.dest': string,
'name': string,
'parch': int32,
'pclass': ClassLabel(shape=(), dtype=int64, num_classes=3),
'sex': ClassLabel(shape=(), dtype=int64, num_classes=2),
'sibsp': int32,
'survived': ClassLabel(shape=(), dtype=int64, num_classes=2),
'ticket': string,
})
- 機能のドキュメント:
特徴 | クラス | 形 | Dtype | 説明 |
---|---|---|---|---|
特徴辞書 | ||||
年 | テンソル | float32 | ||
ボート | テンソル | 弦 | ||
体 | テンソル | int32 | ||
キャビン | テンソル | 弦 | ||
乗り出した | クラスラベル | int64 | ||
運賃 | テンソル | float32 | ||
ホーム.宛先 | テンソル | 弦 | ||
名前 | テンソル | 弦 | ||
乾いた | テンソル | int32 | ||
pclass | クラスラベル | int64 | ||
セックス | クラスラベル | int64 | ||
シブスプ | テンソル | int32 | ||
生き残った | クラスラベル | int64 | ||
チケット | テンソル | 弦 |
監視キー(
as_supervised
docを参照):({'age': 'age', 'boat': 'boat', 'body': 'body', 'cabin': 'cabin', 'embarked': 'embarked', 'fare': 'fare', 'home.dest': 'home.dest', 'name': 'name', 'parch': 'parch', 'pclass': 'pclass', 'sex': 'sex', 'sibsp': 'sibsp', 'ticket': 'ticket'}, 'survived')
図( tfds.show_examples ): サポートされていません。
例( tfds.as_dataframe ):
- 引用:
@ONLINE {titanic,
author = "Frank E. Harrell Jr., Thomas Cason",
title = "Titanic dataset",
month = "oct",
year = "2017",
url = "https://www.openml.org/d/40945"
}