- Описание :
Это регрессионная задача, целью которой является прогнозирование площади лесных пожаров в северо-восточном регионе Португалии с использованием метеорологических и других данных.
Информация о наборе данных:
В [Cortez and Morais, 2007] выходная «площадь» сначала была преобразована с помощью функции ln(x+1). Затем были применены несколько методов интеллектуального анализа данных. После подбора моделей выходные данные были подвергнуты постобработке с обратным преобразованием ln(x+1). Использовались четыре различные настройки ввода. Эксперименты проводились с использованием 10-кратного (перекрестная проверка) x 30 прогонов. Были измерены две метрики регрессии: MAD и RMSE. Гауссовский метод опорных векторов (SVM), учитывающий только 4 непосредственных погодных условия (температура, относительная влажность, ветер и дождь), получил наилучшее значение MAD: 12,71 ± 0,01 (среднее значение и доверительный интервал в пределах 95% с использованием t-распределения Стьюдента). Наилучший RMSE был достигнут с помощью наивного среднего предиктора. Анализ кривой ошибки регрессии (REC) показывает, что модель SVM предсказывает больше примеров в пределах более низкой допустимой ошибки. По сути, модель SVM лучше предсказывает небольшие пожары, которых большинство.
Информация об атрибутах:
Для получения дополнительной информации см. [Cortez and Morais, 2007].
- X - пространственная координата по оси x на карте парка Монтесиньо: от 1 до 9
- Y - пространственная координата по оси Y на карте парка Монтесиньо: от 2 до 9
- месяц - месяц года: от "янв" до "декабрь"
- день - день недели: от "пн" до "вс"
- FFMC — индекс FFMC из системы FWI: от 18,7 до 96,20.
- DMC - индекс DMC из системы FWI: от 1,1 до 291,3
- DC - индекс DC из системы FWI: от 7,9 до 860,6
- ISI - индекс ISI из системы FWI: от 0,0 до 56,10
- temp - температура в градусах Цельсия: от 2,2 до 33,30
- RH - относительная влажность в %: от 15,0 до 100
- ветер - скорость ветра в км/ч: от 0,40 до 9,40
- дождь - дождь снаружи в мм/м2: от 0,0 до 6,4
- area - сгоревшая площадь леса (в га): от 0,00 до 1090,84 (эта выходная переменная сильно смещена в сторону 0,0, поэтому может иметь смысл моделировать с помощью логарифмического преобразования).
Домашняя страница : https://archive.ics.uci.edu/ml/datasets/Forest+Fires
Исходный код :
tfds.structured.ForestFires
Версии :
-
0.0.1
(по умолчанию): нет примечаний к выпуску.
-
Размер загрузки :
24.88 KiB
Размер набора данных :
162.07 KiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 517 |
- Структура функции :
FeaturesDict({
'area': float32,
'features': FeaturesDict({
'DC': float32,
'DMC': float32,
'FFMC': float32,
'ISI': float32,
'RH': float32,
'X': uint8,
'Y': uint8,
'day': ClassLabel(shape=(), dtype=int64, num_classes=7),
'month': ClassLabel(shape=(), dtype=int64, num_classes=12),
'rain': float32,
'temp': float32,
'wind': float32,
}),
})
- Документация по функциям :
Особенность | Учебный класс | Форма | Dтип | Описание |
---|---|---|---|---|
ОсобенностиDict | ||||
область | Тензор | поплавок32 | ||
Особенности | ОсобенностиDict | |||
особенности/постоянный ток | Тензор | поплавок32 | ||
особенности/DMC | Тензор | поплавок32 | ||
функции / FFMC | Тензор | поплавок32 | ||
особенности/ISI | Тензор | поплавок32 | ||
особенности/правая сторона | Тензор | поплавок32 | ||
особенности/Х | Тензор | uint8 | ||
функции / Y | Тензор | uint8 | ||
функций/день | Метка класса | int64 | ||
функций/месяц | Метка класса | int64 | ||
черты/дождь | Тензор | поплавок32 | ||
характеристики/темп | Тензор | поплавок32 | ||
черты/ветер | Тензор | поплавок32 |
Контролируемые ключи (см . документ
as_supervised
):('area', 'features')
Рисунок ( tfds.show_examples ): не поддерживается.
Примеры ( tfds.as_dataframe ):
- Цитата :
@misc{Dua:2019 ,
author = "Dua, Dheeru and Graff, Casey",
year = "2017",
title = "{UCI} Machine Learning Repository",
url = "http://archive.ics.uci.edu/ml",
institution = "University of California, Irvine, School of Information and Computer Sciences" }
@article{cortez2007data,
title={A data mining approach to predict forest fires using meteorological data},
author={Cortez, Paulo and Morais, Anibal de Jesus Raimundo},
year={2007},
publisher={Associa{\c{c} }{\~a}o Portuguesa para a Intelig{\^e}ncia Artificial (APPIA)}
}