лесные пожары

  • Описание :

Это регрессионная задача, целью которой является прогнозирование площади лесных пожаров в северо-восточном регионе Португалии с использованием метеорологических и других данных.

Информация о наборе данных:

В [Cortez and Morais, 2007] выходная «площадь» сначала была преобразована с помощью функции ln(x+1). Затем были применены несколько методов интеллектуального анализа данных. После подбора моделей выходные данные были подвергнуты постобработке с обратным преобразованием ln(x+1). Использовались четыре различные настройки ввода. Эксперименты проводились с использованием 10-кратного (перекрестная проверка) x 30 прогонов. Были измерены две метрики регрессии: MAD и RMSE. Гауссовский метод опорных векторов (SVM), учитывающий только 4 непосредственных погодных условия (температура, относительная влажность, ветер и дождь), получил наилучшее значение MAD: 12,71 ± 0,01 (среднее значение и доверительный интервал в пределах 95% с использованием t-распределения Стьюдента). Наилучший RMSE был достигнут с помощью наивного среднего предиктора. Анализ кривой ошибки регрессии (REC) показывает, что модель SVM предсказывает больше примеров в пределах более низкой допустимой ошибки. По сути, модель SVM лучше предсказывает небольшие пожары, которых большинство.

Информация об атрибутах:

Для получения дополнительной информации см. [Cortez and Morais, 2007].

  1. X - пространственная координата по оси x на карте парка Монтесиньо: от 1 до 9
  2. Y - пространственная координата по оси Y на карте парка Монтесиньо: от 2 до 9
  3. месяц - месяц года: от "янв" до "декабрь"
  4. день - день недели: от "пн" до "вс"
  5. FFMC — индекс FFMC из системы FWI: от 18,7 до 96,20.
  6. DMC - индекс DMC из системы FWI: от 1,1 до 291,3
  7. DC - индекс DC из системы FWI: от 7,9 до 860,6
  8. ISI - индекс ISI из системы FWI: от 0,0 до 56,10
  9. temp - температура в градусах Цельсия: от 2,2 до 33,30
  10. RH - относительная влажность в %: от 15,0 до 100
  11. ветер - скорость ветра в км/ч: от 0,40 до 9,40
  12. дождь - дождь снаружи в мм/м2: от 0,0 до 6,4
  13. area - сгоревшая площадь леса (в га): от 0,00 до 1090,84 (эта выходная переменная сильно смещена в сторону 0,0, поэтому может иметь смысл моделировать с помощью логарифмического преобразования).
Расколоть Примеры
'train' 517
  • Структура функции :
FeaturesDict({
    'area': float32,
    'features': FeaturesDict({
        'DC': float32,
        'DMC': float32,
        'FFMC': float32,
        'ISI': float32,
        'RH': float32,
        'X': uint8,
        'Y': uint8,
        'day': ClassLabel(shape=(), dtype=int64, num_classes=7),
        'month': ClassLabel(shape=(), dtype=int64, num_classes=12),
        'rain': float32,
        'temp': float32,
        'wind': float32,
    }),
})
  • Документация по функциям :
Особенность Учебный класс Форма Dтип Описание
ОсобенностиDict
область Тензор поплавок32
Особенности ОсобенностиDict
особенности/постоянный ток Тензор поплавок32
особенности/DMC Тензор поплавок32
функции / FFMC Тензор поплавок32
особенности/ISI Тензор поплавок32
особенности/правая сторона Тензор поплавок32
особенности/Х Тензор uint8
функции / Y Тензор uint8
функций/день Метка класса int64
функций/месяц Метка класса int64
черты/дождь Тензор поплавок32
характеристики/темп Тензор поплавок32
черты/ветер Тензор поплавок32
  • Цитата :
@misc{Dua:2019 ,
author = "Dua, Dheeru and Graff, Casey",
year = "2017",
title = "{UCI} Machine Learning Repository",
url = "http://archive.ics.uci.edu/ml",
institution = "University of California, Irvine, School of Information and Computer Sciences" }

@article{cortez2007data,
  title={A data mining approach to predict forest fires using meteorological data},
  author={Cortez, Paulo and Morais, Anibal de Jesus Raimundo},
  year={2007},
  publisher={Associa{\c{c} }{\~a}o Portuguesa para a Intelig{\^e}ncia Artificial (APPIA)}
}