incendios forestales

  • Descripción :

Esta es una tarea de regresión, donde el objetivo es predecir el área quemada de los incendios forestales, en la región noreste de Portugal, utilizando datos meteorológicos y otros.

Información del conjunto de datos:

En [Cortez and Morais, 2007], el 'área' de salida se transformó primero con una función ln(x+1). Luego, se aplicaron varios métodos de Minería de Datos. Después de ajustar los modelos, las salidas se postprocesaron con el inverso de la transformada ln(x+1). Se utilizaron cuatro configuraciones de entrada diferentes. Los experimentos se realizaron utilizando 10 veces (validación cruzada) x 30 ejecuciones. Se midieron dos métricas de regresión: MAD y RMSE. Una máquina de vectores de soporte gaussiana (SVM) alimentada con solo 4 condiciones climáticas directas (temperatura, HR, viento y lluvia) obtuvo el mejor valor de MAD: 12.71 +- 0.01 (media e intervalo de confianza dentro del 95% usando una distribución t-student). El mejor RMSE fue alcanzado por el predictor medio ingenuo. Un análisis de la curva de error de regresión (REC) muestra que el modelo SVM predice más ejemplos dentro de un error admitido más bajo. En efecto, el modelo SVM predice mejor los incendios pequeños, que son la mayoría.

Información de atributos:

Para obtener más información, lea [Cortez y Morais, 2007].

  1. X - coordenada espacial del eje x dentro del mapa del parque Montesinho: 1 a 9
  2. Y - Coordenada espacial del eje y dentro del mapa del parque Montesinho: 2 a 9
  3. mes - mes del año: 'ene' a 'dic'
  4. día - día de la semana: 'mon' a 'sun'
  5. FFMC - Índice FFMC del sistema FWI: 18.7 a 96.20
  6. DMC - Índice DMC del sistema FWI: 1.1 a 291.3
  7. DC - Índice DC del sistema FWI: 7.9 a 860.6
  8. ISI - Índice ISI del sistema FWI: 0.0 a 56.10
  9. temp - temperatura en grados Celsius: 2.2 a 33.30
  10. HR - humedad relativa en %: 15,0 a 100
  11. viento - velocidad del viento en km/h: 0,40 a 9,40
  12. lluvia - lluvia exterior en mm/m2 : 0,0 a 6,4
  13. área - el área quemada del bosque (en ha): 0,00 a 1090,84 (esta variable de salida está muy sesgada hacia 0,0, por lo que puede tener sentido modelar con la transformada logarítmica).
Separar Ejemplos
'train' 517
  • Estructura de características :
FeaturesDict({
    'area': float32,
    'features': FeaturesDict({
        'DC': float32,
        'DMC': float32,
        'FFMC': float32,
        'ISI': float32,
        'RH': float32,
        'X': uint8,
        'Y': uint8,
        'day': ClassLabel(shape=(), dtype=int64, num_classes=7),
        'month': ClassLabel(shape=(), dtype=int64, num_classes=12),
        'rain': float32,
        'temp': float32,
        'wind': float32,
    }),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
área Tensor flotar32
caracteristicas CaracterísticasDict
características/CC Tensor flotar32
características/DMC Tensor flotar32
características/FFMC Tensor flotar32
caracteristicas/ISI Tensor flotar32
caracteristicas/RH Tensor flotar32
caracteristicas/X Tensor uint8
caracteristicas/Y Tensor uint8
caracteristicas/dia Etiqueta de clase int64
funciones/mes Etiqueta de clase int64
caracteristicas/lluvia Tensor flotar32
caracteristicas/temperatura Tensor flotar32
caracteristicas/viento Tensor flotar32
  • Cita :
@misc{Dua:2019 ,
author = "Dua, Dheeru and Graff, Casey",
year = "2017",
title = "{UCI} Machine Learning Repository",
url = "http://archive.ics.uci.edu/ml",
institution = "University of California, Irvine, School of Information and Computer Sciences" }

@article{cortez2007data,
  title={A data mining approach to predict forest fires using meteorological data},
  author={Cortez, Paulo and Morais, Anibal de Jesus Raimundo},
  year={2007},
  publisher={Associa{\c{c} }{\~a}o Portuguesa para a Intelig{\^e}ncia Artificial (APPIA)}
}