incendi boschivi

  • Descrizione :

Si tratta di un compito di regressione, il cui obiettivo è prevedere l'area bruciata dagli incendi boschivi, nella regione nord-orientale del Portogallo, utilizzando dati meteorologici e di altro tipo.

Informazioni sul set di dati:

In [Cortez e Morais, 2007], l'output 'area' è stato prima trasformato con una funzione ln(x+1). Quindi, sono stati applicati diversi metodi di Data Mining. Dopo aver adattato i modelli, gli output sono stati post-elaborati con l'inverso della trasformata ln(x+1). Sono state utilizzate quattro diverse impostazioni di input. Gli esperimenti sono stati condotti utilizzando 10 volte (convalida incrociata) x 30 corse. Sono state misurate due metriche di regressione: MAD e RMSE. Una macchina vettoriale di supporto gaussiano (SVM) alimentata con sole 4 condizioni meteorologiche dirette (temp, RH, vento e pioggia) ha ottenuto il miglior valore MAD: 12,71 +- 0,01 (media e intervallo di confidenza entro il 95% utilizzando una distribuzione t-student). Il miglior RMSE è stato ottenuto dal predittore medio ingenuo. Un'analisi della curva dell'errore di regressione (REC) mostra che il modello SVM prevede più esempi all'interno di un errore ammesso inferiore. In effetti, il modello SVM prevede meglio piccoli incendi, che sono la maggioranza.

Informazioni sugli attributi:

Per ulteriori informazioni, leggere [Cortez e Morais, 2007].

  1. X - Coordinata spaziale dell'asse x all'interno della mappa del parco Montesinho: da 1 a 9
  2. Y - Coordinata spaziale dell'asse y all'interno della mappa del parco Montesinho: da 2 a 9
  3. mese - mese dell'anno: da 'jan' a 'dec'
  4. day - giorno della settimana: da 'mon' a 'sun'
  5. FFMC - Indice FFMC dal sistema FWI: da 18,7 a 96,20
  6. DMC - Indice DMC dal sistema FWI: da 1,1 a 291,3
  7. DC - Indice DC dal sistema FWI: da 7,9 a 860,6
  8. ISI - Indice ISI dal sistema FWI: da 0,0 a 56,10
  9. temp - temperatura in gradi Celsius: da 2,2 a 33,30
  10. RH - umidità relativa in %: da 15,0 a 100
  11. vento - velocità del vento in km/h: da 0,40 a 9,40
  12. pioggia - pioggia esterna in mm/m2: da 0,0 a 6,4
  13. area - l'area bruciata della foresta (in ha): da 0,00 a 1090,84 (questa variabile di output è molto inclinata verso 0,0, quindi potrebbe avere senso modellare con la trasformazione logaritmica).
Diviso Esempi
'train' 517
  • Struttura delle caratteristiche :
FeaturesDict({
    'area': float32,
    'features': FeaturesDict({
        'DC': float32,
        'DMC': float32,
        'FFMC': float32,
        'ISI': float32,
        'RH': float32,
        'X': uint8,
        'Y': uint8,
        'day': ClassLabel(shape=(), dtype=int64, num_classes=7),
        'month': ClassLabel(shape=(), dtype=int64, num_classes=12),
        'rain': float32,
        'temp': float32,
        'wind': float32,
    }),
})
  • Documentazione delle funzionalità :
Caratteristica Classe Forma Tipo D Descrizione
CaratteristicheDict
la zona Tensore galleggiante32
caratteristiche CaratteristicheDict
caratteristiche/DC Tensore galleggiante32
caratteristiche/DMC Tensore galleggiante32
caratteristiche/FFMC Tensore galleggiante32
caratteristiche/ISI Tensore galleggiante32
caratteristiche/Dx Tensore galleggiante32
caratteristiche/X Tensore uint8
caratteristiche/Y Tensore uint8
caratteristiche/giorno ClassLabel int64
funzioni/mese ClassLabel int64
caratteristiche/pioggia Tensore galleggiante32
caratteristiche/temp Tensore galleggiante32
caratteristiche/vento Tensore galleggiante32
  • Citazione :
@misc{Dua:2019 ,
author = "Dua, Dheeru and Graff, Casey",
year = "2017",
title = "{UCI} Machine Learning Repository",
url = "http://archive.ics.uci.edu/ml",
institution = "University of California, Irvine, School of Information and Computer Sciences" }

@article{cortez2007data,
  title={A data mining approach to predict forest fires using meteorological data},
  author={Cortez, Paulo and Morais, Anibal de Jesus Raimundo},
  year={2007},
  publisher={Associa{\c{c} }{\~a}o Portuguesa para a Intelig{\^e}ncia Artificial (APPIA)}
}