- Descriptif :
Il s'agit d'une tâche de régression, dont le but est de prédire la superficie brûlée des incendies de forêt, dans la région nord-est du Portugal, en utilisant des données météorologiques et autres.
Informations sur l'ensemble de données :
Dans [Cortez and Morais, 2007], la sortie 'area' a d'abord été transformée avec une fonction ln(x+1). Ensuite, plusieurs méthodes de Data Mining ont été appliquées. Après ajustement des modèles, les sorties ont été post-traitées avec l'inverse de la transformée ln(x+1). Quatre configurations d'entrée différentes ont été utilisées. Les expériences ont été menées en utilisant 10 fois (validation croisée) x 30 essais. Deux métriques de régression ont été mesurées : MAD et RMSE. Une machine à vecteurs de support gaussien (SVM) alimentée avec seulement 4 conditions météorologiques directes (température, RH, vent et pluie) a obtenu la meilleure valeur MAD : 12,71 +- 0,01 (moyenne et intervalle de confiance à 95 % en utilisant une distribution t-student). Le meilleur RMSE a été atteint par le prédicteur moyen naïf. Une analyse de la courbe d'erreur de régression (REC) montre que le modèle SVM prédit plus d'exemples avec une erreur admise inférieure. En effet, le modèle SVM prédit mieux les petits feux, qui sont majoritaires.
Informations sur les attributs :
Pour plus d'informations, lire [Cortez et Morais, 2007].
- X - coordonnée spatiale sur l'axe des x dans la carte du parc de Montesinho : 1 à 9
- Y - Coordonnée spatiale sur l'axe des ordonnées dans la carte du parc de Montesinho : 2 à 9
- mois - mois de l'année : 'jan' à 'dec'
- jour - jour de la semaine : 'lun' à 'dim'
- FFMC - Indice FFMC du système FWI : 18,7 à 96,20
- DMC - Indice DMC du système FWI : 1,1 à 291,3
- Indice DC - DC du système FWI : 7,9 à 860,6
- ISI - Indice ISI du système FWI : 0,0 à 56,10
- temp - température en degrés Celsius : 2,2 à 33,30
- HR - humidité relative en % : 15,0 à 100
- vent - vitesse du vent en km/h : 0,40 à 9,40
- pluie - pluie extérieure en mm/m2 : 0,0 à 6,4
- surface - la surface brûlée de la forêt (en ha) : 0,00 à 1090,84 (cette variable de sortie est très biaisée vers 0,0, il peut donc être judicieux de modéliser avec la transformée logarithmique).
Page d' accueil : https://archive.ics.uci.edu/ml/datasets/Forest+Fires
Code source :
tfds.structured.ForestFires
Versions :
-
0.0.1
(par défaut) : aucune note de version.
-
Taille du téléchargement :
24.88 KiB
Taille du jeu de données :
162.07 KiB
Mise en cache automatique ( documentation ): Oui
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 517 |
- Structure des fonctionnalités :
FeaturesDict({
'area': float32,
'features': FeaturesDict({
'DC': float32,
'DMC': float32,
'FFMC': float32,
'ISI': float32,
'RH': float32,
'X': uint8,
'Y': uint8,
'day': ClassLabel(shape=(), dtype=int64, num_classes=7),
'month': ClassLabel(shape=(), dtype=int64, num_classes=12),
'rain': float32,
'temp': float32,
'wind': float32,
}),
})
- Documentation des fonctionnalités :
Caractéristique | Classer | Forme | Dtype | La description |
---|---|---|---|---|
FonctionnalitésDict | ||||
Région | Tenseur | float32 | ||
Caractéristiques | FonctionnalitésDict | |||
caractéristiques/CC | Tenseur | float32 | ||
fonctionnalités/DMC | Tenseur | float32 | ||
fonctionnalités/FFMC | Tenseur | float32 | ||
caractéristiques/ISI | Tenseur | float32 | ||
caractéristiques/HR | Tenseur | float32 | ||
caractéristiques/X | Tenseur | uint8 | ||
caractéristiques/Y | Tenseur | uint8 | ||
fonctionnalités/jour | Étiquette de classe | int64 | ||
fonctionnalités/mois | Étiquette de classe | int64 | ||
caractéristiques/pluie | Tenseur | float32 | ||
caractéristiques/température | Tenseur | float32 | ||
caractéristiques/vent | Tenseur | float32 |
Touches supervisées (Voir
as_supervised
doc ):('area', 'features')
Figure ( tfds.show_examples ) : non pris en charge.
Exemples ( tfds.as_dataframe ):
- Citation :
@misc{Dua:2019 ,
author = "Dua, Dheeru and Graff, Casey",
year = "2017",
title = "{UCI} Machine Learning Repository",
url = "http://archive.ics.uci.edu/ml",
institution = "University of California, Irvine, School of Information and Computer Sciences" }
@article{cortez2007data,
title={A data mining approach to predict forest fires using meteorological data},
author={Cortez, Paulo and Morais, Anibal de Jesus Raimundo},
year={2007},
publisher={Associa{\c{c} }{\~a}o Portuguesa para a Intelig{\^e}ncia Artificial (APPIA)}
}