- 설명 :
이것은 기상 및 기타 데이터를 사용하여 포르투갈 북동부 지역의 산불 연소 면적을 예측하는 회귀 작업입니다.
데이터 세트 정보:
[Cortez and Morais, 2007]에서 출력 '면적'은 ln(x+1) 함수로 처음 변환되었습니다. 그런 다음 여러 데이터 마이닝 방법이 적용되었습니다. 모델을 피팅한 후 출력은 ln(x+1) 변환의 역으로 후처리되었습니다. 네 가지 입력 설정이 사용되었습니다. 실험은 10배(교차 검증) x 30회 실행을 사용하여 수행되었습니다. MAD 및 RMSE의 두 가지 회귀 메트릭이 측정되었습니다. 4가지 직접적인 기상 조건(온도, RH, 바람 및 비)만 공급된 가우시안 서포트 벡터 머신(SVM)은 최상의 MAD 값을 얻었습니다: 12.71 +- 0.01(t-student 분포를 사용하여 95% 이내의 평균 및 신뢰 구간). 최고의 RMSE는 순진한 평균 예측자에 의해 달성되었습니다. 회귀 오차 곡선(REC)에 대한 분석은 SVM 모델이 더 낮은 허용 오차 내에서 더 많은 예를 예측한다는 것을 보여줍니다. 실제로 SVM 모델은 대부분의 작은 화재를 더 잘 예측합니다.
속성 정보:
자세한 내용은 [Cortez and Morais, 2007]을 참조하십시오.
- X - Montesinho 공원 맵 내 x축 공간 좌표: 1~9
- Y - Montesinho 공원 맵 내의 y축 공간 좌표: 2 ~ 9
- 월 - 월: 'jan'에서 'dec'로
- 요일 - 요일: 'mon'에서 'sun'으로
- FFMC - FWI 시스템의 FFMC 지수: 18.7 ~ 96.20
- DMC - FWI 시스템의 DMC 지수: 1.1 ~ 291.3
- DC - FWI 시스템의 DC 인덱스: 7.9 ~ 860.6
- ISI - FWI 시스템의 ISI 지수: 0.0 ~ 56.10
- 온도 - 섭씨 온도: 2.2 ~ 33.30
- RH - 상대 습도(%): 15.0 ~ 100
- 바람 - 풍속(km/h): 0.40 ~ 9.40
- 비 - 외부 비(mm/m2) : 0.0 ~ 6.4
- area - 숲의 연소 면적(단위: ha): 0.00 ~ 1090.84(이 출력 변수는 0.0에 매우 치우쳐 있으므로 로그 변환으로 모델링하는 것이 이치에 맞을 수 있습니다).
소스 코드 :
tfds.structured.ForestFires
버전 :
-
0.0.1
(기본값): 릴리스 정보가 없습니다.
-
다운로드 크기 :
24.88 KiB
데이터 세트 크기 :
162.07 KiB
자동 캐시 ( 문서 ): 예
분할 :
나뉘다 | 예 |
---|---|
'train' | 517 |
- 기능 구조 :
FeaturesDict({
'area': float32,
'features': FeaturesDict({
'DC': float32,
'DMC': float32,
'FFMC': float32,
'ISI': float32,
'RH': float32,
'X': uint8,
'Y': uint8,
'day': ClassLabel(shape=(), dtype=int64, num_classes=7),
'month': ClassLabel(shape=(), dtype=int64, num_classes=12),
'rain': float32,
'temp': float32,
'wind': float32,
}),
})
- 기능 문서 :
특징 | 수업 | 모양 | D타입 | 설명 |
---|---|---|---|---|
풍모Dict | ||||
지역 | 텐서 | float32 | ||
특징 | 풍모Dict | |||
기능/DC | 텐서 | float32 | ||
기능/DMC | 텐서 | float32 | ||
기능/FFMC | 텐서 | float32 | ||
기능/ISI | 텐서 | float32 | ||
기능/RH | 텐서 | float32 | ||
기능/X | 텐서 | uint8 | ||
기능/Y | 텐서 | uint8 | ||
기능/일 | 클래스 레이블 | int64 | ||
기능/월 | 클래스 레이블 | int64 | ||
특징/비 | 텐서 | float32 | ||
기능/온도 | 텐서 | float32 | ||
특징/바람 | 텐서 | float32 |
감독 키 (
as_supervised
문서 참조):('area', 'features')
그림 ( tfds.show_examples ): 지원되지 않습니다.
예 ( tfds.as_dataframe ):
- 인용 :
@misc{Dua:2019 ,
author = "Dua, Dheeru and Graff, Casey",
year = "2017",
title = "{UCI} Machine Learning Repository",
url = "http://archive.ics.uci.edu/ml",
institution = "University of California, Irvine, School of Information and Computer Sciences" }
@article{cortez2007data,
title={A data mining approach to predict forest fires using meteorological data},
author={Cortez, Paulo and Morais, Anibal de Jesus Raimundo},
year={2007},
publisher={Associa{\c{c} }{\~a}o Portuguesa para a Intelig{\^e}ncia Artificial (APPIA)}
}