Cháy rừng

  • Mô tả :

Đây là một nhiệm vụ hồi quy, trong đó mục đích là dự đoán khu vực bị cháy rừng ở vùng đông bắc Bồ Đào Nha, bằng cách sử dụng dữ liệu khí tượng và các dữ liệu khác.

Thông tin tập dữ liệu:

Trong [Cortez và Morais, 2007], 'diện tích' đầu ra lần đầu tiên được chuyển đổi bằng hàm ln(x+1). Sau đó, một số phương pháp Khai thác dữ liệu đã được áp dụng. Sau khi khớp các mô hình, kết quả đầu ra được xử lý hậu kỳ với nghịch đảo của phép biến đổi ln(x+1). Bốn thiết lập đầu vào khác nhau đã được sử dụng. Các thử nghiệm được thực hiện bằng cách sử dụng 10 lần (xác thực chéo) x 30 lần chạy. Hai chỉ số hồi quy đã được đo: MAD và RMSE. Máy vectơ hỗ trợ Gaussian (SVM) được cung cấp chỉ với 4 điều kiện thời tiết trực tiếp (nhiệt độ, RH, gió và mưa) đã thu được giá trị MAD tốt nhất: 12,71 + - 0,01 (trung bình và khoảng tin cậy trong khoảng 95% khi sử dụng phân phối t-student). RMSE tốt nhất đã đạt được bằng công cụ dự đoán trung bình ngây thơ. Một phân tích về đường cong lỗi hồi quy (REC) cho thấy mô hình SVM dự đoán nhiều ví dụ hơn trong phạm vi lỗi được thừa nhận thấp hơn. Trên thực tế, mô hình SVM dự đoán các đám cháy nhỏ tốt hơn, chiếm đa số.

Thông tin thuộc tính:

Để biết thêm thông tin, hãy đọc [Cortez và Morais, 2007].

  1. X - tọa độ không gian trục x trong bản đồ công viên Montesinho: 1 đến 9
  2. Y - tọa độ không gian trục y trong bản đồ công viên Montesinho: 2 đến 9
  3. tháng - tháng trong năm: 'jan' đến 'dec'
  4. ngày - ngày trong tuần: 'mon' thành 'sun'
  5. FFMC - Chỉ số FFMC từ hệ thống FWI: 18.7 đến 96.20
  6. DMC - Chỉ số DMC từ hệ thống FWI: 1,1 đến 291,3
  7. Chỉ số DC - DC từ hệ thống FWI: 7.9 đến 860.6
  8. ISI - Chỉ số ISI từ hệ thống FWI: 0,0 đến 56,10
  9. nhiệt độ - nhiệt độ tính bằng độ C: 2,2 đến 33,30
  10. RH - độ ẩm tương đối tính bằng %: 15,0 đến 100
  11. gió - tốc độ gió tính bằng km/h: 0,40 đến 9,40
  12. mưa - mưa bên ngoài tính bằng mm/m2 : 0,0 đến 6,4
  13. diện tích - diện tích rừng bị cháy (tính bằng ha): 0,00 đến 1090,84 (biến đầu ra này rất lệch về 0,0, do đó có thể hợp lý khi mô hình hóa bằng biến đổi logarit).
Tách ra ví dụ
'train' 517
  • Cấu trúc tính năng :
FeaturesDict({
    'area': float32,
    'features': FeaturesDict({
        'DC': float32,
        'DMC': float32,
        'FFMC': float32,
        'ISI': float32,
        'RH': float32,
        'X': uint8,
        'Y': uint8,
        'day': ClassLabel(shape=(), dtype=int64, num_classes=7),
        'month': ClassLabel(shape=(), dtype=int64, num_classes=12),
        'rain': float32,
        'temp': float32,
        'wind': float32,
    }),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
diện tích tenxơ phao32
Tính năng, đặc điểm Tính năngDict
tính năng/DC tenxơ phao32
tính năng/DMC tenxơ phao32
tính năng/FFMC tenxơ phao32
tính năng/ISI tenxơ phao32
tính năng/RH tenxơ phao32
tính năng/X tenxơ uint8
tính năng/Y tenxơ uint8
tính năng/ngày LớpNhãn int64
tính năng/tháng LớpNhãn int64
tính năng / mưa tenxơ phao32
tính năng/nhiệt độ tenxơ phao32
tính năng/gió tenxơ phao32
  • trích dẫn :
@misc{Dua:2019 ,
author = "Dua, Dheeru and Graff, Casey",
year = "2017",
title = "{UCI} Machine Learning Repository",
url = "http://archive.ics.uci.edu/ml",
institution = "University of California, Irvine, School of Information and Computer Sciences" }

@article{cortez2007data,
  title={A data mining approach to predict forest fires using meteorological data},
  author={Cortez, Paulo and Morais, Anibal de Jesus Raimundo},
  year={2007},
  publisher={Associa{\c{c} }{\~a}o Portuguesa para a Intelig{\^e}ncia Artificial (APPIA)}
}