forest_fires

  • คำอธิบาย :

นี่คือภารกิจการถดถอย โดยมีจุดมุ่งหมายเพื่อทำนายพื้นที่ที่ถูกไฟไหม้ป่าในภาคตะวันออกเฉียงเหนือของโปรตุเกส โดยใช้ข้อมูลทางอุตุนิยมวิทยาและข้อมูลอื่นๆ

ข้อมูลชุดข้อมูล:

ใน [Cortez and Morais, 2007] เอาต์พุต 'พื้นที่' ถูกแปลงเป็นอันดับแรกด้วยฟังก์ชัน ln(x+1) จากนั้นจึงใช้วิธีการขุดข้อมูลหลายวิธี หลังจากติดตั้งโมเดลแล้ว ผลลัพธ์จะถูกประมวลผลภายหลังด้วยการผกผันของการแปลง ln(x+1) ใช้การตั้งค่าอินพุตสี่แบบที่แตกต่างกัน การทดลองดำเนินการโดยใช้การรัน 10 เท่า (การตรวจสอบข้าม) x 30 ครั้ง วัดการถดถอยสองรายการ: MAD และ RMSE เครื่อง Gaussian support vector machine (SVM) ที่เลี้ยงด้วยสภาพอากาศโดยตรงเพียง 4 สภาวะ (อุณหภูมิ RH ลม และฝน) ได้ค่า MAD ที่ดีที่สุด: 12.71 +- 0.01 (ค่าเฉลี่ยและช่วงความเชื่อมั่นภายใน 95% โดยใช้การแจกแจงแบบ t-student) RMSE ที่ดีที่สุดได้มาจากตัวทำนายค่าเฉลี่ยไร้เดียงสา การวิเคราะห์เส้นโค้งข้อผิดพลาดการถดถอย (REC) แสดงให้เห็นว่าแบบจำลอง SVM คาดการณ์ตัวอย่างเพิ่มเติมภายในข้อผิดพลาดที่ยอมรับได้ต่ำกว่า ผลก็คือ แบบจำลอง SVM ทำนายการเกิดไฟไหม้ขนาดเล็กได้ดีกว่า ซึ่งเป็นส่วนใหญ่

ข้อมูลแอตทริบิวต์:

สำหรับข้อมูลเพิ่มเติม โปรดอ่าน [Cortez and Morais, 2007]

  1. X - พิกัดเชิงพื้นที่แกน x ภายในแผนที่สวน Montesinho: 1 ถึง 9
  2. Y - พิกัดเชิงพื้นที่แกน y ภายในแผนที่สวน Montesinho: 2 ถึง 9
  3. เดือน - เดือนของปี: 'ม.ค.' ถึง 'ธ.ค.'
  4. วัน - วันในสัปดาห์: 'mon' ถึง 'sun'
  5. FFMC - ดัชนี FFMC จากระบบ FWI: 18.7 ถึง 96.20
  6. DMC - ดัชนี DMC จากระบบ FWI: 1.1 ถึง 291.3
  7. DC - ดัชนี DC จากระบบ FWI: 7.9 ถึง 860.6
  8. ISI - ดัชนี ISI จากระบบ FWI: 0.0 ถึง 56.10
  9. อุณหภูมิ - อุณหภูมิเป็นองศาเซลเซียส: 2.2 ถึง 33.30
  10. RH - ความชื้นสัมพัทธ์เป็น %: 15.0 ถึง 100
  11. ลม - ความเร็วลมเป็นกม./ชม.: 0.40 ถึง 9.40
  12. ฝน - ฝนภายนอกหน่วยเป็น มม./ตร.ม. : 0.0 ถึง 6.4
  13. พื้นที่ - พื้นที่ป่าที่ถูกไฟไหม้ (หน่วยเป็นเฮกตาร์): 0.00 ถึง 1,090.84 (ตัวแปรเอาต์พุตนี้เบ้ไปทาง 0.0 มาก ดังนั้นจึงเหมาะสมที่จะจำลองด้วยการแปลงลอการิทึม)
แยก ตัวอย่าง
'train' 517
  • โครงสร้างคุณลักษณะ :
FeaturesDict({
    'area': float32,
    'features': FeaturesDict({
        'DC': float32,
        'DMC': float32,
        'FFMC': float32,
        'ISI': float32,
        'RH': float32,
        'X': uint8,
        'Y': uint8,
        'day': ClassLabel(shape=(), dtype=int64, num_classes=7),
        'month': ClassLabel(shape=(), dtype=int64, num_classes=12),
        'rain': float32,
        'temp': float32,
        'wind': float32,
    }),
})
  • เอกสารคุณสมบัติ :
ลักษณะเฉพาะ ระดับ รูปร่าง Dประเภท คำอธิบาย
คุณสมบัติDict
พื้นที่ เทนเซอร์ ลอย32
คุณสมบัติ คุณสมบัติDict
คุณสมบัติ/DC เทนเซอร์ ลอย32
คุณสมบัติ/DMC เทนเซอร์ ลอย32
คุณสมบัติ/FFMC เทนเซอร์ ลอย32
คุณสมบัติ/ISI เทนเซอร์ ลอย32
คุณสมบัติ/RH เทนเซอร์ ลอย32
คุณสมบัติ/X เทนเซอร์ uint8
คุณสมบัติ/ย เทนเซอร์ uint8
คุณสมบัติ/วัน ป้ายกำกับคลาส int64
คุณสมบัติ/เดือน ป้ายกำกับคลาส int64
คุณสมบัติ/ฝน เทนเซอร์ ลอย32
คุณสมบัติ/อุณหภูมิ เทนเซอร์ ลอย32
คุณสมบัติ/ลม เทนเซอร์ ลอย32
  • การอ้างอิง :
@misc{Dua:2019 ,
author = "Dua, Dheeru and Graff, Casey",
year = "2017",
title = "{UCI} Machine Learning Repository",
url = "http://archive.ics.uci.edu/ml",
institution = "University of California, Irvine, School of Information and Computer Sciences" }

@article{cortez2007data,
  title={A data mining approach to predict forest fires using meteorological data},
  author={Cortez, Paulo and Morais, Anibal de Jesus Raimundo},
  year={2007},
  publisher={Associa{\c{c} }{\~a}o Portuguesa para a Intelig{\^e}ncia Artificial (APPIA)}
}