बीसीसीडी

  • विवरण :

BCCD डेटासेट रक्त कोशिकाओं का पता लगाने के लिए एक छोटे पैमाने का डेटासेट है।

Cosmicad और akshaylamba के मूल डेटा और एनोटेशन के लिए धन्यवाद। मूल डेटासेट को वीओसी प्रारूप में फिर से व्यवस्थित किया गया है। बीसीसीडी डाटासेट एमआईटी लाइसेंस के तहत है।

मशीन लर्निंग का उपयोग करने के लिए डेटा तैयार करना महत्वपूर्ण है। इस प्रोजेक्ट में, ऑब्जेक्ट डिटेक्शन के लिए keras-frcnn से तेज़ R-CNN एल्गोरिथम का उपयोग किया गया है। इस डेटासेट से, nicolaschen1 ने चिकित्सा छवियों पर रक्त कोशिकाओं में असामान्यताओं की पहचान के लिए तैयारी डेटा (CSV फ़ाइल और छवियां) बनाने के लिए दो पायथन स्क्रिप्ट विकसित कीं।

Export.py: यह आवश्यक सभी डेटा के साथ "test.csv" फ़ाइल बनाता है: फ़ाइल नाम, class_name, X1, y1, x2, y2। plot.py: यह प्रत्येक छवि के लिए बॉक्स प्लॉट करता है और इसे एक नई निर्देशिका में सहेजता है।

छवि प्रकार: जेपीईजी (जेपीईजी) चौड़ाई x ऊँचाई: 640 x 480

विभाजित करना उदाहरण
'test' 72
'train' 205
'validation' 87
  • फ़ीचर संरचना :
FeaturesDict({
    'image': Image(shape=(480, 640, 3), dtype=uint8),
    'image/filename': Text(shape=(), dtype=string),
    'objects': Sequence({
        'bbox': BBoxFeature(shape=(4,), dtype=float32),
        'label': ClassLabel(shape=(), dtype=int64, num_classes=3),
    }),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
विशेषताएं डिक्ट
छवि छवि (480, 640, 3) uint8
छवि/फ़ाइल नाम मूलपाठ डोरी
वस्तुओं क्रम
ऑब्जेक्ट्स/बीबॉक्स बीबॉक्स फीचर (4,) फ्लोट32
ऑब्जेक्ट्स / लेबल क्लासलेबल int64

VISUALIZATION

  • उद्धरण :
@ONLINE {BCCD_Dataset,
    author = "Shenggan",
    title  = "BCCD Dataset",
    year   = "2017",
    url    = "https://github.com/Shenggan/BCCD_Dataset"
}