हिला देेंगे

  • विवरण :

इस डेटासेट में 14,344,391 पासवर्ड हैं जो विभिन्न साइटों से लीक या चोरी हो गए थे। इस डेटासेट के लेखक का कहना है कि "मैं उन्हें होस्ट कर रहा हूं क्योंकि ऐसा लगता है कि कोई और नहीं करता है (उम्मीद है कि ऐसा इसलिए नहीं है क्योंकि उन्हें होस्ट करना अवैध है :))। स्वाभाविक रूप से, मैं वह नहीं हूं जिसने इन्हें चुराया है; मैंने बस पाया उन्हें ऑनलाइन, किसी भी नाम/ईमेल पते/आदि को हटा दिया।"।

इस डेटासेट का उपयोग मशीन लर्निंग मॉडल को पासवर्ड अनुमान लगाने और क्रैक करने के लिए प्रशिक्षित करने के लिए किया जाता है।

विभाजित करना उदाहरण
'train' 14,344,391
  • फ़ीचर संरचना :
FeaturesDict({
    'password': Text(shape=(), dtype=string),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
विशेषताएं डिक्ट
पासवर्ड मूलपाठ डोरी
  • उद्धरण :