mahzan

Referanslar:

Bu veri kümesini TFDS'ye yüklemek için aşağıdaki komutu kullanın:

ds = tfds.load('huggingface:makhzan')
  • Tanım :
An Urdu text corpus for machine learning, natural language processing and linguistic analysis.
  • Lisans : /text dizinindeki tüm dosyalar standart telif hakkı kapsamındadır. Metnin her bir parçası, bu arşivde belirtilen ilgili telif hakkı sahiplerinin açık izniyle dahil edilmiştir. Her dosya için etiket. Bu metni analiz, araştırma ve geliştirme amacıyla kullanmakta özgürsünüz ancak bu metni yeniden dağıtmanıza veya yeniden yayınlamanıza izin verilmez. /text dizinindeki dosyalara daha az kısıtlayıcı bir lisansın uygulanabileceği bazı durumlar aşağıda sunulmuştur. Bazı durumlarda telif hakkı olmayan metinler, ortak çalışanlarımızın sıkı çalışmasıyla dijital olarak çoğaltılmıştır. Bu tür durumlarda, mümkün olduğu ölçüde dosyanın meta verilerindeki bir not alanına uygun kişilerin adını verdik ve bu metni herhangi bir biçimde yeniden dağıtmadan önce bu kişilerle iletişime geçmenizi önemle tavsiye ederiz. Metinle birlikte ayrı bir lisansın sağlandığı durumlarda, yayın alanında ilgili verileri bir dosyanın meta verisinde sağladık.
  • Sürüm : 1.0.0
  • Bölünmeler :
Bölmek Örnekler
'train' 5522
  • Özellikler :
{
    "file_id": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "metadata": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "title": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "num-words": {
        "dtype": "int64",
        "id": null,
        "_type": "Value"
    },
    "contains-non-urdu-languages": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "document_body": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    }
}