- Açıklama :
Belirgin açıklıklar etiketli Wikipedia cümleleri.
Ana Sayfa : https://www.tensorflow.org/datasets/catalog/salient_span_wikipedia
Kaynak kodu :
tfds.datasets.salient_span_wikipedia.Builder
sürümler :
-
1.0.0
(varsayılan): Sürüm notu yok.
-
İndirme boyutu :
Unknown size
Otomatik önbelleğe alınmış ( belgeleme ): Hayır
Denetlenen anahtarlar (Bkz
as_supervised
doc ):None
Şekil ( tfds.show_examples ): Desteklenmiyor.
Alıntı :
@article{guu2020realm,
title={REALM: Retrieval-Augmented Language Model Pre-Training},
author={Kelvin Guu and Kenton Lee and Zora Tung and Panupong Pasupat and Ming-Wei Chang},
year={2020},
journal = {arXiv e-prints},
archivePrefix = {arXiv},
eprint={2002.08909},
}
salient_span_wikipedia/sentences (varsayılan yapılandırma)
Yapılandırma açıklaması : Örnekler, varlıkları içeren bireysel cümlelerdir.
Veri kümesi boyutu :
20.57 GiB
bölmeler :
Bölmek | örnekler |
---|---|
'train' | 82.291.706 |
- Özellik yapısı :
FeaturesDict({
'spans': Sequence({
'limit': int32,
'start': int32,
'type': string,
}),
'text': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Açıklama |
---|---|---|---|---|
ÖzelliklerDict | ||||
açıklıklar | Sıra | |||
aralıklar/sınır | tensör | int32 | ||
açıklıklar/başlangıç | tensör | int32 | ||
yayılma/tür | tensör | sicim | ||
metin | Metin | sicim | ||
Başlık | Metin | sicim |
- Örnekler ( tfds.as_dataframe ):
salient_span_wikipedia/belgeler
Yapılandırma açıklaması : Örnekler tam belgelerdir.
Veri kümesi boyutu :
16.52 GiB
bölmeler :
Bölmek | örnekler |
---|---|
'train' | 13.353.718 |
- Özellik yapısı :
FeaturesDict({
'sentences': Sequence({
'limit': int32,
'start': int32,
}),
'spans': Sequence({
'limit': int32,
'start': int32,
'type': string,
}),
'text': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Açıklama |
---|---|---|---|---|
ÖzelliklerDict | ||||
cümleler | Sıra | |||
cümleler/sınır | tensör | int32 | ||
cümleler/başlangıç | tensör | int32 | ||
açıklıklar | Sıra | |||
aralıklar/sınır | tensör | int32 | ||
açıklıklar/başlangıç | tensör | int32 | ||
yayılma/tür | tensör | sicim | ||
metin | Metin | sicim | ||
Başlık | Metin | sicim |
- Örnekler ( tfds.as_dataframe ):