- Açıklama :
BIGPATENT, 1,3 milyon ABD patent belgesi kaydından ve insan tarafından yazılmış soyutlayıcı özetlerden oluşur. Her ABD patent başvurusu, bir Ortak Patent Sınıflandırması (CPC) kodu altında yapılır. Bu tür dokuz sınıflandırma kategorisi vardır:
- A (İnsani İhtiyaçlar),
- B (İşlemleri Gerçekleştirme; Taşıma),
- C (Kimya; Metalurji),
- D (Tekstil; Kağıt),
- E (Sabit Konstrüksiyonlar),
- F (Makine Mühendisliği; Yıldırım; Isıtma; Silahlar; Patlatma),
- G (Fizik),
- H (Elektrik) ve
- Y (Yeni veya çapraz kesitli teknolojinin genel etiketlemesi)
İki özellik vardır:
- açıklama: patentin ayrıntılı açıklaması.
özet: Patent özeti.
Ana Sayfa : https://evasharma.github.io/bigpatent/
Kaynak kodu :
tfds.datasets.big_patent.Builder
sürümler :
-
1.0.0
: küçük harfli simgeleştirilmiş sözcükler -
2.0.0
: Büyük/küçük harfli ham dizeleri kullanmak için güncelleme -
2.1.2
(varsayılan): Büyük/küçük harfli ham dizilere yönelik güncellemeyi düzeltin.
-
İndirme boyutu :
9.45 GiB
Otomatik önbelleğe alınmış ( belgeleme ): Hayır
Özellik yapısı :
FeaturesDict({
'abstract': Text(shape=(), dtype=string),
'description': Text(shape=(), dtype=string),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
soyut | Metin | sicim | ||
Tanım | Metin | sicim |
Denetimli anahtarlar (Bkz.
as_supervised
doc ):('description', 'abstract')
Şekil ( tfds.show_examples ): Desteklenmiyor.
Alıntı :
@misc{sharma2019bigpatent,
title={BIGPATENT: A Large-Scale Dataset for Abstractive and Coherent Summarization},
author={Eva Sharma and Chen Li and Lu Wang},
year={2019},
eprint={1906.03741},
archivePrefix={arXiv},
primaryClass={cs.CL}
}
big_patent/all (varsayılan yapılandırma)
Yapılandırma açıklaması : Tüm kategoriler altındaki patentler.
Veri kümesi boyutu :
35.17 GiB
bölmeler :
Bölmek | örnekler |
---|---|
'test' | 67.072 |
'train' | 1.207.222 |
'validation' | 67.068 |
- Örnekler ( tfds.as_dataframe ):
big_patent/a
Yapılandırma açıklaması : İşbirlikçi Patent Sınıflandırması (CPC)a kapsamındaki Patentler: İnsani Gereklilikler
Veri kümesi boyutu :
5.16 GiB
bölmeler :
Bölmek | örnekler |
---|---|
'test' | 9.675 |
'train' | 174.134 |
'validation' | 9.674 |
- Örnekler ( tfds.as_dataframe ):
big_patent/b
Yapılandırma açıklaması : İşbirliğine Dayalı Patent Sınıflandırması (CPC)b kapsamındaki Patentler: İşlemlerin Gerçekleştirilmesi; taşıma
Veri kümesi boyutu :
4.06 GiB
bölmeler :
Bölmek | örnekler |
---|---|
'test' | 8.974 |
'train' | 161.520 |
'validation' | 8.973 |
- Örnekler ( tfds.as_dataframe ):
büyük_patent/c
Yapılandırma açıklaması : Ortak Patent Sınıflandırması (CPC)c kapsamındaki patentler: Kimya; metalurji
Veri kümesi boyutu :
3.63 GiB
bölmeler :
Bölmek | örnekler |
---|---|
'test' | 5.614 |
'train' | 101.042 |
'validation' | 5.613 |
- Örnekler ( tfds.as_dataframe ):
büyük_patent/d
Yapılandırma açıklaması : Kooperatif Patent Sınıflandırması (CPC)d kapsamındaki patentler: Tekstiller; Kağıt
Veri kümesi boyutu :
255.56 MiB
bölmeler :
Bölmek | örnekler |
---|---|
'test' | 565 |
'train' | 10.164 |
'validation' | 565 |
- Örnekler ( tfds.as_dataframe ):
big_patent/e
Yapılandırma açıklaması : Ortak Patent Sınıflandırması (CPC)e kapsamındaki Patentler: Sabit Yapılar
Veri kümesi boyutu :
871.40 MiB
bölmeler :
Bölmek | örnekler |
---|---|
'test' | 1.914 |
'train' | 34.443 |
'validation' | 1.914 |
- Örnekler ( tfds.as_dataframe ):
büyük_patent/f
Yapılandırma açıklaması : Ortak Patent Sınıflandırması (CPC)f kapsamındaki patentler: Makine Mühendisliği; Yıldırım; Isıtma; Silahlar; patlatma
Veri kümesi boyutu :
2.06 GiB
bölmeler :
Bölmek | örnekler |
---|---|
'test' | 4.754 |
'train' | 85.568 |
'validation' | 4.754 |
- Örnekler ( tfds.as_dataframe ):
big_patent/g
Yapılandırma açıklaması : İşbirliğine Dayalı Patent Sınıflandırması (CPC)g: Fizik kapsamındaki patentler
Veri kümesi boyutu :
8.19 GiB
bölmeler :
Bölmek | örnekler |
---|---|
'test' | 14.386 |
'train' | 258.935 |
'validation' | 14.385 |
- Örnekler ( tfds.as_dataframe ):
big_patent/h
Yapılandırma açıklaması : Ortak Patent Sınıflandırması (CPC)h kapsamındaki patentler: Elektrik
Veri kümesi boyutu :
7.50 GiB
bölmeler :
Bölmek | örnekler |
---|---|
'test' | 14.279 |
'train' | 257.019 |
'validation' | 14.279 |
- Örnekler ( tfds.as_dataframe ):
büyük_patent/y
Yapılandırma açıklaması : İşbirlikçi Patent Sınıflandırması (CPC)y kapsamındaki patentler: Yeni veya çapraz kesitli teknolojinin genel etiketlemesi
Veri kümesi boyutu :
3.46 GiB
bölmeler :
Bölmek | örnekler |
---|---|
'test' | 6.911 |
'train' | 124.397 |
'validation' | 6.911 |
- Örnekler ( tfds.as_dataframe ):