opinioni_astratti

Descrizione :

Esistono due sottoset di dati:

(1) RottenTomatoes: i critici cinematografici e il consenso sono stati scansionati da http://rottentomatoes.com/ Ha campi di "_movie_name", "_movie_id", "_critics" e "_critic_consensus".

(2) IDebate: gli argomenti scansionati da http://idebate.org/ Ha campi di "_debate_name", "_debate_id", "_claim", "_claim_id", "_argument_sentences".

Vedi anche https://web.eecs.umich.edu/~wangluxy/datasets/opinion_README.txt

Pagina iniziale : https://web.eecs.umich.edu/~wangluxy/data.html
Codice sorgente : tfds.datasets.opinion_abstracts.Builder
Versioni :
- 1.0.0 (impostazione predefinita): nessuna nota di rilascio.
Dimensione del download : 20.08 MiB
Auto-cache ( documentazione ): Sì
Figura ( tfds.show_examples ): non supportato.
Citazione :

@inproceedings{wang-ling-2016-neural,
    title = "Neural Network-Based Abstract Generation for Opinions and Arguments",
    author = "Wang, Lu  and
      Ling, Wang",
    booktitle = "Proceedings of the 2016 Conference of the North {A}merican Chapter of the Association for Computational Linguistics: Human Language Technologies",
    month = jun,
    year = "2016",
    address = "San Diego, California",
    publisher = "Association for Computational Linguistics",
    url = "https://www.aclweb.org/anthology/N16-1007",
    doi = "10.18653/v1/N16-1007",
    pages = "47--57",
}

opinion_abstracts/rotten_tomatoes (configurazione predefinita)

Descrizione della configurazione : critici professionisti e consenso di 3.731 film.
Dimensione del set di dati : 50.10 MiB
Divisioni :

Diviso	Esempi
`'train'`	3.731

Struttura delle caratteristiche :

FeaturesDict({
    '_critic_consensus': string,
    '_critics': Sequence({
        'key': string,
        'value': string,
    }),
    '_movie_id': string,
    '_movie_name': string,
})

Documentazione delle funzionalità :

Caratteristica	Classe	Tipo D
	CaratteristicheDict
_critic_consensus	Tensore	corda
_critici	Sequenza
_critici/chiave	Tensore	corda
_critica/valore	Tensore	corda
_film_id	Tensore	corda
_nome_film	Tensore	corda

Chiavi supervisionate (vedi as_supervised doc ): ('_critics', '_critic_consensus')
Esempi ( tfds.as_dataframe ):

opinion_abstracts/idebate

Descrizione della configurazione : 2.259 reclami per 676 dibattiti.
Dimensione del set di dati : 3.15 MiB
Divisioni :

Diviso	Esempi
`'train'`	2.259

Struttura delle caratteristiche :

FeaturesDict({
    '_argument_sentences': Sequence({
        'key': string,
        'value': string,
    }),
    '_claim': string,
    '_claim_id': string,
    '_debate_name': string,
})

Documentazione delle funzionalità :

Caratteristica	Classe	Tipo D
	CaratteristicheDict
_argomento_frasi	Sequenza
_argomento_frasi/chiave	Tensore	corda
_argomento_frasi/valore	Tensore	corda
_reclamo	Tensore	corda
_claim_id	Tensore	corda
_nome_dibattito	Tensore	corda

Chiavi supervisionate (vedi as_supervised doc ): ('_argument_sentences', '_claim')
Esempi ( tfds.as_dataframe ):

opinioni_astratti Mantieni tutto organizzato con le raccolte Salva e classifica i contenuti in base alle tue preferenze.

opinion_abstracts/rotten_tomatoes (configurazione predefinita)

opinion_abstracts/idebate

opinioni_astratti