aula final pública Skipgram
Analisa um arquivo de texto e cria um lote de exemplos.
Classes aninhadas
aula | Skipgram.Opções | Atributos opcionais para Skipgram |
Métodos Públicos
Skipgram estático | |
Saída <Inteiro> | época atual () O número da época atual. |
Saída <Inteiro> | exemplos () Um vetor de IDs de palavras. |
Saída <Inteiro> | rótulos () Um vetor de IDs de palavras. |
Skipgram.Options estático | minCount (minCount longo) |
Skipgram.Options estático | subamostra (subamostra flutuante) |
Saída <Longa> | totalPalavrasProcessadas () O número total de palavras processadas até agora. |
Saída <Inteiro> | vocabulárioFreq () Frequências de palavras. |
Saída <String> | vocabulárioPalavra () Um vetor de palavras no corpus. |
Skipgram.Options estático | windowSize (janela longa) |
Saída <Longa> | palavrasPorÉpoca () Número de palavras por época no arquivo de dados. |
Métodos herdados
Métodos Públicos
public static Skipgram create ( Escopo do escopo , String nome do arquivo, Long batchSize, Opções... opções)
Método de fábrica para criar uma classe que envolve uma nova operação Skipgram.
Parâmetros
escopo | escopo atual |
---|---|
nome do arquivo | O nome do arquivo de texto do corpus. |
tamanho do batch | O tamanho do lote produzido. |
opções | carrega valores de atributos opcionais |
Devoluções
- uma nova instância do Skipgram
público estático Skipgram.Options minCount (Long minCount)
Parâmetros
contagem mínima | O número mínimo de ocorrências de palavras para que ela seja incluída no vocabulário. |
---|
subamostra pública estática Skipgram.Options (subamostra flutuante)
Parâmetros
subamostra | Limite para ocorrência de palavras. Palavras que aparecem com maior frequência serão amostradas aleatoriamente. Defina como 0 para desativar. |
---|
público estático Skipgram.Options windowSize (longo windowSize)
Parâmetros
tamanho da janela | O número de palavras a serem previstas à esquerda e à direita do alvo. |
---|