Analiza un archivo de texto y crea un lote de ejemplos.
Clases anidadas
clase | Skipgram.Options | Los atributos opcionales para Skipgram |
Métodos públicos
estática Skipgram | crear ( Alcance alcance, la cadena de nombre de archivo, Long batchSize, Opciones ... Opciones) Método de fábrica para crear una clase que envuelva una nueva operación de Skipgram. |
Salida <Integer> | currentEpoch () El número de época actual. |
Salida <Integer> | ejemplos () Un vector de identificadores de palabras. |
Salida <Integer> | etiquetas () Un vector de identificadores de palabras. |
estáticas Skipgram.Options | minCount (Long minCount) |
estáticas Skipgram.Options | submuestra (submuestra Float) |
Salida <Larga> | totalWordsProcessed () El número total de palabras procesadas hasta el momento. |
Salida <Integer> | vocabFreq () Frecuencias de palabras. |
Salida <String> | vocabWord () Un vector de palabras en el corpus. |
estáticas Skipgram.Options | windowSize (Long windowSize) |
Salida <Larga> | wordsPerEpoch () Número de palabras por época en el archivo de datos. |
Métodos heredados
Métodos públicos
public static Skipgram crear ( Alcance alcance, la cadena de nombre de archivo, Long batchSize, Opciones ... Opciones)
Método de fábrica para crear una clase que envuelva una nueva operación de Skipgram.
Parámetros
alcance | alcance actual |
---|---|
nombre del archivo | El nombre del archivo de texto del corpus. |
tamaño del lote | El tamaño del lote producido. |
opciones | lleva valores de atributos opcionales |
Devoluciones
- una nueva instancia de Skipgram
public static Skipgram.Options minCount (Long minCount)
Parámetros
minCount | El número mínimo de ocurrencias de palabras para que se incluyan en el vocabulario. |
---|
public static Skipgram.Options submuestra (Float submuestra)
Parámetros
submuestra | Umbral de ocurrencia de palabras. Las palabras que aparecen con mayor frecuencia se muestrearán aleatoriamente. Establecer en 0 para deshabilitar. |
---|
pública de salida <Larga> totalWordsProcessed ()
El número total de palabras procesadas hasta el momento.
pública de salida <Integer> vocabFreq ()
Frecuencias de palabras. Clasificados en orden no ascendente.
public static Skipgram.Options windowSize (Long windowSize)
Parámetros
tamaño de ventana | El número de palabras para predecir a la izquierda y derecha del objetivo. |
---|