Analiza un archivo de texto y crea un lote de ejemplos.
Clases anidadas
| clase | Skipgram.Options | Los atributos opcionales para Skipgram | |
Métodos públicos
| estática Skipgram | crear ( Alcance alcance, la cadena de nombre de archivo, Long batchSize, Opciones ... Opciones) Método de fábrica para crear una clase que envuelva una nueva operación de Skipgram. |
| Salida <Integer> | currentEpoch () El número de época actual. |
| Salida <Integer> | ejemplos () Un vector de identificadores de palabras. |
| Salida <Integer> | etiquetas () Un vector de identificadores de palabras. |
| estáticas Skipgram.Options | minCount (Long minCount) |
| estáticas Skipgram.Options | submuestra (submuestra Float) |
| Salida <Larga> | totalWordsProcessed () El número total de palabras procesadas hasta el momento. |
| Salida <Integer> | vocabFreq () Frecuencias de palabras. |
| Salida <String> | vocabWord () Un vector de palabras en el corpus. |
| estáticas Skipgram.Options | windowSize (Long windowSize) |
| Salida <Larga> | wordsPerEpoch () Número de palabras por época en el archivo de datos. |
Métodos heredados
Métodos públicos
public static Skipgram crear ( Alcance alcance, la cadena de nombre de archivo, Long batchSize, Opciones ... Opciones)
Método de fábrica para crear una clase que envuelva una nueva operación de Skipgram.
Parámetros
| alcance | alcance actual |
|---|---|
| nombre del archivo | El nombre del archivo de texto del corpus. |
| tamaño del lote | El tamaño del lote producido. |
| opciones | lleva valores de atributos opcionales |
Devoluciones
- una nueva instancia de Skipgram
public static Skipgram.Options minCount (Long minCount)
Parámetros
| minCount | El número mínimo de ocurrencias de palabras para que se incluyan en el vocabulario. |
|---|
public static Skipgram.Options submuestra (Float submuestra)
Parámetros
| submuestra | Umbral de ocurrencia de palabras. Las palabras que aparecen con mayor frecuencia se muestrearán aleatoriamente. Establecer en 0 para deshabilitar. |
|---|
pública de salida <Larga> totalWordsProcessed ()
El número total de palabras procesadas hasta el momento.
pública de salida <Integer> vocabFreq ()
Frecuencias de palabras. Clasificados en orden no ascendente.
public static Skipgram.Options windowSize (Long windowSize)
Parámetros
| tamaño de ventana | El número de palabras para predecir a la izquierda y derecha del objetivo. |
|---|