I sofisticati modelli di deep learning hanno milioni di parametri (pesi) e l'addestramento da zero spesso richiede grandi quantità di dati e risorse di calcolo. Il trasferimento dell'apprendimento è una tecnica che riduce gran parte di questo prendendo un pezzo di un modello che è già stato addestrato su un'attività correlata e riutilizzandolo in un nuovo modello.
Ad esempio, il prossimo tutorial in questa sezione ti mostrerà come costruire il tuo riconoscitore di immagini che sfrutta un modello già addestrato per riconoscere migliaia di diversi tipi di oggetti all'interno delle immagini. È possibile adattare le conoscenze esistenti nel modello pre-addestrato per rilevare le proprie classi di immagini utilizzando una quantità di dati di addestramento molto inferiore a quella richiesta dal modello originale.
Ciò è utile per lo sviluppo rapido di nuovi modelli e per la personalizzazione dei modelli in ambienti con risorse limitate come browser e dispositivi mobili.
Molto spesso, quando trasferiamo l'apprendimento, non regoliamo i pesi del modello originale. Invece rimuoviamo il livello finale e addestriamo un nuovo modello (spesso abbastanza superficiale) sopra l'output del modello troncato. Questa è la tecnica che vedrai dimostrata nei tutorial in questa sezione:
- Crea un classificatore di immagini basato sull'apprendimento del trasferimento
- Crea un sistema di riconoscimento audio basato sull'apprendimento del trasferimento
Per un ulteriore esempio di trasferimento dell'apprendimento tramite TensorFlow.js, consulta Utilizzare un modello pre-addestrato .