Ragupathy K, Arun M, Anand T

Apprendimento profondo per la classificazione del segnale vocale

Un approccio CNN-LSTM. Sprache: Italienisch.
kartoniert , 56 Seiten
ISBN 6204189336
EAN 9786204189338
Veröffentlicht April 2025
Verlag/Hersteller Edizioni Sapienza
43,90 inkl. MwSt.
Mit click & collect abholbar: - in 4-6 Werktagen in der Buchhandlung
Lieferbar innerhalb von 3-5 Tagen (Versand mit Deutscher Post/DHL)
Teilen
Beschreibung

La classificazione dei segnali vocali svolge un ruolo cruciale nel riconoscimento del parlato, nell'identificazione dei parlanti, nel rilevamento delle emozioni e nell'elaborazione audio. Questo libro fornisce una guida completa per sfruttare le tecniche di deep learning, in particolare le reti neurali convoluzionali (CNN) e le reti LSTM (Long Short-Term Memory), per una classificazione efficace dei segnali vocali.Argomenti principali trattati:Fondamenti dell'elaborazione del parlato - Comprensione dei segnali vocali, degli spettrogrammi e delle tecniche di estrazione delle caratteristiche come le MFCC. Introduzione al Deep Learning - Panoramica delle reti neurali, delle CNN per l'estrazione delle caratteristiche e delle LSTM per la cattura delle dipendenze temporali.Modello ibrido CNN-LSTM - Un approccio graduale alla combinazione di CNN e LSTM per migliorare la precisione della classificazione del parlato.

Portrait

Il dott. Ragupathy K ha conseguito un dottorato di ricerca in ingegneria meccanica ed è un illustre membro della facoltà presso l'Agni College of Technology. La sua esperienza di ricerca riguarda i materiali compositi a matrice metallica di alluminio, concentrandosi sul miglioramento delle loro proprietà per applicazioni ingegneristiche avanzate.