Josephine Theresa

Amélioration des algorithmes de ML pour les ensembles de données déséquilibrés

Atténuer la distorsion des données déséquilibrées. Sprache: Französisch.
kartoniert , 72 Seiten
ISBN 6208901529
EAN 9786208901523
Veröffentlicht Mai 2025
Verlag/Hersteller Editions Notre Savoir
50,90 inkl. MwSt.
Mit click & collect abholbar: - in 4-6 Werktagen in der Buchhandlung
Lieferbar innerhalb von 3-5 Tagen (Versand mit Deutscher Post/DHL)
Teilen
Beschreibung

La grande quantité de données générées en ligne a permis aux scientifiques de données d'analyser ces informations et d'en tirer des conclusions dans divers domaines. Cependant, les données en temps réel sont souvent sujettes au déséquilibre, ce qui peut dégrader la qualité des données et pose un défi important dans le domaine de l'apprentissage automatique. Les techniques basées sur l'échantillonnage et les modèles basés sur les algorithmes sont deux méthodes principales utilisées pour traiter et équilibrer le déséquilibre des données. Cette thèse présente trois techniques distinctes pour gérer différents niveaux de déséquilibre dans les données en temps réel.L'approche initiale propose une technique basée sur l'échantillonnage intégrée au mécanisme de bagging pour gérer le déséquilibre des données. Le modèle identifie le déséquilibre des données par classe et effectue un suréchantillonnage pour chaque classe disponible. Le mécanisme de mise en sac implique la création de sous-ensembles de données d'apprentissage, visant à varier les niveaux de déséquilibre dans les données d'apprentissage afin de garantir une prédiction efficace. Malgré cela, l'effet du déséquilibre persiste dans le mécanisme de prédiction, entraînant la classification incorrecte de plusieurs classes minoritaires.

Portrait

S. Josephine Theresa est professeur adjoint au St. Joseph's College (autonome), Tiruchirappalli. Elle a 12 ans d'expérience dans l'enseignement. Ses recherches portent sur l'analyse des données, l'apprentissage automatique et l'analyse prédictive. Elle a publié près de sept articles dans des revues nationales et internationales.