Karima Meftouh

Modélisation statistique de la langue Arabe

Une expérience. Paperback. Sprache: Französisch.
kartoniert , 104 Seiten
ISBN 6131597561
EAN 9786131597565
Veröffentlicht Oktober 2011
Verlag/Hersteller Éditions universitaires européennes
39,00 inkl. MwSt.
Lieferbar innerhalb von 5-7 Tagen (Versand mit Deutscher Post/DHL)
Teilen
Beschreibung

Ce manuscrit expose le travail de recherche effectué dans le cadre de ma thèse de doctorat et qui s'intéresse au traitement automatique de la langue Arabe. Il décrit d'abord l'outil conçu pour la construction de corpus de l'Arabe; cet outil permet de recueillir automatiquement une liste de site, extrait leur contenu et le normalise. Le corpus ainsi constitué peut être utilisé dans diverses applications de TAL et plus particulièrement dans le calcul de modèles statistiques. Il présente ensuite les expérimentations menées en terme de modélisation statistique et qui ont pour objectif de trouver comment modéliser le mieux la langue Arabe . Le manque de données m'a conduit à entreprendre d'autres solutions sans pour cela augmenté la taille du corpus. J'ai procédé à une segmentation des mots du corpus afin d'augmenter sa viabilité statistique. une meilleure performance en terme de perplexité normalisée fut constatée. Finalement, ce livre expose les résultats d'une étude comparative des modèles statistiques de l'Arabe et ceux d'autres langues à savoir le Français, l'Anglais, le Grec, le Portugais et le Finnois.

Portrait

est enseignant chercheur depuis 2001 à l'université Badji Mokhtar à Annaba-Algérie. Elle s'intéresse au traitement automatique des langues naturelles et en particulier l'Arabe en tant que langue maternelle. Actuellement elle s'est orientée vers la traduction automatique de l'Arabe standard au dialecte Algérien.

Hersteller
Éditions universitaires européennes

-
Tel.:
E-Mail: info@bod.de
Website: