Sentiment Analysis - Project Details

📋 Aperçu du projet

Chez Orange, une fois par an les managers et RH remplissentles évaluations des collaborateurs, notamment sur leur potentiel et performace (et bien d'autres).

Ma mission était de réaliser un modèle qui est capable de détecter si un commentaire est positif ou négatif. Le résultat de mon travil était un fichier excel qui contient :

Les commentaires initiaux saisis dans les champs (deux colonnes),
Un indicateur de sensibilité du commentaire : 'positif', 'négatif' ou 'négatif situation particulière!' si le commentaire évoque des éléments liés à la situation personnelle du collaborateur,
Une note associée à chaque commentaire,
Le score le plus bas entre les deux commentaires, pour faire ressortir les cas les plus sensibles.

les commentaires étant rédigés dans plusieurs langues, j'ai testé différents modèles linguistiques afin d'identifier la combinaison offrant les meilleurs résultats. J'ai finalement opté pour une approche mixte : un modèle dédié pour le français, un autre pour l'anglais, et un modèle multilingue pour les autres langues. Ce choix s'est révélé plus pertinent, car l'utilisation d'un modèle multilingue unique sur l'ensemble des commentaires produisait des résultats moins précis.

Pour des raisons de confidentialité, je ne peux pas présenter le code et le résultat de ce travail.

Technologies

Python, NLTK, TensorFlow

Dataset

100,000+ évaluations

Accuracy

85%+

Etat

Terminé ✅

🔬 Méthodologie

Récupération du fichier Data

le fichier récupéré vient de du responsable RH qui est un fichier confidentiel.

Prétraitement

Nettoyage et normalisation du texte
Tokenisation et lemmatisation
Suppression des mots vides et du bruit
Gestion des mots et caractères spéciaux

Extraction des caractéristiques

j'ai utilisé plusieurs techniques d'extraction de caractéristiques, notamment la vectorisation, les embedding de mots, et les modèles basés sur les transformers(BERT) pour capturer le sens sémantique et le contexte.

Analyse des sentiments

📋 Aperçu du projet

🔬 Méthodologie

Récupération du fichier Data

Prétraitement

Extraction des caractéristiques