← Retour aux projets
💭

Analyse des sentiments

Compréhension des émotions dans le texte grâce au traitement du langage naturel

⚠️ Terminé - projet confidentiel

📋 Aperçu du projet

Chez Orange, une fois par an les managers et RH remplissentles évaluations des collaborateurs, notamment sur leur potentiel et performace (et bien d'autres).

Ma mission était de réaliser un modèle qui est capable de détecter si un commentaire est positif ou négatif. Le résultat de mon travil était un fichier excel qui contient :

  • Les commentaires initiaux saisis dans les champs (deux colonnes),
  • Un indicateur de sensibilité du commentaire : 'positif', 'négatif' ou 'négatif situation particulière!' si le commentaire évoque des éléments liés à la situation personnelle du collaborateur,
  • Une note associée à chaque commentaire,
  • Le score le plus bas entre les deux commentaires, pour faire ressortir les cas les plus sensibles.

les commentaires étant rédigés dans plusieurs langues, j'ai testé différents modèles linguistiques afin d'identifier la combinaison offrant les meilleurs résultats. J'ai finalement opté pour une approche mixte : un modèle dédié pour le français, un autre pour l'anglais, et un modèle multilingue pour les autres langues. Ce choix s'est révélé plus pertinent, car l'utilisation d'un modèle multilingue unique sur l'ensemble des commentaires produisait des résultats moins précis.

Pour des raisons de confidentialité, je ne peux pas présenter le code et le résultat de ce travail.

Technologies
Python, NLTK, TensorFlow
Dataset
100,000+ évaluations
Accuracy
85%+
Etat
Terminé ✅

🔬 Méthodologie

Récupération du fichier Data

le fichier récupéré vient de du responsable RH qui est un fichier confidentiel.

Prétraitement

  • Nettoyage et normalisation du texte
  • Tokenisation et lemmatisation
  • Suppression des mots vides et du bruit
  • Gestion des mots et caractères spéciaux

Extraction des caractéristiques

j'ai utilisé plusieurs techniques d'extraction de caractéristiques, notamment la vectorisation, les embedding de mots, et les modèles basés sur les transformers(BERT) pour capturer le sens sémantique et le contexte.