Guide de l'analyse de texte pour les débutants
3 janvier 2022
Expérience client
Lorsque les clients sont ravis ou déçus par les interactions et l'expérience client d'une marque, il est probable qu'ils aient fourni un retour d'information riche en données. Les données de feedback - qu'elles soient directes, indirectes, structurées ou non - sont omniprésentes.
Qu'il s'agisse d'enquêtes ou d'avis sur les médias sociaux, une organisation a la possibilité d'exploiter les signaux des clients qui orientent la prise de décision et le succès global de l'entreprise.
Cependant, les marques ont souvent du mal à gérer cette masse de données. Il est écrasant (et pratiquement impossible) pour des analystes humains d'examiner manuellement et régulièrement des milliers d'éléments de retour d'information sur une grande variété de canaux.
Mais il existe une solution à ce problème : l'analyse de texte, qui permet de tirer des enseignements des données en classant les commentaires riches en sentiments dans des catégories pertinentes pour l'entreprise.
Qu'est-ce que l'analyse de texte dans le Big Data ?
Dans l'écosystème omnicanal, il existe d'innombrables points de contact entre une marque et ses clients. D'énormes quantités de données sont générées chaque jour, souvent appelées " big data".
L'analyse de texte est l'une des méthodes utilisées pour obtenir des informations à partir de données volumineuses en convertissant des textes non structurés en données structurées.
Plusieurs procédures sont nécessaires pour analyser et comprendre les données textuelles non structurées. Ainsi, l'analyse de texte comprend des processus tels que le nettoyage des données, le prétraitement, l'extraction de caractéristiques et l'apprentissage automatique.
Différence entre Text Analytics et Text Mining
L'analyse de texte et le text mining sont souvent confondus, et il ne fait aucun doute que ces deux sujets sont différents. L'analyse de texte utilise des méthodes statistiques et d'apprentissage automatique pour évaluer les données textuelles et en tirer des enseignements, tandis que le text mining extrait des informations de données non structurées.
Avantages de l'analyse de texte
L'analyse de texte gagne en popularité. Les grandes marques de nombreux secteurs investissent dans des plateformes logicielles de gestion de l'expérience client (CEM) dont l'une des principales fonctionnalités est l 'analyse de texte.
Voici un aperçu des avantages de l'analyse de texte qui améliorent un programme de retour d'information :
- Augmenter les connaissances en posant moins de questions : Les enquêtes longues et fastidieuses peuvent inciter les clients à ne pas donner leur avis, mais l'analyse de texte permet de creuser plus profondément dans les mots des réponses, même courtes, pour révéler le sens de ces mots.
- Aller à la racine du problème : Les scores numériques ne permettent pas toujours de comprendre le "pourquoi" du retour d'information. L'analyse de texte, quant à elle, permet d'obtenir des détails et d'identifier ce qui fonctionne et ce qui est à l'origine d'un problème fréquemment rencontré par les clients.
- Obtenir des informations opportunes : Les employés ont déjà une liste de tâches fastidieuses à accomplir, et leur demander de sonder chaque mot des commentaires des clients n'est pas réaliste. L'analyse de texte prend en charge l'ensemble du processus, et ce avec une fiabilité bien plus grande.
- Identifier les tendances émergentes : Les êtres humains ont besoin de données pour prendre des décisions éclairées et intelligentes. En exploitant les mots et les phrases utilisés par les clients, l'analyse de texte met en lumière les tendances qu'une entreprise ne peut se permettre d'ignorer et dont elle doit tirer parti.
- Comprendre les besoins des clients : Les clients vous diront ce qu'ils veulent, ce dont ils ont besoin et ce qu'ils attendent. Il suffit de les écouter, et l'analyse de texte permet de mettre en évidence les mots-clés, les thèmes et les sentiments.
- Prendre des décisions fondées sur des données : Afin de mieux servir les clients, laissez les informations dérivées de l'analyse de texte offrir une voie à suivre pour la stratégie de l'expérience client.
- Améliorer l'expérience des clients et des employés : Comme pour le CX, l'analyse de texte améliore également l'expérience des employés (EX). L'analyse de texte permet d'analyser les données relatives aux employés, telles que le score d'effort, l'engagement, la satisfaction et le sentiment des employés.
Alors que le volume des informations collectées par les organisations augmente, l'analyse de texte est la seule option pour suivre le mouvement.
Analyse de texte de base
L'analyse de texte varie du plus simple au plus avancé. Le type d'informations que vous obtenez dépend du type d'analyse que vous utilisez.
Au niveau de base, l'analyse de texte implique les éléments suivants.
Analyse de la fréquence des mots
L'analyse de la fréquence des mots compte les mots dans le texte. Cette approche permet de repérer les termes et les thèmes les plus populaires du texte.
Détection de phrases
Outre l'utilisation de mots spécifiques, il existe des phrases que votre public peut utiliser et qui ont une incidence significative sur le sentiment et d'autres éléments clés. La détection des phrases vous permet de trouver des phrases fréquentes dans le texte, ce qui vous permet d'identifier des thèmes.
Analyse des sentiments
À un niveau superficiel, les mots peuvent être trompeurs si vous n'avez pas le contexte. L'un des moyens d'obtenir la bonne perspective est de déterminer les émotions qui y sont associées. C'est là que l'analyse des sentiments entre en jeu. Elle vous aide à déterminer l'émotion d'un texte, ce qui vous permet d'identifier les zones de développement.
Modélisation des thèmes
Lorsque des mots, des phrases et des sentiments se répètent, c'est qu'il y a un thème sous-jacent. La modélisation des thèmes permet d'identifier les thèmes du texte, ce qui vous aide à identifier les idées principales d'un texte.
Analyse de texte avancée
En fonction de la taille et de la nature de votre entreprise, l'analyse de texte de base peut ne pas offrir une vision suffisante. Une analyse de texte avancée peut s'avérer nécessaire.
Reconnaissance des entités nommées
La reconnaissance des entités nommées (NER) identifie et catégorise les personnes, les organisations et les lieux dans le texte. En outre, cette méthode permet d'identifier les liens entre les entités du texte.
Classification des textes
La catégorisation de texte consiste à classer le texte dans différentes catégories. En plus de vous aider à organiser des données textuelles massives, cette méthode permet de trouver des modèles.
Regroupement
Une autre façon d'identifier des modèles dans les données non structurées est de les regrouper. Cette méthode permet de regrouper les textes en fonction de leur contenu, ce qui facilite l'identification des schémas.
Extraction des relations
Bien que ce ne soit pas souvent le cas, certains de vos consommateurs peuvent avoir des relations étroites. Vous pouvez déterminer comment les personnes, les organisations et les lieux sont textuellement liés grâce à l'extraction de relations. Ces informations ajoutent un contexte à leurs conversations, ce qui vous permet d'agir en conséquence.
Analyse des réseaux
Au-delà des relations, vous vous rendrez compte qu'il existe des groupes spécifiques ayant un lien commun. L'analyse de réseau examine les liens textuels pour trouver des modèles et des tendances qui aident à expliquer comment les choses interagissent.
Techniques et applications de l'analyse de texte
L'analyse de texte implique diverses techniques d'analyse de données textuelles non structurées. Outre l'analyse des sujets et l'analyse des sentiments, il existe plusieurs autres techniques que les entreprises peuvent utiliser pour obtenir des informations à partir de leurs données textuelles.
Passons en revue les techniques et les applications de l'analyse de texte.
Analyse du sujet
L'analyse thématique permet de classer les phrases des commentaires des clients dans des catégories pertinentes pour l'entreprise. Par exemple, "le vendeur a été gentil" serait classé dans la catégorie "amabilité du personnel". Il y a généralement deux façons d'y parvenir : une configuration manuelle, une approche basée sur des règles et des techniques d'apprentissage automatique.
Les analystes et les linguistes élaborent manuellement des règles pour la méthode basée sur les règles. Par exemple, une clause contenant deux mots comme "amical" et "employé" peut être placée sous un sujet "Amabilité du personnel".
Ces règles peuvent également évaluer l'ordre des mots et les relations grammaticales entre les mots importants. La procédure de configuration prend du temps, mais les commentaires classés sont exacts puisque chaque règle est construite individuellement.
L'apprentissage automatique, qui utilise la classification et le regroupement supervisés, est également un élément clé de l'analyse des sujets. Par conséquent, un analyste assigne manuellement des sujets à un échantillon de commentaires pour une catégorisation supervisée. À partir de là, l'ensemble de données annotées entraîne le classificateur à étiqueter automatiquement les nouveaux commentaires.
Bien qu'il soit plus facile d'annoter des données que d'élaborer des règles, les classificateurs ne fonctionnent qu'avec moins de dix sujets.
Analyse des sentiments
L'analyse des sentiments permet d'étiqueter les phrases selon qu'elles sont positives ou négatives. L'expression "Le vendeur a été très gentil" est considérée comme positive.
L'analyse des sentiments basée sur un dictionnaire est simple à mettre en place. Elle revient à extraire tous les mots d'un dictionnaire et à attribuer un sentiment positif ou négatif à chacun d'entre eux. Le sentiment des mots change cependant en fonction du contexte.
On pense généralement que les jurons véhiculent des sentiments négatifs, mais dans la communauté des joueurs, par exemple, les choses sont plus floues. Les mots positifs sont souvent utilisés de manière ironique, et les mots négatifs sont en fait porteurs de sentiments positifs lorsqu'ils sont replacés dans leur contexte.
Pour tenir compte du contexte, les techniques d'apprentissage automatique supervisé constituent un bien meilleur moyen d'attribuer un sentiment. À l'instar de la classification supervisée décrite pour l'analyse des thèmes, l'apprentissage automatique supervisé pour l'analyse des sentiments consiste à prendre un échantillon de clauses pour le contexte qui vous intéresse et à attribuer manuellement à chaque clause un sentiment positif ou négatif. À partir de cet ensemble de données annotées, l'algorithme peut ensuite attribuer un sentiment à de nouvelles clauses sur la base de ce qu'il a appris de l'échantillon de commentaires.
Reconnaissance des entités nommées
La reconnaissance des entités nommées (NER) permet d'extraire des personnes, des organisations et des lieux à partir de données textuelles non structurées. La NER peut détecter les personnes et les organisations influentes dans les commentaires des consommateurs et les données des médias sociaux. En outre, la reconnaissance d'entités nommées peut également reconnaître des thèmes et des sujets dans les textes.
Marquage des parties du discours
L'analyse de texte utilise l'étiquetage des parties du discours (POS) pour classer chaque mot d'une phrase. Cette méthode permet d'analyser la grammaire des phrases et de comprendre la littérature.
Analyse des dépendances
L'analyse des dépendances dans l'analyse de texte aide les entreprises à découvrir les liens entre les phrases et la grammaire. En outre, cette méthode permet d'analyser la structure des phrases et de comprendre le contenu.
Classification des textes
La classification de texte utilise le contenu pour classer le texte dans des catégories prédéterminées. Cette méthode permet d'identifier les sujets populaires dans les commentaires des consommateurs et les médias sociaux. En outre, la classification de texte peut également révéler des idées clés.
Comment mener une analyse de texte
L'analyse de texte comprend la collecte de données, le traitement de données, l'analyse de texte et la visualisation.
Voici un peu plus d'informations sur le fonctionnement de chaque étape.
#1. Collecte de données
L'analyse de texte commence par des données provenant des médias sociaux, des formulaires de commentaires des consommateurs et des évaluations en ligne. Assurez-vous que vos données sont pertinentes par rapport à votre défi commercial.
#2. Traitement des données
Après la collecte des données, vient le traitement, le nettoyage et la préparation des données pour l'analyse. Le traitement des données consiste à supprimer les éléments superflus, à les formater et à structurer les données non structurées en vue de leur analyse.
#3. Analyse de texte
Après avoir traité les données, vous devrez les analyser pour en tirer des enseignements. Cela implique l'analyse des sentiments, la modélisation des sujets et l'identification des entités nommées.
#4. La visualisation
Enfin, vous devrez montrer à vos parties prenantes les résultats de l'analyse de texte. Pour ce faire, vous pouvez utiliser des nuages de mots, des diagrammes à barres et des cartes thermiques.
Comment préparer les données textuelles pour l'analyse
La préparation des données pour l'analyse de texte garantit des résultats fiables et compréhensibles.
Voici comment préparer les données textuelles pour l'analyse.
#1. Des données propres
Les données textuelles sont nettoyées en éliminant les éléments HTML, les URL et les caractères spéciaux. Les données sont ainsi nettoyées et organisées en vue de leur analyse.
#2. Prétraitement du texte
Le prétraitement du texte convertit les données textuelles en un format prêt à l'analyse. Il consiste à supprimer les chiffres, la ponctuation et les minuscules.
#3. Tokeniser le texte
La tokenisation divise le texte en mots et en phrases. Elle facilite ainsi l'analyse des données textuelles.
#4. Supprimer les mots vides
La suppression des mots vides permet d'éliminer du texte les mots fréquents tels que "et", "le" et "est". Ces termes peuvent fausser les analyses.
#5. Simplifier les données avec le stemming et la lemmatisation
Le stemming et la lemmatisation impliquent l'enracinement des mots. Cela permet de simplifier et d'analyser les données textuelles. Le stemming consiste à supprimer les suffixes des mots, tandis que la lemmatisation les réduit.
Une approche plus intelligente de l'analyse de texte
L'analyse de texte est généralement perçue comme un concept étranger et complexe lorsque l'on explore pour la première fois ses capacités et ses avantages. Mais maintenant que vous connaissez les bases de l'analyse de texte, l'étape suivante consiste à vous associer à un fournisseur de logiciels qui apporte une expertise spécialisée.
MedalliaL'analyse de texte en temps réel et centrée sur l'humain vous permet de découvrir des informations à fort impact et de passer à l'action. Elle utilise l'intelligence artificielle (IA) et le traitement du langage naturel (NLP) pour identifier rapidement les tendances émergentes et les informations clés à grande échelle. Et comme nous avons commencé à développer notre analyse de texte native il y a plus de dix ans, il s'agit de l'analyse de texte la plus complète, la plus connectée et la plus accessible qui soit.