Natuurlijke taalverwerking (NLP), ook wel sentimentanalyse genoemd, identificeert de emotionele toon van een tekst door middel van sentimentanalyse. Met deze methode kunnen organisaties meningen over producten, diensten en ideeën vaststellen en categoriseren. Het proces omvat het analyseren van tekst op sentiment en subjectieve informatie met behulp van data mining, machine learning (ML) en kunstmatige intelligentie (AI).
Het gebruik van sentimentanalysesystemen kan inzicht bieden in ongeorganiseerde en ongestructureerde tekst die in diverse online bronnen voorkomt, zoals e-mails, blogberichten, tickets, webchats, sociale mediakanalen, forums en reacties. Door het implementeren van op regels gebaseerde, automatische of hybride algoritmen wordt handmatige gegevensverwerking overbodig. Een automatisch systeem leert van data met behulp van machine learning-technieken, terwijl op regels gebaseerde systemen sentiment analyseren op basis van vooraf gedefinieerde, lexicongebaseerde regels. Beide benaderingen worden gecombineerd in hybride sentimentanalyse.
Naast het vaststellen van sentiment, kan opinieanalyse ook de polariteit (of de mate van positiviteit en negativiteit), het onderwerp en de opiniegever bepalen. Bovendien kan sentimentanalyse worden toegepast op verschillende niveaus, zoals documenten, alinea's, zinnen en subzinnen.
Sentimentanalyse op een gedetailleerder niveau biedt een preciezere indicatie van de polariteit, meestal variërend van zeer positief tot zeer negatief. Op een schaal van 5 sterren kan dit worden vergeleken met een meningswaardering.
In tegenstelling tot positiviteit en negativiteit, identificeert emotiedetectie specifieke emoties. Enkele voorbeelden zijn blijdschap, frustratie, schok, woede en verdriet.
Naast het herkennen van meningen, herkent intentiegebaseerde analyse ook de acties achter een tekst. Als een klant in een reactie bijvoorbeeld frustratie uit over het vervangen van een batterij, kan de klantenservice contact opnemen om het probleem op te lossen.
Bij aspectgebaseerde analyse worden specifieke componenten verzameld die positief of negatief worden genoemd. De batterijduur van een product kan bijvoorbeeld door een klant worden bekritiseerd. In dat geval zal het systeem aangeven dat het negatieve sentiment niet over het product als geheel gaat, maar specifiek over de batterijduur.
De meest voorkomende uitdaging bij sentimentanalyse heeft te maken met onnauwkeurige trainingsmodellen. Systemen interpreteren opmerkingen die objectief of neutraal van toon zijn vaak verkeerd. Een opmerking als "Het product is blauw" van een klant die het verkeerde kleurproduct heeft ontvangen, wordt bijvoorbeeld als neutraal beschouwd, terwijl dit juist negatief zou moeten zijn.
Het onvermogen van een systeem om de context of toon te begrijpen, kan het ook moeilijk maken om sentimenten te identificeren. Als de context ontbreekt, kunnen antwoorden op peilingen of enquêtes zoals "niets" of "alles" als positief of negatief worden gecategoriseerd, afhankelijk van de vraag. Bovendien kunnen ironie en sarcasme niet expliciet worden aangeleerd en kunnen ze leiden tot het toeschrijven van onjuiste sentimenten.
Op dezelfde manier ondervinden computerprogramma's veel problemen wanneer ze emoji's en irrelevante informatie tegenkomen. Het is belangrijk om modellen te trainen met neutrale data en emoji's om te voorkomen dat teksten onterecht als irrelevant worden aangemerkt.
Bij sentimentanalyse en opinieonderzoek worden algoritmen voor natuurlijke taalverwerking (NLP) en machinaal leren gebruikt om automatisch de emotionele toon van online gesprekken te beoordelen.
Sentimentanalysemodellen kunnen worden geïmplementeerd met verschillende algoritmen, afhankelijk van de hoeveelheid data die geanalyseerd moet worden en de vereiste nauwkeurigheid van het model.
Er zijn drie hoofdtypen sentimentanalyse-algoritmen: