Contenuti dell'articolo
Come funzionano le attuali tecnologie di Sentiment Analysis?
La raccolta manuale di dati, si sa, è una noia mortale e spesso è impossibile davanti alla mole di dati potenziali da dover analizzare e dividere in categorie. I data scientist di Talkwalker hanno sviluppato una tecnologia di sentiment analysis basata sul deep learning, che permette ai brand di catturare il sentiment dei consumatori con un livello di accuratezza pari al 90%: insomma, l'intera frase (ironia inclusa) viene compresa. Al momento esistono due approcci: sentiment analysis basata sul rilevamento e la valutazione delle keyword, o sentiment analysis basata su categorie customizzate.Sentiment analysis e valutazione delle keyword
Il rilevamento e la valutazione delle keyword si basano su un set di parole identificate come chiave nei messaggi e, a queste parole viene assegnato un valore positivo o negativo.Ad esempio, alla parola “buono” verrà assegnato un valore positivo, mentre alla parola “brutto” verrà assegnato un valore negativo.Ogni volta che lo strumento di sentiment analysis rileverà queste parole chiave assegnerà un valore positivo o negativo all’intero messaggio. Questo approccio presenta dei chiari limiti, soprattutto se ci si trova di fronte a figure retoriche, satira, ironia, slang. Si vanno a prendere solo frammenti di messaggio e non il suo vero significato. Se si vogliono analizzare i risultati nel dettaglio, un tweet sarcastico non verrà comunque contato tra i risultati positivi, evidenziando le falle del sistema. Considerato il fatto che le tecnologie di sentiment analysis basate sul rilevamento delle keyword non riescono a contestualizzare il messaggio, il livello di accuratezza dell’analisi varia generalmente dal 50% all’80%. Questo è il motivo per cui molti brand tendono ad escludere gli indicatori del sentiment tra i dati presentati nei loro report.
Sentiment analysis su categorie customizzate
Con questo approccio si effettua una categorizzazione personalizzata da parte degli utenti, si creano cioè categorie secondo le quali classificare manualmente alcune decine di risultati (il training set) e impostare le regole che dovrà poi seguire l’algoritmo predisposto all’analisi del sentiment. La precisione forse è superiore, ma rimangono dei difetti: oltre al moltissimo tempo necessario, si ottiene un'analisi con parametri molto rigidi per la classificazione dei risultati, che rimangono piuttosto limitati.E gli esseri umani?
Utilizzando le persone si può essere certi di avere un altissimo livello di accuratezza: non c'è dubbio che, al netto di alcuni gap interpretativi, la mente umana sia ancora superiore alle macchine nella comprensione dei testi. C'è il "piccolo" problema che una persona riesce a classificare in media 100 contenuti in un’ora, numeri non sostenibili quando si tratta di brand che vengono menzionati migliaia di volte in un giorno.
Come funziona la Sentiment Analysis basata sull’Intelligenza Artificiale?
Il sentiment basato sull’intelligenza artificiale introduce sul mercato un approccio completamente nuovo. Per la prima volta, un algoritmo basa la classificazione dei contenuti sull’analisi dell’intera frase, riuscendo così a contestualizzare il contenuto di un tweet, un post o un articolo, e ad interpretare con precisione l’opinione dei consumatori. Utilizzando modelli di deep learning in grado di simulare le funzioni cognitive del cervello umano, la tecnologia è in grado di distinguere e comprendere complesse strutture linguistiche, così come intere frasi e forme semplici di sarcasmo e ironia. È emerso che la precisione dei risultati aumenta all’aumentare del training set utilizzato per allenare la macchina, quindi è importante pensare in grande. Dopo aver classificato decine di milioni di risultati, si stima che la macchina raggiunge l’attuale livello di accuratezza del 90%Qual è il futuro della sentiment analysis?