top of page

Sentiment
Analysis

El sentiment analysis que se puede generar a través de RStudio comparte algunas funciones básicas con Voyant Tools, aunque ambas tienen sus ventajas y complicaciones es importante conocer (de manera básica, al menos) lo que cada una ofrece

Para este corpus, se eligieron las siguientes obras del poeta nicaragüense Rubén Darío:

  • Cantos de Vida y Esperanza. Los cisnes y otros poemas

  • Los Raros

  • Peregrinaciones

  • Prosas Profanas

Documento completo

Sentiment Analysis (click en ícono)

Selección de librerías en R

Las librerías necesarias para poder hacer este Sentiment Analysis son aquellas que contienen su propia base de datos relacionada con las palabras y sus valores (positivo o negativo) y un valor numérico que sea cuantificable:

>library(tidytext)
>get_sentiments("afinn")
>get_sentiments("bing")
>get_sentiments("nrc")

Una vez cargadas las librerías y los .csv de datos a analizar, se realiza el comando para ello; a continuación un ejemplo de como es el comando

 

Afinn <- read.csv("lexico_afinn_es.csv",
                 header=TRUE, stringsAsFactors=FALSE, fileEncoding="latin1")
prosasProfanas <- readRDS("prosasProfanas.rds")
cantosVida <- readRDS("cantosVida.rds")
losRaros <- readRDS("losRaros.rds")
peregrinaciones <- readRDS("peregrinaciones.rds")


Y con eso obtenemos las gráficas para el análisis que comprenden las cuatro obras de Darío

Rplot02_edited.jpg

Palabras más usadas

Con la ayuda de RStudio, se lograron contabilizar las palabras con mayor frecuencia, en la primer columna están las palabras y la segunda “n” con el conteo; así podemos observar que, de todo el corpus de Rubén Darío que tenemos; la palabra más frecuente es NO (con 1030), sin embargo esta palabra no necesariamente es negativa ya que puede existir en una oración como “No hay más dicha que el Sol”, entonces en este contexto NO podría ser algo positivo. De ahí, encontramos las siguientes frecuencias: triste (378), alegre (231), dolor (220) y amor (189); interesante observar que estos cuatro sentimientos se van complementando, como si el autor quisiera que su texto fuera un equilibro.

Cirrus o nube de palabras en R

Comando para la creación de la nube de palabras:

cloud %>% select(word, n) %>%  wordcloud2(size =2.5, color = "random-light")

Rplot03.png
bottom of page