Esta funcion procesa la columna 'contenido_limpio' de un dataframe, tokeniza el texto, cuenta la frecuencia de cada palabra y genera una tabla con las palabras mas frecuentes.

tabla_frecuencia_palabras(datos, max_words, stop_words = NULL)

Arguments

datos

Data frame que contiene la columna 'contenido_limpio'.

max_words

Numero maximo de palabras que se mostraran en la tabla.

stop_words

Vector opcional de palabras que se deben excluir del conteo.

Value

Una tabla con las palabras mas frecuentes.

Examples

datos <- data.frame(
  contenido_limpio = c(
    "La ministra de Defensa Maya Fernandez enfrenta cuestionamientos
    el presidente Gabriel Boric solicita transparencia en los procesos.
    Renovacion Nacional pide la renuncia de Maya Fernandez debido a la polemica.
    La transparencia es fundamental en la politica y la gestion publica"
  ),
  stringsAsFactors = FALSE
)

# Probar la funcion con el dataframe de ejemplo
tabla_frecuencia_palabras(datos, max_words = 5, stop_words = c())
#> Error in tabla_frecuencia_palabras(datos, max_words = 5, stop_words = c()): could not find function "tabla_frecuencia_palabras"