Funcion para limpiar notas de contenido HTML
limpieza_notas.Rd
Esta funcion permite limpiar por completo las notas eliminando codigos y secciones irrelevantes. Verifica que el input sea un data frame con una columna llamada `contenido`.
Usage
limpieza_notas(datos, sinonimos = c())
Examples
# \donttest{
datos <- extraer_noticias_max_res("inteligencia artificial", max_results= 150, subir_a_bd = FALSE)
#> Fuentes parseadas: bbclFuentes parseadas: emol-todas
#> Total de resultados disponibles en bbcl: 2635
#> Noticia mas reciente disponible en bbcl es de la fecha: 2025-06-20 11:07:02
#> Total de resultados disponibles en emol para la busqueda: 731
#> Total de resultados disponibles en mediosregionales para la busqueda: 226
#> Total de resultados disponibles en guioteca para la busqueda: 67
#> Noticias hasta la fecha: 2013-08-08
datos_proc <- limpieza_notas(datos, sinonimos = c("IA", "AI"))
# }