Changelog
datamedios 1.2.3
Agregado (Added)
- Se agregó la extracción de noticias de Ciper Chile, con distintos parámetros, como límite de resultados y fechas. Es capaz de extraer todos los artículos de Ciper desde su inicio hasta la fecha actual. Fue integrado a
extraer_noticias_fechayextraer_noticias_max_resy las funciones auxiliares asociadas. - Se agregó una barra de progreso para la extracción de noticias de Ciper.
datamedios 1.2.2
CRAN release: 2025-06-23
Agregrado (Added)
- Se creó una nueva función
grafico_notas_fechaque reemplaza la antiguagrafico_notas_por_mes. - Esta función permite especificar día o mes, y fue optimizada utilizando plotly y ggplotly para agregar interactividad.
- Tiene como parámetro
tema, con opciónlightydark. - Con un funcionamiento similar, se agregó la función
grafico_comparacion_medios. - Sumado a las funciones de
grafico_notas_fecha, recibe un vector de strings con los nombres de los medios a comparar. - Incluye un parámetro
tipo_graficopara elegir entre gráfico de barras o líneas.
datamedios 1.2.1
CRAN release: 2025-05-19
Corregido (Fixed)
- Se mejoró significativamente la robustez de las funciones de extracción para Emol (
extraer_noticias_fecha_emol,extraer_noticias_max_res_emol) al procesar la estructura de datos devuelta por la API, especialmente para campos como resumen (_source.bajada), URL de imagen (_source.tablas.tablaMedios,_source.imagen) y temas (_source.temas). Esto previene errores que causaban la pérdida de todos los datos extraídos de Emol. - Las funciones de extracción de Emol ahora utilizan funciones auxiliares (helpers) internas para procesar campos complejos, mejorando la legibilidad y el manejo de errores específicos de cada campo.
- Se implementó un manejo de errores más informativo en las funciones de extracción de Emol: si ocurre un error crítico durante el procesamiento final de los datos, se guarda una muestra de los datos crudos problemáticos en un archivo
.rdspara facilitar la depuración. - Se mejoró la robustez de la función
limpieza_notaspara manejar correctamente el contenido de noticias que puede ser HTML crudo, texto plano, o valoresNA. - Se solucionó un error en
limpieza_notasque ocurría cuando el contenido de una noticia eraNA, evitando la detención de la función. - La función
limpieza_notasahora maneja de forma más predecible la inicialización de la columnacontenido_limpio, usando siempre la columnacontenidocomo base en cada ejecución.
Mejorado (Improved)
- Se optimizó la función
limpieza_notaspara detectar si el contenido es HTML antes de intentar un parseo completo, mejorando la eficiencia para contenidos que ya son texto plano. - Se refinó la lógica de filtrado por términos de búsqueda y sinónimos en
limpieza_notaspara ser más consistente con la presencia de valoresNAen el contenido. - Se estandarizó el uso de
NA_character_en los helpers de extracción de Emol para asegurar consistencia en los datos procesados.