Changelog
datamedios 1.2.3
Agregado (Added)
- Se agregó la extracción de noticias de Ciper Chile, con distintos parámetros, como límite de resultados y fechas. Es capaz de extraer todos los artículos de Ciper desde su inicio hasta la fecha actual. Fue integrado a
extraer_noticias_fecha
yextraer_noticias_max_res
y las funciones auxiliares asociadas. - Se agregó una barra de progreso para la extracción de noticias de Ciper.
datamedios 1.2.2
CRAN release: 2025-06-23
Agregrado (Added)
- Se creó una nueva función
grafico_notas_fecha
que reemplaza la antiguagrafico_notas_por_mes
. - Esta función permite especificar día o mes, y fue optimizada utilizando plotly y ggplotly para agregar interactividad.
- Tiene como parámetro
tema
, con opciónlight
ydark
. - Con un funcionamiento similar, se agregó la función
grafico_comparacion_medios
. - Sumado a las funciones de
grafico_notas_fecha
, recibe un vector de strings con los nombres de los medios a comparar. - Incluye un parámetro
tipo_grafico
para elegir entre gráfico de barras o líneas.
datamedios 1.2.1
CRAN release: 2025-05-19
Corregido (Fixed)
- Se mejoró significativamente la robustez de las funciones de extracción para Emol (
extraer_noticias_fecha_emol
,extraer_noticias_max_res_emol
) al procesar la estructura de datos devuelta por la API, especialmente para campos como resumen (_source.bajada
), URL de imagen (_source.tablas.tablaMedios
,_source.imagen
) y temas (_source.temas
). Esto previene errores que causaban la pérdida de todos los datos extraídos de Emol. - Las funciones de extracción de Emol ahora utilizan funciones auxiliares (helpers) internas para procesar campos complejos, mejorando la legibilidad y el manejo de errores específicos de cada campo.
- Se implementó un manejo de errores más informativo en las funciones de extracción de Emol: si ocurre un error crítico durante el procesamiento final de los datos, se guarda una muestra de los datos crudos problemáticos en un archivo
.rds
para facilitar la depuración. - Se mejoró la robustez de la función
limpieza_notas
para manejar correctamente el contenido de noticias que puede ser HTML crudo, texto plano, o valoresNA
. - Se solucionó un error en
limpieza_notas
que ocurría cuando el contenido de una noticia eraNA
, evitando la detención de la función. - La función
limpieza_notas
ahora maneja de forma más predecible la inicialización de la columnacontenido_limpio
, usando siempre la columnacontenido
como base en cada ejecución.
Mejorado (Improved)
- Se optimizó la función
limpieza_notas
para detectar si el contenido es HTML antes de intentar un parseo completo, mejorando la eficiencia para contenidos que ya son texto plano. - Se refinó la lógica de filtrado por términos de búsqueda y sinónimos en
limpieza_notas
para ser más consistente con la presencia de valoresNA
en el contenido. - Se estandarizó el uso de
NA_character_
en los helpers de extracción de Emol para asegurar consistencia en los datos procesados.