extraer_noticias_fecha_emol
, extraer_noticias_max_res_emol
) al procesar la estructura de datos devuelta por la API, especialmente para campos como resumen (_source.bajada
), URL de imagen (_source.tablas.tablaMedios
, _source.imagen
) y temas (_source.temas
). Esto previene errores que causaban la pérdida de todos los datos extraídos de Emol..rds
para facilitar la depuración.limpieza_notas
para manejar correctamente el contenido de noticias que puede ser HTML crudo, texto plano, o valores NA
.limpieza_notas
que ocurría cuando el contenido de una noticia era NA
, evitando la detención de la función.limpieza_notas
ahora maneja de forma más predecible la inicialización de la columna contenido_limpio
, usando siempre la columna contenido
como base en cada ejecución.limpieza_notas
para detectar si el contenido es HTML antes de intentar un parseo completo, mejorando la eficiencia para contenidos que ya son texto plano.limpieza_notas
para ser más consistente con la presencia de valores NA
en el contenido.NA_character_
en los helpers de extracción de Emol para asegurar consistencia en los datos procesados.