Skip to content

Conversation

@bcosculluela
Copy link

DGT scrapper v1:

Cambios específicos de este scrapper

  • Creada una nueva clase de metadatos debido a que la estructura de las consultas es diferente de a la de los Boletines Oficiales.
  • Adjunto pantallazo de los metadatos cargados en Qdrant:
    image

Pruebas

  • Probados los módulos daily y batch desde 1997 a 2002 en local.
  • fecha_publicacion y fecha_disposicion tienen el mismo valor al no ser posible diferenciarlos.

Quedaría pendiente saber cada cuánto se actualiza la base de datos de las consultas. Tengo preparada una función para lanzar un job mensualmente en lugar de diariamente.

@bukosabino bukosabino self-requested a review March 8, 2024 13:31
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

None yet

Projects

None yet

Development

Successfully merging this pull request may close these issues.

1 participant