Script Python para parsear el documento de Destinos a formato hoja de calculo para poder filtrar, ordenar,etc.
| .gitignore | ||
| cabs.json | ||
| helpers.py | ||
| LICENSE | ||
| main.py | ||
| Readme.md | ||
| requirements.txt | ||
Destinos Parser
Script para parsear el documento de seleccion de Destinos proporcionado por Funcion Publica a documento excel. Esta basado en la estructura de la oferta de destinos para la oposicion TAI 22-23-24. Cualquier cambio en esta estructura necesitaria de ajustes en el codigo para que funcionase correctamente. Aun asi el script basa su funcionamiento en el archivo cabs.json, un archivo de estructura de datos en el que se indican los campos de cabecera de las tablas esperados y los campos en los que hay que dividir estos.
📦 Requisitos
- Python 3.8 o superior
- pip (administrador de paquetes de Python)
🚀 Instalación y ejecución
Sigue estos pasos para clonar y ejecutar la aplicación:
1. Clona el repositorio
git clone https://git.fergalla.com/marklogo/Parser_Destinos.git
cd tu-repositorio
2. Crea y activa un entorno virtual
# Linux
python3 -m venv venv
source venv/bin/activate
# Windows
python -m venv venv
venv\scripts\activate
3. Instala las dependencias
pip install -r requirements.txt
4. Ejecuta el script
python main.py
Uso del script
- Usar https://www.pdf2go.com/es/pdf-a-excel para convertir el archivo pdf a un xlsx
- Descargar el archivo xlsx a la carpeta del script
- Ejecutar el script (activar el entorno virtual source venv/bin/activate o venv\scripts\activate para poder ejecutarlo)
- Opcion 1 para escoger el fichero
- Opcion 2, para parsear el documento (si se detectan campos con varias interpretaciones ejem: se esperaban dos campos pero hay tres se le pedira que escoja la opcion correcta)
- Opcion 3, guarda el archivo parseado y corregido en la carpeta