PDF a Excel: convierte tablas de PDF en hojas de cálculo
Guía práctica para convertir tablas de PDF en hojas de cálculo Excel. Explica por qué la conversión directa falla, qué herramientas funcionan y cómo obtener resultados limpios sin reformatear a mano.
4 min de lecturaAlguien te envía un PDF. Los números que necesitas están en una tabla en la página 12. Solo quieres pasarlos a una hoja de cálculo. De alguna manera, esto sigue siendo más difícil de lo que debería en 2025.
Por qué copiar-pegar y "guardar como" fallan
Los PDFs no almacenan tablas. Almacenan texto en coordenadas x/y específicas de la página, sin concepto de filas ni columnas. Cuando copias una tabla de un PDF y la pegas en Excel, obtienes una sola columna de texto con los valores revueltos. No sirve para nada.
El botón de "exportar a Excel" en Acrobat y editores similares tampoco es mucho mejor. Intenta reconstruir la cuadrícula a partir de las posiciones visuales, y el resultado suele ser un desastre de celdas combinadas y datos desalineados. Acabas dedicando más tiempo a limpiar el resultado del que habrías tardado en reescribirlo.
Qué buscar en una herramienta de conversión
Las herramientas que realmente funcionan entienden la estructura del documento, no solo las coordenadas del texto. Son capaces de determinar dónde empieza y termina una tabla, qué valores pertenecen a qué columna y qué pasa cuando una fila se parte en un salto de línea.
Hay varias cosas que importan más que el texto publicitario de la página de la herramienta:
- Detección de columnas que maneje anchos variables y espaciados estrechos sin fusionar columnas adyacentes
- Tablas de varias páginas unidas en una sola salida, no volcadas en hojas separadas
- Números que lleguen como números, no como cadenas de texto que parecen números. Lo mismo con las fechas.
- Encabezados repetidos en páginas de continuación eliminados para que "Fecha | Importe | Descripción" no aparezca cada 30 filas
Este último punto pilla a mucha gente desprevenida. Metes los datos en Excel, las fórmulas no funcionan y tardas diez minutos en darte cuenta de que la mitad de las celdas de "números" en realidad son texto.
Dónde surge este problema
Los informes financieros son el caso clásico. Los resultados trimestrales llegan como PDF y alguien del equipo necesita los números en un modelo para ayer. Los organismos públicos son otro caso importante: publican tablas de censos y documentos regulatorios que los investigadores tienen que arrancar de los PDFs página por página. Los equipos de contabilidad lo sufren con las facturas. Los académicos, con tablas de datos enterradas en artículos publicados.
El patrón es siempre el mismo: alguien eligió PDF como formato de entrega, y ahora necesitas usar los datos de verdad.
Una nota sobre unPDF
Con unPDF, describes lo que necesitas en lenguaje natural ("extrae la tabla de ingresos de las páginas 4 a 6") en lugar de convertir todo el documento a ciegas. Subes el PDF, escribes una instrucción breve y obtienes datos estructurados que puedes descargar como .xlsx o CSV. Funciona bien para informes recurrentes donde el diseño es consistente.
Revisa tu resultado
Incluso con buenas herramientas, dedica dos minutos a revisar el resultado. Busca celdas que se hayan combinado cuando no debían, columnas de números que Excel esté tratando como texto y filas que hayan desaparecido (especialmente cerca de los saltos de página). Es un vistazo rápido, no una auditoría. Detectar un problema aquí te ahorra mucha confusión después, cuando una fórmula SUMA devuelve cero y no sabes por qué.