Apache PDFBox
Apache PDFBox es una biblioteca de código abierto puramente en Java que permite crear, renderizar, imprimir, dividir, combinar, modificar, verificar y extraer texto y metadatos de archivos PDF.
Open Hub informa de más de 11.000 encomiendas (desde el inicio como proyecto Apache) por parte de 18 colaboradores, que representan más de 140.000 líneas de código. PDFBox tiene una base de código madura y bien establecida, mantenida por un equipo de desarrollo de tamaño medio, con un número de commits que aumenta año tras año. Utilizando el modelo COCOMO, se estima que ha supuesto un esfuerzo de 46 personas-año.[1]
Historia
editarPDFBox fue iniciado en 2002 en SourceForge por Ben Litchfield, que quería poder extraer texto de archivos PDF para Lucene[2] Se convirtió en un proyecto Apache Incubator en 2008, y en un proyecto Apache de primer nivel en 2009,[3]
Preflight (que comprueba la conformidad de los archivos PDF con PDF/A-1b), se llamó originalmente PaDaF y fue desarrollado por Atos worldline, y donado al proyecto en 2011.[4]
En febrero de 2015, Apache PDFBox fue nombrado Open Source Partner Organization de la PDF Association.[5]
Estructura
editarApache PDFBox tiene los siguientes componentes:
- PDFBox: la parte principal
- FontBox: gestiona la información sobre fuentes
- XmpBox: gestiona los metadatos XMP
- Preflight (opcional): comprueba la conformidad de los archivos PDF con PDF/A-1b.
Véase también
editar- PDF Split and Merge (PDFSam)
Enlaces externos
editarReferencias
editar- ↑ «The Apache PDFBox Open Source Project on Open Hub». openhub.net. 18 de marzo de 2017. Consultado el 18 de marzo de 2017.
- ↑ Apache PDFBox and FontBox 1.0.0 released, The H Open, 16 February 2010
- ↑ PDFBox Project Incubation Status
- ↑ PaDaF Preflight Codebase Intellectual Property (IP) Clearance Status
- ↑ Apache™ PDFBox™ named an Open Source Partner Organization of the PDF Association, February 3, 2015