La Red de Conocimientos Pedagógicos - Currículum vitae - Java analiza archivos pdf, proporcione el código. Tenga en cuenta que está en lenguaje java.

Java analiza archivos pdf, proporcione el código. Tenga en cuenta que está en lenguaje java.

Para proporcionarle un ejemplo de referencia, puede probarlo en este ejemplo y modificarlo. También analiza PDF. importar?java.io.File; importar?java.io.FileOutputStream; importar?java.io.OutputStreamWriter; importar?java.io.Writer; importar?java.net.MalformedURLException; p>

importar?org.apache.pdfbox.pdmodel.PDDocument; import?org.apache.pdfbox.util.PDFTextStripper;public?class?PdfReader?{public?void?readFdf(String?file)?throws?Exception ?{

//?Si se debe ordenar

boolean?sort?=?false;

//?nombre del archivo pdf

String ?pdfFile?=?file;

//?Ingrese el nombre del archivo de texto

String?textFile?=?null;

//?Método de codificación

p>

String?encoding?=?"UTF-8";

//?Comenzar a extraer el número de páginas

int?startPage? =?1;

//?Número de página de extracción final

int?endPage?=?Integer.MAX_VALUE;

//?Flujo de entrada de archivos, generar archivo de texto

Writer?output?=?null;

//?PDF?Documento almacenado en la memoria

PDDocument?document?=?null;

try? {

try?{ //Primero cargue el archivo como una URL. Si se recibe una excepción, //cargue la URL del archivo desde el sistema de archivos local //url? =?new?URL(pdfFile);

//Tenga en cuenta que el parámetro ya no es la URL en la versión anterior, sino Archivo. document?=?PDDocument.load(pdfFile); //Obtener el nombre del archivo PDF String?fileName?=?url.getFile() //Nombra el archivo txt recién generado con el nombre del PDF original si; ?(fileName .length()?gt;?4)?{ File?outputFile?=?new?File(fileName.substring(0,?fileName

.length()?-?4)

?".txt"); textFile?=?outputFile.getName(); }

}?catch?(MalformedURLException?e)?{ //Si se obtiene una excepción al cargar como URL, luego desde la carga del sistema de archivos

//Tenga en cuenta que el parámetro ya no es la URL en la versión anterior, sino Archivo.

documento?=?PDDocument.load(pdfFile); if?(pdfFile.length()?gt;?4)?{ textFile?=?pdfFile.substring(0,?pdfFile.length()?-?4)

?".txt"; }

}

//?Secuencia de entrada del archivo, escribir en el archivo archivo de texto

salida?=? ?OutputStreamWriter(new?FileOutputStream(textFile), codificación);

//?PDFTextStripper para extraer texto

PDFTextStripper?stripper?=?null;

stripper ?=?new?PDFTextStripper();

//?Establecer si ordenar

stripper.setSortByPosition(sort);

//?Establecer el inicio página de punto

stripper.setStartPage(startPage);

//?Establecer la página final

stripper.setEndPage(endPage);

/ /?Llame a writeText de PDFTextStripper para extraer y generar texto

stripper.writeText(document,?output);

}?finally?{

if? (output ?!=?null)?{ //Cerrar el flujo de salida output.close();

}

if?(document?!=?null)?{ //? ¿Cerrar PDF?Documento document.close();

}

} } /**

*?@param?args

*/ public?static?void?main(String[]?args)?{

//?TODO?Auto-generated?method?stub

PdfReader?pdfReader ?=? new?PdfReader();

¿Intentar?{

//?Obtenga el contenido de SpringGuide.pdf en la unidad E

pdfReader.readFdf( "d: \\b.pdf");

}?catch?(¿Excepción?e)?{

e.printStackTrace();

} } }