Java analiza archivos pdf, proporcione el código. Tenga en cuenta que está en lenguaje java.
Para proporcionarle un ejemplo de referencia, puede probarlo en este ejemplo y modificarlo. También analiza PDF. importar?java.io.File; importar?java.io.FileOutputStream; importar?java.io.OutputStreamWriter; importar?java.io.Writer; importar?java.net.MalformedURLException; p>
importar?org.apache.pdfbox.pdmodel.PDDocument; import?org.apache.pdfbox.util.PDFTextStripper;public?class?PdfReader?{public?void?readFdf(String?file)?throws?Exception ?{
//?Si se debe ordenar
boolean?sort?=?false;
//?nombre del archivo pdf
String ?pdfFile?=?file;
//?Ingrese el nombre del archivo de texto
String?textFile?=?null;
//?Método de codificación
p>
String?encoding?=?"UTF-8";
//?Comenzar a extraer el número de páginas
int?startPage? =?1;
//?Número de página de extracción final
int?endPage?=?Integer.MAX_VALUE;
//?Flujo de entrada de archivos, generar archivo de texto
Writer?output?=?null;
//?PDF?Documento almacenado en la memoria
PDDocument?document?=?null; p>
try? {
try?{ //Primero cargue el archivo como una URL. Si se recibe una excepción, //cargue la URL del archivo desde el sistema de archivos local //url? =?new?URL(pdfFile);
//Tenga en cuenta que el parámetro ya no es la URL en la versión anterior, sino Archivo. document?=?PDDocument.load(pdfFile); //Obtener el nombre del archivo PDF String?fileName?=?url.getFile() //Nombra el archivo txt recién generado con el nombre del PDF original si; ?(fileName .length()?gt;?4)?{ File?outputFile?=?new?File(fileName.substring(0,?fileName
.length()?-?4)
?".txt"); textFile?=?outputFile.getName(); }
}?catch?(MalformedURLException?e)?{ //Si se obtiene una excepción al cargar como URL, luego desde la carga del sistema de archivos
//Tenga en cuenta que el parámetro ya no es la URL en la versión anterior, sino Archivo.
documento?=?PDDocument.load(pdfFile); if?(pdfFile.length()?gt;?4)?{ textFile?=?pdfFile.substring(0,?pdfFile.length()?-?4) p>
?".txt"; }
}
//?Secuencia de entrada del archivo, escribir en el archivo archivo de texto
salida?=? ?OutputStreamWriter(new?FileOutputStream(textFile), codificación);
//?PDFTextStripper para extraer texto
PDFTextStripper?stripper?=?null;
stripper ?=?new?PDFTextStripper();
//?Establecer si ordenar
stripper.setSortByPosition(sort);
//?Establecer el inicio página de punto
stripper.setStartPage(startPage);
//?Establecer la página final
stripper.setEndPage(endPage);
/ /?Llame a writeText de PDFTextStripper para extraer y generar texto
stripper.writeText(document,?output);
}?finally?{
if? (output ?!=?null)?{ //Cerrar el flujo de salida output.close();
}
if?(document?!=?null)?{ //? ¿Cerrar PDF?Documento document.close();
}
} } /**
*?@param?args
*/ public?static?void?main(String[]?args)?{
//?TODO?Auto-generated?method?stub
PdfReader?pdfReader ?=? new?PdfReader();
¿Intentar?{
//?Obtenga el contenido de SpringGuide.pdf en la unidad E
pdfReader.readFdf( "d: \\b.pdf");
}?catch?(¿Excepción?e)?{
e.printStackTrace();
} } }