La problemática del formato de los archivos escaneados

Los archivos PDF (y escaneados) son uno de los formatos más extendidos para mostrar contenidos de texto en documentos. Así es habitual que sea el único formato disponible para traducir contratos, folletos, fichas técnicas o manuales, por ejemplo. Sin embargo, son solo archivos de intercambio de contenido.

PDF es la sigla en inglés de Portable Document Format (formato de documento portátil), y su único propósito es que se pueda ver y compartir sin problemas de compatibilidad. Es muy importante entender esto: un archivo PDF se puede modificar, pero en realidad no está pensado para ello. En este artículo os contamos los problemas, soluciones, por qué el formato es más seguro y cómo se puede hacer

¿Cuál es la forma ideal de traducir archivos PDF o escaneados?

La vía más normal para traducirlos es convertirlos a Word. Sin embargo, aunque suene un poco estúpido, la mejor manera de traducir un archivo PDF es no traducirlo. Es decir, es más conveniente no traducir el PDF, sino el archivo original y editable con el que se creó el PDF. Por ejemplo, si ese archivo se creó en Word, lo mejor es usar el archivo Word original.

Sin embargo, es posible que ya no se sepa dónde están los archivos originales o quién los creó. O, por otro lado, es igualmente posible que solo se hayan facilitado los archivos PDF para realizar la traducción. No obstante, merece la pena invertir un poco de tiempo en investigar si aún existen, o insistirle al cliente que lo envíe. Eso evitará muchísimos quebraderos de cabeza durante la traducción: tiempo y dinero.

¿Por qué convertir archivos PDF a Word para su traducción?

archivos escaneados ilegibles

Como ya se ha mencionado, la solución estándar para traducir archivos PDF es pasarlos a Word. Quizá alguien piense que esto no tiene sentido, porque los PDF se pueden editar. Sí, son editables, pero para ello se necesita la versión profesional de pago de Acrobat. La mayoría de los traductores tienen la versión gratuita: Acrobat Reader, la cual está limitada a muy pocas funciones.

Este problema se puede solucionar traduciendo, de primeras, un archivo de Word. Además, este tipo de archivos les permiten a los traductores o agencias de traducción utilizar herramientas de traducción asistida, que agilizan en gran medida la labor de traducción.

Cómo traducir archivos PDF escaneados (o trazados)

La conversión de un PDF escaneado no es muy distinta a la de un PDF editable, excepto por el resultado que se espere. En general, los PDF escaneados tienen resultados más pobres.

En el caso de OminPage, existe la posibilidad de darle instrucciones al programa para ayudar a interpretar el documento escaneado. Se le puede indicar si hay tablas, párrafos de texto o imágenes. También permite indicar la orientación del texto cuando cambie. Estas instrucciones básicas pueden optimizar el texto que se vaya a traducir.

Los programas de OCR (por sus siglas en inglés, Optical Character Recognition [reconocimiento óptico de caracteres]) no son gratuitos, pero son ideales para resolver problemas de formato, ya que permiten convertir archivos PDF a documentos editables. Un problema un tanto insalvable es cuando la resolución del PDF escaneado no es suficiente para hacer el OCR. Los programas de OCR necesitan tener una resolución mínima para poder funcionar. En caso de encontrarnos con este problema, debemos pedir que se vuelvan a escanear los documentos a mayor resolución. Si esto no es posible, siempre podemos imprimir los documentos y escanearlos nosotros mismos, a veces funciona.

Un caso parecido a los PDF escaneados es el de los PDF cuyo texto se ha pasado a trazos. En programas de diseño como Illustrator, InDesign o Corel existe la función de pasar el texto a gráfico de curvas, pero se pierde la capacidad de editarlos para poder traducirlos.

Documento escaneado vs documento en papel

Es mucho más “seguro” traducir un documento escaneado en vez de uno en papel. Se podría pensar que es más fácil falsificar un documento escaneado, pero no es así. Existen documentos electrónicos que son más difíciles de falsificar que los documentos en papel. A nivel legal, tampoco hay ninguna regulación que estipule que solo se puedan traducir documentos en versión papel.

Además, recibir el documento en versión electrónica aligera muchísimo el proceso de traducción, e incluso aporta varias ventajas. Por ejemplo, tenemos el original en el mismo formato en el que realizaremos la traducción. Es mucho más cómodo, rápido y eficaz.

Consejo final

Para aquellos que trabajan con archivos PDF con frecuencia, es recomendable utilizar un editor de PDF como Adobe Acrobat Professional, aunque también existen opciones más baratas, por lo que, antes de comprar uno, puedes comparar precios.

No dudes en ponerte en contacto con nosotros para solicitar presupuesto sin compromiso. ¡En FAST.txt podemos ayudarte!

Mercedes Pajuelo

error: