Extraiga texto de un archivo PDF o una imagen con Google Docs

Cómo usar OCR y hacer que los archivos PDF y las imágenes se puedan editar para copiar texto dentro

PDF OCR Google Docs continúa agregando nuevas funciones a su aplicación en línea. Por lo tanto, junto con la capacidad de cargar archivos de cualquier tipo y tamaño (en Google Drive), ahora se ha añadido una novedad muy interesante, Función OCR, Que permiten extraer texto de PDF o imagen
Por lo tanto, queda claro lo útil que puede ser tanto en el lugar de trabajo como en la vida cotidiana la capacidad de capturar texto de una imagen escaneada y un documento PDF seguro.
Por ejemplo, en teoría, podría usar un escáner para guardar un libro en su computadora, extraer el texto y modificarlo, o podría tomar documentación preparada, modificarla y volver a trabajarla (sin embargo, tenga cuidado de copiar y pegar desde documentos con derechos de autor).
Veamos juntos cómo extraer texto de PDF o imágenes usando Google Docs; Para completar, también le mostraremos algunas alternativas de trabajo para extraer texto con OCR.

Cómo extraer texto usando Google Docs

Para activar la función OCR en Documentos abrimos la pagina Google Drive, haga clic en el ícono de ajustes en la esquina superior derecha y luego hacia arriba Configuraciones; en la ventana que se abre, marca la casilla Convierta los archivos cargados al formato de Google Docs Editor
Documentos de disco

En este punto, simplemente cargue el PDF o la imagen con texto en Google Drive, luego haga clic derecho en el archivo que acaba de descargar y use la opción Abrir con: Google Docs… El PDF o la imagen no se cargará en su formato original, pero obtendremos hoja de texto directamente editable con las herramientas de Google Docs. El archivo de texto se puede guardar nuevamente como PDF en su computadora, o como un archivo de Word, en formato TXT, RTF o compatible con Libreoffice (ODT).
Obviamente, si descarga el PDF y extrae el texto, perderá el formato de párrafo, incluso si se mantienen las configuraciones de fuente, cursiva y negrita (mucho depende de la calidad de las imágenes que componen el PDF original). Sigue siendo una forma rápida y sencilla de transferir libros en papel a su computadora sin tener que volver a escribirlos desde cero.

Cómo extraer texto en Windows 10

Si el OCR en Google Docs no nos ha convencido del todo, podemos utilizar esta herramienta como alternativa. PDF24, disponible de forma gratuita para cualquier versión de Windows.
PDF 24

Después de instalar la aplicación, ejecútela, haga clic en el elemento Reconocer texto y en la siguiente ventana haga clic en Agregar archivos y luego en Empezar… El programa comenzará a capturar texto de imágenes a PDF automáticamente; al final del trabajo, haga clic en Guardar el archivopara que pueda crear un nuevo PDF con texto extraído de imágenes (mucho más legible y preciso).

Alternativamente, siempre en Windows podemos usar el programa FreeOCR, una de las mejores herramientas gratuitas.
FreeOCR

Cuando se abra el programa, haga clic en Abrir PDF y seleccione el archivo PDF para descargar para que pueda extraer el texto que contiene y haga clic en la parte superior de OCR. Al final del proceso, elegimos si guardar el texto recuperado como un nuevo PDF (recomendado) o en cualquier otro formato de texto compatible.

Para probar a fondo otras alternativas de Windows, le recomendamos que lea nuestra guía para Software OCR para convertir imágenes, faxes y archivos PDF desde un escáner

Cómo extraer texto de PDF en Mac

Si buscamos algo similar a los programas que se muestran arriba para Mac, podemos probar OCRKit, disponible como prueba gratuita de 14 días.
OCRKit

Una vez abierta esta pequeña herramienta, basta con descargar las imágenes en PDF y empezar a convertir: en unos minutos tendremos todas las imágenes leídas y se creará el archivo con todo el texto extraído, listo para ser copiado, modificado. o compartido.

Cómo extraer texto de PDF en línea

Si no podemos instalar ningún programa en la PC de nuestra empresa, o si lo estamos ejecutando en una PC con un usuario limitado, aún podemos extraer texto de un archivo PDF de imágenes o imágenes escaneadas utilizando un servicio en línea. onlineocr.net
onlineocr.net

Cuando se abra el sitio, haga clic en el botón Seleccione un archivo, descargar PDF con texto para extraer, seleccionar ITALIANO es un Microsoft Word (docx) en el siguiente menú desplegable y finalmente haga clic en Convertir
El PDF se leerá y convertirá en un documento Word fácilmente editable y se cargará desde el navegador como cualquier archivo listo para editar con Word o LibreOffice Writer (versión gratuita disponible para todos).

Si el sitio anterior no nos convence y queremos probar otro, podemos obtener OCR gratuito para PDF yendo a este sitio. Convertio, que tiene una sección sobre la lectura de símbolos de escaneos o imágenes.
Convertio

Para utilizar el sitio, haga clic en el botón Selecciona archivos, cargamos un PDF para escanear, comprobamos si todas las opciones satisfacen nuestras necesidades, luego hacemos clic en Admitir… El sitio leerá inmediatamente todas las imágenes y generará un archivo de Word editable listo para usar.
En la versión gratuita, solo podemos convertir 10 páginas; si necesitamos más páginas, tendremos que registrarnos haciendo clic en la esquina superior derecha Registrarse antes de hacer nada.

recomendaciones

Como hemos visto, existen muchos métodos para extraer texto de un PDF o una imagen: comenzamos con Google Docs (la herramienta más simple y rápida) para mostrarte otras herramientas y programas útiles para este propósito.

Sin embargo, para PDF, podemos cambiar este tipo de archivo leyendo nuestras guías. Cómo editar archivos PDF es un 10 mejores programas de edición de PDF
Si, por el contrario, estamos buscando una forma de editar y compilar archivos PDF en nuestro teléfono, recomendamos leer nuestro artículo. Cómo editar y completar archivos PDF desde Android y iPhone

¿Problemas o dudas? Te ayudamos

Si quieres estar al día, suscríbete a nuestra newsletter y síguenos en Instagram. Si quieres recibir soporte para cualquier duda o problema, no dude en ponerse en contacto con nosotros en info@tecnologiaviral.com.

Deja un comentario