Claude ve en alta resolución: guía para principiantes
Imagina que llegas del supermercado con un ticket arrugado de 38 líneas, lo fotografías con el móvil y, treinta segundos después, tienes una hoja de cálculo limpia con cada producto, su precio y el total. Hace dos meses esto era un experimento frustrante: Claude reducía la foto, perdía los céntimos y se inventaba marcas. Desde abril de 2026, con la llegada de Claude Opus 4.7, ese ticket llega entero al modelo y los números salen exactos. Anthropic ha multiplicado por más de tres la resolución máxima que Claude acepta, y eso cambia por completo lo que puedes pedirle a la IA con una simple foto.
Si la palabra "visión" te suena a algo de programadores, tranquila: en esta guía te cuento qué ha cambiado, por qué importa para tu día a día y cómo sacarle partido aunque nunca hayas tocado una API. Vamos paso a paso, con ejemplos reales que puedes copiar esta misma tarde.
Qué ha cambiado de verdad en la visión de Claude
Hasta marzo, cualquier imagen que enviabas a Claude se reducía a un máximo de 1.568 píxeles en su lado más largo, lo que equivale a 1,15 megapíxeles. Era suficiente para una foto de perfil o un meme, pero insuficiente para un PDF escaneado o el pantallazo de un Excel con cuarenta filas. Claude Opus 4.7 sube ese listón hasta 2.576 píxeles y 3,75 megapíxeles. Más del triple de información visual por imagen.
¿Qué significa en la práctica? Que el modelo ya puede leer la letra pequeña. Anthropic publicó pruebas internas en las que un benchmark de "agudeza visual" pasó de un 54,5 por ciento de aciertos con Opus 4.6 a un 98,5 por ciento con Opus 4.7. No es un retoque, es una transformación. Tres tipos de imagen se benefician especialmente: capturas densas de software, documentos escaneados con tablas y fotos de objetos con texto pequeño, como tickets, etiquetas, planos y recibos.
La mejora viaja sola: no tienes que activar nada, solo usar Claude Opus 4.7 desde la app de escritorio, la web, móvil o la API. Si tu plan es Pro, Max, Team o Enterprise, ya está disponible.
Cinco trabajos que ahora puedes delegar a Claude solo con una foto
Antes de meternos en el cómo, conviene ver el qué. Estos son los casos de uso que más están apareciendo en mi feed estas últimas semanas, ordenados de menos a más útiles para alguien que empieza.
El primero es digitalizar tickets y facturas en papel. Sacas la foto, la subes y pides una tabla con producto, cantidad, precio unitario y total. Si tienes varios tickets de la semana, puedes pedirle que los una en una sola hoja y te diga cuánto te has gastado en fruta, en limpieza o en lo que quieras categorizar.
El segundo es convertir capturas de pantalla en datos estructurados. Esa pestaña del banco que no te deja exportar a CSV, el listado de pedidos en un panel de proveedor, el dashboard de tu tienda online. Ahora Claude lee la tabla aunque ocupe toda la pantalla, sin perder columnas ni números.
El tercero es explicar planos, esquemas y diagramas técnicos. Un plano de un piso, un esquema eléctrico básico, un mapa de metro. Le pides que te describa el espacio, calcule metros aproximados o liste las salidas de emergencia, y Claude responde como si lo tuviera delante en alta calidad.
El cuarto es leer manuales y prospectos en miniatura. Esas instrucciones plegadas que vienen con el ventilador o el medicamento, escritas en letra de tres milímetros, ahora son legibles para el modelo. Le mandas la foto y le pides que te resuma los pasos en español claro.
Y el quinto, mi favorito: revisar el diseño de tu propia web o documento. Subes el pantallazo de la página y le pides feedback sobre jerarquía, contraste, espaciado o coherencia. Claude detecta detalles de píxeles que antes se le escapaban porque la imagen llegaba comprimida.
Cómo usar la visión HD paso a paso (sin API, desde la app)
Vamos a lo concreto. Abre la app de escritorio o la web de Claude y comprueba que estás en Opus 4.7. Si no lo ves seleccionado, lo encuentras en el menú de modelos arriba a la izquierda. Está disponible en todos los planes de pago de la app y también gratis con cuota limitada.
Una vez dentro, los pasos son tres. Primero, toma la foto bien. Esto suena tonto pero marca la diferencia: sujeta el móvil paralelo al papel, evita sombras en el centro y procura que la imagen tenga al menos 1.500 píxeles de ancho. Casi cualquier móvil moderno hace fotos muchísimo más grandes, no necesitas una cámara especial.
Segundo, sube la imagen al chat con un prompt claro. No basta con escribir "léelo". Funciona mucho mejor decirle qué formato quieres y qué hacer con los datos. Un ejemplo que uso mucho con tickets: "Lee este ticket y devuélveme una tabla con columnas Producto, Cantidad, Precio unitario, Total. Suma el total general y dime si coincide con el importe que aparece abajo."
Tercero, revisa y ajusta. Aunque la precisión ha subido a niveles casi humanos, sigue siendo IA. Si ves un precio raro, dile "vuelve a mirar la línea 14, creo que pone 3,49 no 8,49" y lo corrige. Esa conversación rápida es donde se ahorra tiempo de verdad.
Tres prompts que puedes copiar y pegar hoy mismo
Para que no salgas de aquí solo con teoría, te dejo tres prompts probados. Los uso semanalmente y funcionan bien con cualquier captura nítida.
Para un dashboard: "Esta es una captura del panel de mi tienda online. Lista cada pedido en formato JSON con campos id, fecha, cliente, total y estado. Si algún campo no se ve bien, márcalo como null."
Para un documento escaneado con tabla: "Adjunto un PDF escaneado de una página. Extrae la tabla principal en Markdown, conservando el orden exacto de filas y columnas. No inventes valores: si una celda está vacía o ilegible, escribe «—»."
Para un plano o diagrama: "Esto es el plano de un piso. Identifica cada estancia, estima los metros cuadrados aproximados (si hay cotas, úsalas) y dime cuál es la habitación más grande. Termina con una lista de las puertas exteriores."
Tres prompts, tres ahorros de tarde. Si los guardas en un documento aparte y los reutilizas, en un mes notas la diferencia.
Trampas comunes y cómo esquivarlas
Toda herramienta nueva tiene su lado oscuro y la visión HD no es una excepción. Hay tres errores que veo repetir constantemente entre quienes empiezan.
El primero es subir fotos comprimidas por WhatsApp o Telegram. Esas apps reducen la imagen a unos 800 píxeles de ancho y te cargas toda la mejora de Opus 4.7. Si tu foto pasa por mensajería, exporta el original desde la galería del teléfono o sube directamente desde la cámara.
El segundo es pedir lecturas de letra borrosa o muy oscura. La resolución alta no es magia: si el texto está fuera de foco o el contraste es bajísimo, Claude se inventará. Mejor sacar la foto otra vez con buena luz que pelearse con el modelo.
El tercero, más sutil, es olvidar que la visión cuesta tokens. Cada imagen, especialmente en alta resolución, consume bastantes tokens de entrada. Si trabajas en la web con un plan gratuito, llegarás antes al límite diario. Para uso intensivo, el plan Pro a 17 dólares al mes compensa de sobra. Y si lo tuyo es procesar cientos de imágenes en automático, mira la API y la opción de batches, que te abarata el cálculo a la mitad.
El ángulo profesional: por qué esto cambia muchos oficios
Si trabajas con papel, pantallazos o imágenes, esta actualización es probablemente la noticia más importante del trimestre. Contables que pasaban tres horas tecleando facturas pueden hacer lo mismo en treinta minutos. Comerciales que recopilan tarjetas en ferias dejan de meterlas a mano. Periodistas que documentan datos de pantallas oficiales ya no necesitan a alguien que los transcriba. Y en docencia, profesores que reciben ejercicios fotografiados por sus alumnos pueden corregir borradores manuscritos sin hacerse bizco.
Todo esto era posible antes con servicios de OCR especializados, pero suponía pagar a tres herramientas distintas y montar un flujo. Ahora vive dentro de una conversación normal con Claude, y eso es lo que lo hace adopción real, no experimento.
Qué hacer mañana por la mañana
Si solo te llevas una idea de este artículo, que sea esta: elige un proceso repetitivo de tu semana donde manejes texto sobre imagen y pruébalo con Claude Opus 4.7. Cinco tickets, una factura, el pantallazo de un informe. Mide cuánto tardas tú a mano, cuánto tarda la IA y qué errores comete. Repite el experimento durante una semana ajustando el prompt y verás cómo, en pocos días, has automatizado un mini proceso sin escribir una sola línea de código.
Si quieres acelerar la curva, en learnaifast.io tenemos cursos enfocados a casos prácticos para principiantes, con ejemplos en español y prompts listos para copiar. La sección de cursos para no programadores parte de cero y te lleva en unas horas a montar tus propios flujos con visión, escritura y conectores. Echa un vistazo en /cursos cuando termines este café.
La visión HD de Claude es de esas mejoras que parecen técnicas y son, en realidad, profundamente humanas: te devuelven horas para hacer lo que de verdad te interesa. Aprovéchalas.



