Google prepara una función clave para Gemini: editar imágenes con un simple trazo

Google continúa reforzando las capacidades visuales de su asistente de inteligencia artificial Gemini con una nueva función que promete simplificar la edición de imágenes generadas por IA. La compañía está probando una herramienta que permitirá modificar directamente las imágenes creadas dentro del propio chat, sin necesidad de descargarlas ni volver a subirlas a la plataforma.

La novedad fue detectada tras analizar el código de una versión reciente de la aplicación de Google. En ella aparece un ícono de lápiz o herramienta de marcado que permitiría intervenir las imágenes generadas por la IA en cuestión de segundos. La idea es ofrecer un sistema mucho más intuitivo: los usuarios podrán dibujar, señalar o encerrar áreas específicas de una imagen para indicarle a la IA qué parte desean modificar.

Hasta ahora, cuando alguien quería cambiar un detalle en una imagen creada con IA —por ejemplo el fondo, un objeto o un color— debía describir el cambio mediante texto o editar la imagen en otro software. Con este nuevo sistema, bastará con marcar visualmente la zona de la imagen que se desea editar, reduciendo errores de interpretación por parte de la inteligencia artificial.

Este enfoque responde a uno de los desafíos más comunes en las herramientas de generación visual: la precisión. En muchos casos, los modelos de IA no logran identificar con exactitud qué parte de una imagen se quiere modificar. La función de marcado busca resolver este problema permitiendo que el usuario apunte directamente al elemento que desea cambiar.

Además de editar imágenes generadas por la propia IA, la herramienta también podría servir para analizar fotografías cargadas por el usuario, facilitando consultas visuales más precisas. Por ejemplo, alguien podría rodear un objeto dentro de una imagen y preguntarle a Gemini qué es, cómo funciona o qué modificaciones aplicar.

Esta nueva capacidad se suma a las mejoras que Google ha incorporado recientemente a Gemini en materia de generación visual. Los modelos actuales permiten crear y editar imágenes mediante texto o combinando varias fotografías, y en versiones avanzadas incluso es posible trabajar con resoluciones de hasta 4K y controles más detallados de iluminación, composición o estilo.

Por ahora la función se encuentra en fase de pruebas y solo aparece en versiones preliminares de la aplicación, lo que sugiere que Google podría anunciarla oficialmente en una próxima actualización. Si se implementa a gran escala, esta herramienta marcaría un paso importante hacia interfaces de IA más naturales, donde editar una imagen será tan simple como dibujar sobre ella.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *