Training and consulting in strategic communication and digital marketing.
Implementation of E-Commerce, E-learning, CRM, CMS systems.
Management and marketing of web domains.
SEO, SEM, SMM, & Analytics lovers.

Bogotá - Colombia Cll 45 # 45 - 16
+57 310 8030024
[email protected]
+57 310-8030024
[email protected]
Bogotá - Colombia

4 interfaces de usuario para crear imágenes con I.A.

Desde la popularización de la inteligencia artificial accesible al público, ha sido evidente el desarrollo de cientos de nuevas tecnologías basadas en modelos de IA. Un proceso de “reskilling” forzoso nos está llevando a comprender nuevos conceptos a un nivel más profundo. En este artículo, abordaremos las IA generativas en el campo de la generación de imágenes, un tema interesante: las interfaces de usuario.

Frente a tu pantalla, surgen ideas que toman forma. Necesitas claridad… dibujas un boceto en una hoja reciclada, miras detenidamente el papel, tus pupilas se dilatan, el aroma del café se intensifica, ya sabes que el avión va a aterrizar.

Ahora te preguntas qué modelo usarás: Stable Diffusion o Midjourney, o tal vez probarás con tus créditos diarios en Leonardo A.I… Hace poco encontraste otro sitio para crear imágenes… no recuerdas el nombre, pero lo probarás.

En este punto, ya sabes que existen diversas formas de crear estas imágenes. Deberás usar una interfaz que te proporcione todas las opciones que requieres: refinadores, LoRAs, image-to-image, inpainting, upscale, motions… debe cumplir con todos tus requerimientos. Respiras profundamente, cierras los ojos y piensas: es hora de decidir qué interfaz es la ideal para trabajar en esas ilustraciones con IA que debes presentar en dos días.

Aquí es donde puedes utilizar alguna de las 4 interfaces más populares en este momento. Te las presento con explicaciones ultra simplificadas.

Modo Clásico: la interfaz más utilizada

Para aquellos familiarizados con interfaces tradicionales, el Modo Clásico ofrece una sensación de posibilidades y familiaridad. Sin embargo, la amplia variedad de funciones disponibles en la mayoría de estas interfaces podría resultar abrumadora.

En este punto, te recomiendo la interfaz más popular: Automatic1111, la cual tiene la mayor cantidad de posibilidades, instalación de plugins y configuración de funciones en detalle. No olvides que puede volverse una interfaz difícil de dominar si aún no comprendes los conceptos técnicos detrás de la IA generativa. También hay opciones de UI más simplificadas, con una curva de aprendizaje rápida y sin complicaciones, y una gran cantidad de modelos, como Fooocus.

Ejecuta Automatic1111 en Colab: https://colab.research.google.com/github/TheLastBen/fast-stable-diffusion/blob/main/fast_stable_diffusion_AUTOMATIC1111.ipynb

Ejecuta Fooocus en Colab: https://colab.research.google.com/github/lllyasviel/Fooocus/blob/main/fooocus_colab.ipynb

Modo Chat: conversaciones inspiradoras

Seguramente ya has intentado crear una imagen en Copilot de Bing o te has conectado a un servidor de Discord que te permite generar imágenes con IA mediante un chat sencillo e intuitivo. El gran poder de este tipo de interfaz radica en la comunicación fluida y natural con los modelos de IA, lo que facilita la expresión de ideas y la obtención de respuestas rápidas, ideal para personas con conocimientos básicos. Es precisamente aquí donde Midjourney destaca frente al resto: su interfaz se basa en comandos e instrucciones mediante chat y sus modelos son, sin duda alguna, de los mejores del mercado.

Midjourney en Discord

Modo Lienzo: creatividad en modo “salvaje”

El modo lienzo presenta una interfaz basada en un lienzo infinito que invita a trabajar libremente en un espacio similar a un moodboard. Desde ese mismo espacio, se pueden transformar las imágenes creadas y crear collages de imágenes artificiales infinitas, virtualmente hablando.

Con su enfoque en la expresión visual, el Modo Lienzo facilita la comunicación de ideas complejas con un enfoque en las imágenes y gráficos. Ideal para el trabajo en equipo, estas interfaces sirven para adoptar enfoques experimentales y exploratorios, lo que permite descubrir o inventar nuevas técnicas y estilos de creación.

Leonardo en modo Canva o Lienzo

Algunas plataformas que tienen funcionalidad de lienzo y que te recomiendo: https://playground.com/ y https://leonardo.ai/

ComfyUI: los flujos de trabajo significan control

ComfyUI está diseñado para ofrecer un gran control sobre el flujo de trabajo. Una vez que se comprende su funcionamiento, no parece tan complicado. Las configuraciones de las imágenes se elaboran mediante un diagrama de flujo, donde los nodos se conectan de forma lineal. Además, es fácil encontrar cada parámetro. Es una interfaz que te hace ver como un genio y fue creada para usarse con Stable Diffusion.

La interfaz de ComfyUI

Observa ComfyUI en funcionamiento: https://learn.runcomfy.com/

¡Recomienda este artículo!

Post a Comment