Revolución de la creación generada por ordenador (Computer-Generated Imagery (CGI))

Las imágenes y vídeos generados artificialmente se apoderan del sector de la comunicación. Es esencial que utilicemos esta tecnología de forma éticamente responsable, argumenta Jens Krahe, socio-director de Plan.net.

 

La revolución de las imágenes generadas de forma artificial ha superado el punto de no retorno: ya todos podemos crear imágenes artificiales, gracias a los generadores de imágenes de libre acceso de DALL-E 2 y Midjourney, o a través de Stable Diffusion como solución de código abierto. La base es lo que se conoce como "prompt": una descripción textual en inglés que puede ser elaborada mediante bocetos. Es de suponer que las creaciones generadas por ordenador formarán parte del trabajo diario en agencias y empresas dentro de tres años como máximo. Esta fascinante tecnología supera todas las limitaciones de la creatividad visual. No sólo es un proceso extremadamente rápido, sino que también su desarrollo lo será. Al mismo tiempo, supone el fin de la laboriosa búsqueda en bases de datos de imágenes para ilustrar presentaciones de PowerPoint o visualizar ideas creativas y campañas en Photoshop. 

 

La interpretación de los términos definirá la imagen

 

Parece muy sencillo, introducir un texto para generar una imagen. Sin embargo, en la práctica no es tan fácil, ya que el texto debe funcionar de forma que la tecnología que hay detrás lo "entienda" y, en consecuencia, genere la imagen deseada. Añadir bocetos o imágenes puede afectar activamente a la generación de la imagen y tener un impacto positivo en la calidad de la misma y en el resultado creativo. Los creadores de imágenes también deben saber qué entradas de texto y dibujos producen los mejores resultados. Resulta especialmente difícil cuando se buscan términos para ilustrar valores abstractos de la marca, como la confianza, la seguridad o el propósito. Por eso existen portales como "PromptHero", que ofrecen indicaciones gratuitas para compartir su experiencia textual con otros, o plataformas como "PromptBase", que funciona como una empresa comercial. 

Además, una indicación en DALL-E no dará necesariamente el mismo resultado en Midjourney. Esto se debe a que la imagen resultante no depende únicamente del número de palabras, sino también de la interpretación del término y del modelo subyacente. Por ello, los especialistas en avisos deben estar familiarizados con el mayor número posible de sistemas diferentes. 

Dado que las prompts también pueden estar relacionadas con la creación de vídeos, no sólo se necesitan palabras clave eficaces y descriptivas, sino también guiones gráficos adecuadamente redactados. Este es otro caso en el que los bocetos pueden mejorar la calidad. En el futuro, esta tecnología podrá generar mundos enteros en 3D y formar así parte del Metaverso. La experiencia sería comparable a la de una Holocubierta, que se carga y genera según la descripción de un "prompt". En este caso, también es necesario introducir los términos correctos.   

 

Los inconvenientes y peligros de la tecnología

 

Sin embargo, el infinito mundo de las imágenes y vídeos generados por ordenador también tiene su lado oscuro. Por ejemplo, aún no se han aclarado los derechos de autor y el uso de los motivos de imágenes preexistentes y de las secuencias de películas que los sistemas se apropian para crear nuevo material. Además, los derechos de autor de las creaciones siguen flotando en una zona gris. Hasta la fecha, sólo DALL-E ha estipulado que los derechos de imagen pertenecen al creador. Además, los generadores de imágenes son tan buenos como su formación: el proceso de aprendizaje se basa únicamente en datos de imagen o 3D. Por lo tanto, se teme que los motivos artísticos y los videoclips sean tendenciosos, por ejemplo, podrían tener prejuicios sociales, excluir a determinados grupos de población o representar a esos grupos bajo una luz falsa. Por ello, las empresas y agencias tienen el deber de recopilar sus propios datos imparciales y sin derechos de autor y utilizarlos para entrenar el modelo. Estos modelos entrenados se conocen como "difusores" o "veganos". 

El potencial de la nueva tecnología es enorme y estas oportunidades no deben dejarse de lado. Por ello, la tecnología debe gestionarse de forma responsable, con las competencias adecuadas en el equipo, para que la comunicación asistida por ordenador siga siendo atractiva, creíble y diversa. Revolucionará nuestra perspectiva y traerá consigo ganancias de eficiencia, al igual que la introducción de los ordenadores lo hizo en términos de publicación digitalizada, procesamiento de imágenes y tipografía.

 

Autor: Jens Krahe, socio director de Plan.Net Colonia