Escreva seus prompts para gerar imagens com Inteligência Artificial
Recomendações para obter melhores resultados com a IA generativa

A facilidade de uso das IA generativas pode ser um faca de dois gumes: ao mesmo tempo que permitem a utilização por usuários não especialistas, de forma intuitiva e com bons resultados, um uso mais eficaz exige alguns conhecimentos e cuidados.
Para isso, existem algumas recomendações para chegar a imagem esperada e obter criações satisfatórias, de acordo com as próprias ferramentas:
Acionamento
Utilize um comando logo no início, especialmente se você estiver usando um agente conversacional como ChatGPT Plus ou Bing Image Creator. Ao utilizar verbos como "crie", "ilustre", "visualize" e "desenhe" o chat irá entender que você precisa de uma imagem e não uma resposta textual.
Descrição
Embora as chamadas "palavras de parada" (um/uma, de, para...) possam a lhe ajudar a escrever de forma mais natural, elas são irrelevantes para o algoritmo. Por isso é importante focar os elementos descritivos, num mínimo de seis palavras, que vão definir a imagem.
Dessa forma se recomenda utilizar o prompt como uma lista de frases, separadas por vírgulas, separando cada um dos elementos da imagem. Em outras palavras, use um formato consistente, com uma organização lógica.
Especificidade
Seja o mais específico possível ao descrever os elementos que deseja incluir na imagem. Alguns elementos que as IAs entendem são:
Tipo de imagem (foto, pintura, diagrama, logotipo, modelo 3D…)
Contexto (cena, ambiente de fundo, futurista…)
Ação e posicionamento (do sujeito (de pé, deitado…)
Detalhes (textura, tamanho, forma…)
Iluminação (luz natural, dramática, suave…)
Atmosfera (sereno, sonhador, tenso, melancólico…)
Enquadramento (close, ponto de vista elevado, vista lateral, vista aérea…)
Lente (fundo desfocado, grande angular…)
Estilo (realista, surrealista, anime, arte pixelada…)
Forma alternativa de arte (escultura, colagem, grafite…)
Paleta de cores (pastel, vibrante, neon…)
Proporção (1:1, 19:6…)
Resolução, se o modelo permitir (4K, 8K…)
Ao mesmo tempo, evite ambiguidades e abstrações que possam ser interpretados incorretamente pela IA, como por exemplo "imaginário", "caro".
Unilateralidade
Embora possa parecer uma conversa, cada prompt gera uma única imagem, sem referência à anterior. Cada pedido para ajuste irá gerar uma nova interpretação por parte da . Com isto em mente, uma imagem geralmente exige várias iterações e refinamentos do prompt.
Restrições
Se houver elementos que você não deseja na imagem, deixe isso claro no prompt. Por exemplo, “sem pessoas”, “sem objetos modernos” ou “sem uso de cores escuras”.
Referências
Em alguns modelos é possível incluir imagens que sirvam como referência. Além disso algumas plataformas disponibilizam galerias de imagens e os prompts utilizados pelos usuários. Como dizem por aí, "copie, mas não faça igual".
Esta abordagem de engenharia reversa é inclusive adota por alguns aplicativos que fazem o caminho de uma imagem enviada para o prompt textual.
Colocando em prática
Juntando todas estas orientações, seguem alguns exemplos de prompts. Sugiro testarem e nos enviarem os resultados, para uma grande comparação numa próxima edição da newsletter.
Pintura abstrata de uma tigela com frutas quadradas tons quentes vista lateral 3:2
Uma representação abstrata da dança cósmica de planetas e estrelas com redemoinhos de cores e luz 4K
Uma cena animada de um festival renascentista, com bufões, músicos e artesãos entretendo uma multidão
Este aqui, gerado através de ferramenta de imagem para prompt, baseado numa pintura famosa. Mas notar que basicamente descreveu a imagem, sem adicionar instruções sobre estilo, forma de arte, proporção…
A pintura retrata um grupo de homens reunidos ao redor de um homem deitado em uma cama. O homem está vestindo uma túnica preta e um chapéu preto, e segura um livro na mão, aparentemente lendo-o. A cama está coberta com um lençol branco e há um livro do lado direito da cama.
Nove homens estão presentes na pintura, todos olhando para o homem deitado. Eles estão vestidos com roupas de estilo medieval, alguns usando babados brancos, outros vestindo túnicas pretas. Todos têm expressões sérias e seus olhares convergem para o homem no centro da cena. O fundo da imagem é escuro, criando uma atmosfera sombria e contemplativa.
Até que deu certo relativamente certo!
Agora o prompt original e o ajuste realizado pela ferramenta na imagem utilizada no texto sobre criação de imagens de IA no contexto pedagógico.
bentinho e capitu se olhando apaixonadamente ao fundo o cenário do rio de janeiro do século 19
Uma representação de Bentinho e Capitu se abraçando, olhando amorosamente nos olhos um do outro, ambientada no vibrante cenário do Rio de Janeiro do século XIX, com o icônico Pão de Açúcar e a arquitetura colonial ao fundo. Inspirada nas obras de Terrence Malick, Alejandro González Iñárritu e Christopher Doyle, a imagem exala uma grandeza cinematográfica, evocando os romances épicos da literatura clássica brasileira. Filmada virtualmente em 35mm, com uma proporção de 2.39:1, o quadro é impregnado de uma luz dourada e quente, um leve grão de filme e uma suave vinheta, conferindo uma qualidade nostálgica e onírica. A paleta de cores é rica e suave, com tons terrosos e azuis profundos, lembrando uma quente noite de verão. A iluminação é dramática, com sombras profundas e destaques quentes, acentuando a intensidade emocional do momento. Cada detalhe, desde a renda intricada no vestido de Capitu até a textura áspera das paredes de pedra colonial, é meticulosamente renderizado, convidando o espectador a entrar no mundo do Rio de Janeiro do século XIX.
Com essas recomendações, é possível escrever prompts que orientem a IA de forma mais eficaz, aumentando a probabilidade de gerar imagens que correspondam às expectativas. Mas como tudo na vida, é questão de prática!
Fontes
Torne-se mestre em IA com estes 12 comandos para o gerador de imagens (Adobe)