Les outils IA pour faire des images d'architecture

L'IA évolue vite et la génération d'images d'architecture a fasciné notamment le monde des architectes et de l'architecture.

Mais de très nombreux outils ont émergé et ça devient un peu dur de savoir par où commencer.

Dans cet article, je vais faire le point sur les grandes catégories d'outils IA pour les images d'architecture.

En tant qu'architecte et passioné d'IA, je donne des formations à l'IA pour les architectes et ce chapitre fait partie de ma formation si cela t'intéresse de creuser le sujet.

Si tu veux être tenu au courant des meilleurs outils IA pour l'architecture, je mets à jour une boîte à outils IA pour les architectes que je t'invite à télécharger.

Donc revenons à notre sujet, quelles sont les grandes catégories d'outils IA pour faire des images d'architecture ?

Les outils IA de génération d'image avec l'IA

Suivant le type d'image que tu souhaites faire, et le temps dont tu disposes pour te former à l'utilisation de l'IA pour les images d'architecture. Il existe différentes catégories d'outils dont je vais te présenter quelques-uns des plus connus.

Midjourney, le plus artistique et inspirant

Midjourney est très connu pour les images séduisantes qu'il produit. En fait, ce n'est pas très difficile d'obtenir de bons résultats avec Midjourney, et c'est ce qui fait sa force.

Image faite avec le prompt "blue wall" / On peut faire mieux en termes de prompt engineering, et pourtant c'est élégant !

C'est également un outil formidable pour trouver des idées par sérendipité, association d'idées.

Partir d'une première idée puis en découvrir au fur et à mesure. D'ailleurs tu peux lancer une série de générations d'image tout en travaillant sur un prompt par exemple. Car la génération peut parfois prendre un certain temps.

Par défaut, il génère une grille de quatre images, qui sont quatre versions possibles à partir d'un même prompt.

L'interface de Midjourney est très agréable et rend la production d'image très inspirante.

Il est aussi facile de faire des variations ou bien de partir du prompt d'un autre utilisateur. Il y a en effet une partie galerie d'image partagée dans lequel on peut puiser. Même si les images d'architecture ne sont pas très nombreuses et souvent trop stylisées, il y a de bons exemples pour trouver des idées.

Cas d'usages de Midjourney pour l'architecture :

  • Trouver des inspirations de projets
  • Faire des illustrations par exemple pour les réseaux sociaux
  • Expérimenter le fait de "Concevoir avec des mots"

Principales fonctionnalités :

  • Génération d'image d'après un prompt
  • Génération d'image d'après une image
  • Mélange de plusieurs images
  • modification partielle d'une image d'après un prompt (Inpaiting)
  • Génération d'un contexte autour de l'image (Outpainting)

Avantages de Midjourney pour l'architecture :

  • Interface élégante et plutôt intuitive
  • Image très aboutie artistiquement sans être un expert des prompts

Inconvénients de Midjourney pour l'architecture :

  • Pour l'instant pas d'image de contrôle donc on ne peut pas l'utiliser pour les rendus d'architecture avec l'IA
  • Un abonnement obligatoire à 10$, pas de version d'essais
  • Le inpainting ne marche pas tout le temps

DALL-E, le plus intégré et rapide

Image d'une maison moderne dans le style de Kengo Kuma au milieu de la forêt amazonienne. Image générée avec Dall-E intégré à ChatGPT

DALL-E est un peu en retrait de Midjourney, particulièrement en termes de réalisme. Cependant, il a un atout de poids. Il est intégré à ChatGPT !

Et donc cela veut dire que tu peux l'utiliser très simplement, ChatGPT se chargeant d'écrire des prompts en anglais détaillé directement optimisé pour DALL-E.

C'est un avantage si on veut pouvoir parler en langage naturel sans être un expert du prompt engineering. Mais cela peut aussi être un défaut, car le prompt étant une longue phrase détaillée, on peut moins facilement le contrôler que par exemple avec les prompts Stable Diffusion.

Dans l'ensemble, DALL-E a des résultats très corrects, même si son style est plus proche de l'illustration que de l'image photoréaliste.

Depuis quelques mois, il dispose également d'une fonctionnalité de Inpainting, c'est-à-dire de modification partielle de l'image, qui n'est pas mauvaise. Même si le Inpainting ne marche pas à tous les coups.

Ce qui est particulièrement intéressant dans DALL-E est sa capacité à créer un prompt de manière itératif, tout ça en langage naturel. Donc, tu peux commencer par décrire les grandes lignes du bâtiment ou de la scène que tu veux visualiser. Puis par exemple demander de remplacer le béton par le bois.

ChatGPT qui traduit tes propos pour son module de génération d'image DALL-E, va se charger de mettre à jour le méga -prompt tout en finesse pour que l'image ne change pas trop.

Cas d'usages de DALLE-E pour l'architecture :

  • Trouver des inspirations d'architecture
  • Faire des illustrations par exemple pour les réseaux sociaux
  • Affiner un prompt pas à pas, pour avoir l'image que l'on recherche

Avantages de DALL-E pour l'architecture :

  • Pas d'abonnement en plus à payer si tu as un abonnement pour ChatGPT
  • Pas besoin de maîtriser l'anglais, ni même l'art des prompts
  • Interface très simple, il n'y en a pas !
    Il suffit de dire à ChatGPT qu'on veut générer une image

Inconvénient de DALL-E pour l'architecture :

  • Image au style pas assez réaliste
  • Pas de possibilité de contrôle d'après un croquis ou une image

Stable Diffusion, le plus puissant et flexible

Le modèle Flux de Stable diffusion permet des images encore plus réalistes, mais également tout le niveau de contrôle que l'on souhaite.

Stable Diffusion occupe une place à part dans le paysage de l'IA pour les images. En effet, c'est un modèle open source, ce qui veut dire, que pratiquement, c'est gratuit de l'utiliser si on l'installe en local.

Mais cela veut dire aussi qu'il est utilisé par de très nombreux outils qui ne développent pas leur propre modèle d'IA.

Mais c'est aussi l'outil qui permet d'aller le plus loin en s'appuyant notamment sur des interfaces Stable diffusion très puissantes comme ComfyUI.

Et de créer des processus de création d'images personnalisés.

Car on peut utiliser Stable diffusion de nombreuses manières :

  • En local via l'une des interfaces open source (Automatic 111, ComfyUI...) et piloté par un gestionnaire comme Stability Matrix (Voir comment installer Stable Diffusion en local facilement)
  • Via un logiciel de rendus IA pour les architectes qui utilise les modèles Stable Diffusion comme Look-X ou Rendair
  • Via un logiciel intégré aux logiciels BIM Archicad ou Revit comme Veras ou Archicad AI
  • En API par exemple depuis une automatisation via des services comme Replicate pour par exemple produire de nombreuses images rapidement sans avoir d'ordinateur puissant en local
Comfy UI est une interface de Stable Diffusion la plus flexible et puissante pour faire des images d'architecture avec l'IA une fois qu'on a apprivoisé son système de noeuds

Bref, Stable Diffusion est complexe à appréhender, mais est la source de la plupart de l'innovation dans le domaine, dû au fait qu'il s'agit d'un modèle d'IA opensource que chacun peut utiliser et intégrer dans des outils.

Si tu veux en savoir plus sur Stable Diffusion, consulte le guide complet pour commencer avec Stable Diffusion pour l'architecture.

Mais alors, est-ce qu'il faut se mettre à Stable diffusion pour faire des images d'architecture et notament des rendus avec l'IA ?

Pas forcément pour commencer, car il existe plusieurs logiciels IA pour les images d'architecture qui sont plus simples à appréhender.

Néanmoins, en tant que créatifs et architecte, tu aimes peut-être explorer des voies pour trouver un style qui t'es propre.

Et en utilisant directement Stable diffusion en local, on peut maîtriser petit à petit toutes les subtilités et même finir par fine tuner (personaliser) un modèle pour avoir des rendus proches de ce que tu as l'habitude de faire à la main ou via d'autres techniques.

Mais au-delà de la génération d'image avec l'IA, on peut même, grâce à ComfyUI, l'interface modulaire pour Stable Diffusion, créer des scénarios de production très variés, qui peuvent permettre de gagner beaucoup de temps sur des tâches de production visuelle.

Cas d'usages de Stable diffusion pour l'architecture :

  • Trouver des inspirations d'architecture
  • Rendus d'après un croquis ou une 3D simplifiée
  • Édition d'images : agrandissement, contexte...
  • Très nombreux autres cas

Avantages de Stable diffusion pour l'architecture :

  • Pas de limites et de nombreux modèles et LORA disponibles
  • Modulaire et plusieurs interfaces suivant la complexité voulues
  • On comprend le fonctionnement des modules aveec ComfyUI
  • On peut personnaliser avec ses propres images

Inconvénient de DALL-E pour l'architecture :

  • Apprentissage plus long
  • Si installation en local, on a besoin d'ordinateurs puissants
  • L'open-source veut dire du choix, beaucoup de choix !
  • Les interfaces ne sont pas parfaites en termes de clarté

La boîte à outils IA pour les architectes

J'ai rassemblé les meilleurs outils pour les architectes

En tant qu'architecte et spécialiste de l'IA pour l'architecture, j'ai créé une base de données d'outils IA pour l'architecture.
Mon objectif est de fournir une liste de logiciels stables et prometteurs dans ce marché en plein essor.

Et de te permettre de gagner du temps pour éviter d'évaluer comme j'ai fait les dizaines d'outils IA pour l'architecture qui sortent régulièrement !