Cinématographie avec Midjourney : Types de caméras et de prises de vue (génération d’images AI)
Création d’images IA cinématographiques avec Midjourney
Il s’agit de la troisième partie d’une série en trois parties sur les invites cinématographiques . Dans cet article, nous couvrirons les éléments suivants :
- Référencement des types de caméras avec des suffixes de qualité
- Référencer les types de caméras directement/indirectement
- Référencement des types de prise de vue de base
- Prises de vue en contre-plongée/plongée et profondeur de champ
- Faire référence aux tirs par-dessus l’épaule
Si vous avez raté les deux premières parties de cette série, vous pouvez les lire ici :
Première partie : Cinématographie avec Midjourney, Partie 1 : Anatomie d’une invite cinématographique
Partie 2 : Cinématographie avec Midjourney, Partie 2 : Mis-En-Scène & Lighting (AI Image Generation)
Présentation des types de caméras
Différents types de caméras peuvent être utilisés pour créer différents types d’apparence. Les images des caméras analogiques, par exemple, sont créées par des processus photochimiques qui créent un aspect cinématographique en raison des « imperfections » du processus de coloration (quelque chose que les caméras numériques, telles que l’ARRI Alexa, essaient d’imiter ; en savoir plus à ce sujet ici ). D’autres types d’appareils photo, tels que les anciens appareils photo Super 8 ou 16 mm, ont une esthétique basée sur une faible résolution et un film granuleux.
Fait amusant : vous pouvez faire appel à certains des premiers pionniers du cinéma comme le photographe Eadweard Muybridge, qui a placé 12 caméras le long d’une piste de course de chevaux pour créer une série de photographies séquentielles en 1878. L’homme est devenu si célèbre pour la « chronophotographie de la locomotion animale ». que vous pouvez demander à Midjourney de rendre dans le style de son travail :
/invite invite : séquence de Muybridge


Lors de la référence aux types de caméras, nous devons garder à l’esprit que certaines caractéristiques de la caméra peuvent déjà être incluses dans notre invite, même sans mentionner explicitement aucune caméra. Par exemple, dans des descriptions de style comme celle-ci :
film encore, scène d’arrêt de bus, style de 1954 film à suspense – ar 3: 2 – graine 3000

La référence à l’époque donne déjà à Midjourney une base pour rendre l’image d’une manière cohérente avec les techniques de caméra de l’époque : le film noir et blanc. La référence au genre indique en outre des éléments tels que la composition, l’éclairage discret, le contraste, etc.
Le défi avec l’invite explicite pour certains types d’appareils photo est que vous pouvez vous retrouver avec une image d’un appareil photo dans l’image et non le look que vous souhaitez créer. Il existe des exceptions en ce qui concerne les types d’appareils photo très populaires, tels que ceux d’Arnold & Richter (Arri), Paillard-Bolex ou Panavision. Cependant, ceux-ci sont souvent implicites dans les descriptions de style et comportent certaines limitations, car ils sont principalement liés à un type d’utilisation spécifique ou à une prise de vue pour Midjourney.
Types de caméras traditionnelles et modernes
Pour mieux illustrer les prédéfinitions incluses dans les références au genre et à l’époque, comparez les deux invites suivantes et leurs résultats :
film encore, homme sur un toit, style par film de science-fiction des années 2020 – ar 3: 2 – graine 3000
et
film encore, homme sur un toit, style par film de science-fiction des années 1950 – ar 3: 2 – graine 3000
Nous voyons que l’esprit du temps respectif dicte le style de rendu : d’une part, des prises de vue inspirées du jeu de tir à la première personne avec des caméras modernes et un étalonnage des couleurs ; de l’autre, des contre-plongées d’un héros à la coiffure cliché et au grain cinématographique.


Si nous devions encore décrire les caractéristiques de prise de vue du film de science-fiction des années 2020, nous pourrions énumérer les éléments suivants :
- pointu et détaillé
- grain fin
- couleurs dramatiques
La version des années 1950 pourrait être caractérisée comme ceci :
- pas de couleurs dramatiques
- couleurs tamisées
- grain de film
Voyons d’abord ce qui se passe lorsque nous appliquons les caractéristiques de la version 2020 comme suit :
image de film, homme sur un toit, style par film de science-fiction des années 2020, net et détaillé, grain fin, couleurs dramatiques – ar 3: 2 – graine 3000
Et la version des années 1950 comme celle-ci :
image de film, homme sur un toit, style de film de science-fiction des années 1950, grain de film, couleurs tamisées – pas d’éclairage dramatique – ar 3: 2 – graine 3000


Apparemment, ils restent à peu près dans les caractéristiques du genre / de l’époque.
Ajoutons maintenant les caractéristiques des années 1950 à la version des années 2020 et vice versa :
image de film, homme sur un toit, style par film de science-fiction des années 2020, grain de film, couleurs tamisées – pas d’éclairage dramatique – ar 3: 2 – graine 3000
et
photo de film, homme sur un toit, style film de science-fiction des années 1950, net et détaillé, grain fin, couleurs dramatiques – ar 3: 2 – graine 3000


Nous pouvons voir que les prédéfinitions de genre / époque sont si fortes que Midjourney transforme plutôt les résultats en images caricaturales que d’autoriser les caractéristiques de production de films de 2020 dans un film de science-fiction des années 1950 ou d’ajouter des limitations techniques des années 1950 dans un blockbuster des années 2020.
Mais, nous pouvons changer de style. Nous allons donner au film des années 1950 encore un aspect des années 2020 en ajoutant un suffixe général d’appareil photo/de qualité comme « 8k, photoréaliste », et d’autre part transformer les années 2020 en années 1950 en ajoutant un suffixe d’appareil photo/de qualité comme « eastmancolor, photoréaliste » ( notez qu’il existe de nombreux suffixes que vous pouvez utiliser ici ; ce qui précède s’est avéré assez robuste).
Invites complètes :
image de film, homme sur un toit, style film de science-fiction des années 1950, net et détaillé, grain fin, couleurs dramatiques, 8k, photoréaliste – ar 3: 2 – graine 3000
image de film, homme sur un toit, style par film de science-fiction des années 2020, couleurs tamisées, grain de film, eastmancolor, photoréaliste – pas d’éclairage dramatique – ar 3: 2 – graine 3000


Technicolor : hier et aujourd’hui
Remarque intéressante : si vous utilisez l’expression « Technicolor, photoréaliste » pour faire référence au populaire processus de couleur à trois bandes Technicolor, vous n’obtiendrez pas les images super saturées et à contraste élevé de l’ère Technicolor, mais plutôt quelque chose qui ressemble une interprétation moderne du filtre Instagram de « Technicolor » avec beaucoup de cyan et de magenta.
image de film, homme sur un toit, style par film de science-fiction des années 2020, couleurs tamisées, grain de film, technicolor, photoréaliste – pas d’éclairage dramatique – ar 3: 2 – graine 3000

Vous pouvez obtenir de bons rendus technicolor, cependant, si vous le faites correspondre aux prédéfinitions pour appliquer la référence technicolor historique au lieu du booster cyan/magenta. Voici quelques exemples avec
photo de film, [description de la scène], style des années 1940 [référence du genre], technicolor, photoréaliste — ar 3:2 — graine 3000



Caméras anciennes
Il existe de nombreux styles d’appareils photo que vous pouvez expérimenter. Pour ceux qui s’intéressent à l’évolution de la pellicule couleur et aux innovations comme Pathécolor, Kinemacolor, Technicolor et Eastmancolor, consultez ce lien .
En voici une intéressante :
film, scène d’arrêt de bus, style de 1954 thriller, pathécolor — ar 3:2 — graine 3000

Midjourney « comprend » apparemment que cela a à voir avec la teinte du film, mais évidemment, ce n’est pas vraiment à quoi ressemblent les films Pathécolor. Nous pouvons cependant demander à Midjourney de recréer quelque chose de très similaire au style pathécolor en décrivant ce que nous voulons réellement :
image de film, scène d’arrêt de bus, style de 1954 thriller, film teinté — ar 3:2 — graine 3000

Bien sûr, ce n’est pas la vraie affaire, mais cela nous montre un moyen de gérer les limites du modèle Midjourney actuel et d’obtenir de bons résultats en décrivant les caractéristiques d’un type de film/caméra particulier.
N’oubliez pas non plus qu’une référence de style affecte toujours la scène entière. La façon dont les modèles de diffusion fonctionnent, vous ne pouvez pas contrôler les éléments individuels, vous devez toujours créer une invite qui pointe généralement vers la scène que vous souhaitez créer.
Par exemple, si vous voulez l’esthétique de la photographie couleur ancienne et que vous faites référence au processus autochrome (début des années 1900), tout votre décor changera :
photo de film, scène domestique, style par autochrome — ar 3:2 — graine 3000

Même chose avec Kodachrome, un film couleur populaire dans les années 1930-1950 :
photo de film, scène domestique, style par kodachrome — ar 3:2 — graine 3000

Même faire référence à une époque ultérieure ne fonctionne pas correctement : le décor et les costumes ressemblent toujours au style des années 40/50 des séquences kodachrome.
film encore, scène domestique, style thriller des années 2020, kodachrome — ar 3:2 — graine 3000

Développement de solutions de contournement pour les types de caméras
Étant donné que dans la plupart des cas, la référence directe des types de caméras ne fonctionne pas encore avec Midjourney, nous pouvons essayer de développer des solutions de contournement en recherchant du matériel de référence bien connu et présentant des caractéristiques similaires.
Par exemple, pour obtenir un look « amateur », « super8 » ou « dogme » :
film fixe, scène domestique, style par appareil photo jetable – ar 3: 2 – graine 3000

Ou, si vous voulez que ce soit plus « amateur », essayez la « photographie au sténopé ». S’il est trop flou, cela peut être équilibré avec les suffixes de qualité mentionnés ci-dessus.
photo de film, scène domestique, style par photographie au sténopé — ar 3:2 — graine 3000

Référencement des types de prise de vue de base
Les types de plans ont un tel impact sur la narration visuelle qu’une manière canonique de les utiliser s’est développée :
- plans larges pour donner un aperçu de la scène,
- plans moyens pour illustrer l’action,
- des gros plans pour se concentrer sur un personnage ou un objet en particulier,
- des gros plans extrêmes pour des scènes intenses.
Heureusement, nous pouvons nous y référer directement dans une invite comme suit :
photo du film, astronaute dans la jungle, gros plan — ar 3:2 — graine 3000

photo du film, astronaute dans la jungle, plan moyen — ar 3:2 — graine 3000

photo du film, astronaute dans la jungle, prise de vue en plongée, vue d’en haut — ar 3:2 — graine 3000

photo de film, astronaute dans la jungle, grand angle — ar 3:2 — graine 3000

Parfois, le rendu des prises de vue grand angle échouera à cause de la description de la scène. Dans ce cas, pour de meilleurs résultats, vous devez décrire ce qu’impliquerait une prise de vue en grand angle en plus du personnage :
photo du film, astronaute dans la jungle, montagne en arrière-plan, grand angle — ar 3:2 — graine 3000
ou
photo du film, astronaute dans la jungle, plantes et grands arbres en arrière-plan, grand angle — ar 3:2 — graine 3000


Soit dit en passant, une méthode pour contrer la tendance de Midjourney à rendre les personnages tournés vers le spectateur est de décrire ce qu’ils font, par exemple :
photo de film, astronaute dans la jungle, cuisine au feu de camp, plan moyen — ar 3:2 — graine 3000

Prises de vue en contre-plongée et en plongée
Outre les tailles de plan, la position de la caméra est également importante pour apporter des nuances dans la description des personnages ou des scènes :
photo du film, astronaute dans la jungle, contre-plongée — ar 3:2 — graine 3000

Comme ces résultats ne sont pas encore vraiment convaincants (à part l’image en haut à droite peut-être), on peut essayer de faire respecter la position de la caméra en utilisant deux descriptions similaires l’une à côté de l’autre. Dans ce cas : « contre-plongée » et « vue du sol » :
photo du film, astronaute dans la jungle, contre-plongée, vue du sol — ar 3:2 — graine 3000

Ceci est vraiment mieux. Essayons plus d’application :
image fixe, astronaute dans la jungle, contre-plongée, prise de vue en contre-plongée — ar 3:2 — graine 3000

Malheureusement, l’application de prises de vue en plongée a tendance à créer des vues aériennes. Dans ce cas (comme avec l’angle néerlandais, le POV et certains autres types de plans), relancer et sélectionner les meilleures variations est la seule solution pour le moment :
photo du film, astronaute dans la jungle, prise de vue en plongée — ar 3:2 — graine 3000

photo du film, astronaute dans la jungle, vue aérienne — ar 3:2 — graine 3000

Profondeur de champ
Un autre élément important de la narration visuelle est la profondeur de champ . Idéalement, vous souhaitez créer une image fixe composée de trois couches :
- premier plan (flou),
- milieu de terrain (où se déroule l’action),
- arrière -plan (flou ou éloigné en perspective).
C’est psychologiquement la structure la plus attrayante pour une image, car elle est très proche de notre perception. Voici une illustration de ce principe dans un rendu « grand angle » avec les flèches jaunes pointant vers les éléments de premier plan et le trait bleu marquant l’arrière-plan.

Dans un plan moyen sans aucune description de ces trois couches, les éléments de premier plan sont plutôt clairsemés. Le préfixe « film still » force un aspect cinématographique de base, mais cela pourrait être mieux :
photo de film, cow-boy dans le désert, style science-fiction des années 2020, plan moyen — ar 3:2 — graine 3000

En mentionnant « faible profondeur de champ », nous réduisons le terrain d’entente et avançons davantage vers les trois couches que nous voulons :
photo de film, cow-boy dans le désert, style années 2020 science-fiction, plan moyen, faible profondeur de champ — ar 3:2 — graine 3000

Une autre façon de procéder consiste à utiliser des valeurs f-stop typiques de la photographie, par exemple :
photo de film, cow-boy dans le désert, style science-fiction des années 2020, plan moyen, f/2.8 — ar 3:2 — graine 3000
(Notez le changement dans l’approche générale de l’éclairage et des couleurs, qui est plus vers le look DSLR.)

Un autre exemple, d’abord, sans aucune spécification DOF :
photo de film, scène de rue, plan moyen — ar 3:2 — graine 3000

Alors:
photo de film, scène de rue, plan moyen, faible profondeur de champ — ar 3:2 — graine 3000

Coups par-dessus l’épaule
Les plans Over-The-Shoulder (OTS) ne font pas seulement partie intégrante de la narration visuelle, mais ils sont également parfaits pour montrer comment l’application fonctionne lorsque vous invitez Midjourney.
Une approche simple comme celle-ci ne fonctionnera pas :
photo du film, homme et femme, prise de vue par-dessus l’épaule — ar 3:2 — graine 3000

Comme précédemment, nous recherchons maintenant d’autres caractéristiques d’un tir OTS que nous pourrions utiliser pour l’appliquer. Une évidence est la profondeur de champ. Mais le mentionner ne suffit pas :
photo de film, homme et femme, prise de vue par-dessus l’épaule, faible profondeur de champ — ar 3:2 — graine 3000

L’invite est toujours incohérente. Nous avons besoin que la scène corresponde au type de prise de vue :
photo de film, homme et femme en conversation, prise de vue par-dessus l’épaule, faible profondeur de champ — ar 3:2 — graine 3000

Ceux-ci peuvent être affinés avec des mesures d’application et des « crochets » (en plaçant des éléments d’invite similaires ou identiques à différents endroits de l’invite)
photo du film, vue par-dessus l’épaule, homme et femme ayant une conversation, prise de vue par-dessus l’épaule, faible profondeur de champ — ar 3:2 — graine 3000

Jusqu’où sommes-nous allés ?
Vous vous souvenez que nous voulions imiter cette référence directe au style de Wes Anderson ?

À la fin de la première partie , nous avons pu utiliser cette invite à la place :
photo du film, homme en veste bleue assis dans un bar, couleurs douces et symétriques, mur orange clair – ar 3: 2 – graine 3000

Après la deuxième partie , nous avons ajusté l’éclairage et la mise en scène pour mieux coller au style d’un film de Wes Anderson :
photo du film, homme en veste bleue assis dans un bar, couleurs douces et symétriques, mur orange clair, éclairage naturel – ar 3: 2 – graine 3000 – pas d’ombres

Ce qui nous rapprochait déjà assez.
Maintenant, avec plus de contrôle sur les types de caméra et de prise de vue, nous pouvons ajuster davantage notre invite avec ces éléments :
- ajoutant « 8k, photoréaliste »
- ajouter « grand angle »

Amusez-vous à expérimenter et merci d’avoir lu ! 🙏
Si vous avez manqué les parties précédentes, vous pouvez les consulter ici :
Partie 1 : Anatomie d’une invite cinématographique, faisant référence au genre et au style
Partie 2 : Éclairage et mise en scène
Partie 3 : Types d’appareil photo et de prise de vue