Formation IA Image et vidéo

OBJECTIF PÉDAGOGIQUE

Acquérir les bases essentielles de l’IA générative d’images et de vidéos afin de maîtriser les principales plateformes en ligne et les workflows de génération locaux via ComfyUI.

DURÉE

3 jours (soit 21 heures)

PUBLIC CONCERNÉ

Toute personne désirant créer des images, vidéos et animations à l’aide d’IA générative, que ce soit pour des projets professionnels, artistiques ou personnels.

NIVEAU RECOMMANDÉ

Maîtriser l’environnement Mac ou PC.
Aucune compétence en graphisme requise.


LE CONTENU DU STAGE


1. Les plateformes en ligne d’IA générative image & vidéo

(Présentation, fonctionnement, usages, limites et bonnes pratiques)

Principes de l’IA générative image / vidéo

  • Différences entre modèles : diffusion, transformer, vidéo générative
  • Comprendre les prompts texte, les références images et les styles
  • Notions de seed, itérations, cohérence, composition
  • Formats d’export : image, GIF, MP4, WebM

1.1 Les 10 plateformes majeures

1.1.1 King

  • Génération photo-réaliste
  • Contrôle des poses, perspectives, compositions
  • Gestion des visages et cohérence de série
  • Optimisation de prompts orientés portrait

1.1.2 Seedream

  • Modèles réalistes spécialisés
  • Paramétrage des styles avancés
  • Définition de la lumière, ambiance et textures
  • Amélioration des séries cohérentes

1.1.3 Midjourney (ou alternative équivalente)

  • Interface Discord
  • Prompts courts vs prompts détaillés
  • Styles prédéfinis
  • Upscale, variations, cohérence

1.1.4 Ideogram

  • Spécialisation texte dans l’image
  • Génération typographique avancée
  • Création d’affiches, slogans, compositions

1.1.5 Stable Diffusion Web / DreamStudio

  • Modèles SDXL, Turbo, Flux…
  • Paramétrage de génération
  • Export haute définition
  • Génération par lot

1.1.6 Leonardo AI

  • Large bibliothèque de modèles
  • Génération d’assets, packshots, UI
  • Ajustement simple des styles et contextes

1.1.7 Krea

  • Génération temps réel
  • Mode image-to-image
  • Explorateur de styles
  • Création de textures et motifs

1.1.8 Runway

  • Génération vidéo (Gen-2 / Gen-3)
  • Outils d’animation et de transformation
  • Motion brush et retouches vidéo
  • Création publicitaire et storytelling

1.1.9 Pika

  • Génération vidéo à partir de texte
  • Transformation d’un clip existant
  • Contrôle du mouvement et du style
  • Animation créative rapide

1.1.10 Sora / Alternatives longues séquences

  • Génération longue durée (si accès)
  • Contrôle caméra
  • Transitions naturelles
  • Gestion du mouvement complexe

1.1.11 Gemini (environnement google)

  • Utilisation de l’écosystème Google
  • ImageFX : génération d’images détaillées
  • VideoFX : création de séquences vidéo à partir de texte
  • Analyse et génération multimodale
  • Avantages : cohérence, réalisme, simplicité d’usage
  • Intégration avec Drive, YouTube, Workspace

1.1.12 Veo 3

  • Modèle vidéo avancé de Google DeepMind
  • Génération haute cohérence : mouvements fluides, scènes complexes
  • Paramétrage du plan caméra
  • Production de vidéos cinématiques
  • Travail sur la précision des actions, effets, ambiance
  • Comparaison avec Runway, Pika, Sora

1.1.13 Hunyuan

  • Modèle image et vidéo chinois (Tencent)
  • Spécialisation dans les visages cohérents
  • Génération haute fidélité pour portraits et scènes naturelles
  • Robustesse sur détails textiles, objets et architecture
  • Mode vidéo : mouvements réalistes et transitions propres
  • Complémentarité avec les modèles occidentaux

1.2 Techniques communes à toutes les plateformes

  • Construction d’un prompt efficace
  • Références stylistiques, cadrages, ambiances
  • Utilisation d’images sources
  • Gestion lumière / couleur / texture
  • Cohérence entre plusieurs images
  • Retouches et upscale
  • Export haute résolution et optimisation

2. Génération locale d’images et de vidéos via ComfyUI

2.1 Installation et configuration

  • Installation ComfyUI
  • Compatibilité GPU
  • Téléchargement des modèles
  • Organisation des dossiers internes
  • Interface et navigation

2.2 Principes fondamentaux de ComfyUI

  • Fonctionnement par nodes
  • Pipeline de diffusion
  • CFG, seed, nombre de pas
  • Personnalisation du workflow
  • Gestion de la cohérence

2.3 Création d’images

  • Workflow texte → image
  • Image de référence
  • Utilisation de LoRA
  • Contrôle de composition
  • Upscale avancé

2.4 Génération vidéo locale

  • Modèles vidéo : LTX, Hunyuan, Wan
  • Construction d’un workflow vidéo
  • Animation image → vidéo
  • Séquences longues
  • Export vidéo et GIF
  • Amélioration fluidité et cohérence

2.5 Modules avancés

  • ControlNet (pose, profondeur, edges)
  • IPAdapter (styles, références)
  • Inpainting / Outpainting
  • Animation, interpolation, morph
  • Sauvegarde workflows personnalisés

2.6 Export & intégration

  • Conversion des fichiers
  • Préparation pour montage
  • Pipeline complet image → vidéo → post-production

LIEU ET DATE DE FORMATION

Apprentissage sur site, 8h00–12h00 / 13h00–16h00

PRIX

2 100 € (soit 100 €/heure)