OBJECTIF PÉDAGOGIQUE

Acquérir les bases essentielles de l’IA générative d’images et de vidéos afin de maîtriser les principales plateformes en ligne et les workflows de génération locaux via ComfyUI.

DURÉE

3 jours (soit 21 heures)

PUBLIC CONCERNÉ

Toute personne désirant créer des images, vidéos et animations à l’aide d’IA générative, que ce soit pour des projets professionnels, artistiques ou personnels.

NIVEAU RECOMMANDÉ

Maîtriser l’environnement Mac ou PC.
Aucune compétence en graphisme requise.

LE CONTENU DU STAGE

1. Les plateformes en ligne d’IA générative image & vidéo

(Présentation, fonctionnement, usages, limites et bonnes pratiques)

Principes de l’IA générative image / vidéo

Différences entre modèles : diffusion, transformer, vidéo générative
Comprendre les prompts texte, les références images et les styles
Notions de seed, itérations, cohérence, composition
Formats d’export : image, GIF, MP4, WebM

1.1 Les 10 plateformes majeures

1.1.1 King

Génération photo-réaliste
Contrôle des poses, perspectives, compositions
Gestion des visages et cohérence de série
Optimisation de prompts orientés portrait

1.1.2 Seedream

Modèles réalistes spécialisés
Paramétrage des styles avancés
Définition de la lumière, ambiance et textures
Amélioration des séries cohérentes

1.1.3 Midjourney (ou alternative équivalente)

Interface Discord
Prompts courts vs prompts détaillés
Styles prédéfinis
Upscale, variations, cohérence

1.1.4 Ideogram

Spécialisation texte dans l’image
Génération typographique avancée
Création d’affiches, slogans, compositions

1.1.5 Stable Diffusion Web / DreamStudio

Modèles SDXL, Turbo, Flux…
Paramétrage de génération
Export haute définition
Génération par lot

1.1.6 Leonardo AI

Large bibliothèque de modèles
Génération d’assets, packshots, UI
Ajustement simple des styles et contextes

1.1.7 Krea

Génération temps réel
Mode image-to-image
Explorateur de styles
Création de textures et motifs

1.1.8 Runway

Génération vidéo (Gen-2 / Gen-3)
Outils d’animation et de transformation
Motion brush et retouches vidéo
Création publicitaire et storytelling

1.1.9 Pika

Génération vidéo à partir de texte
Transformation d’un clip existant
Contrôle du mouvement et du style
Animation créative rapide

1.1.10 Sora / Alternatives longues séquences

Génération longue durée (si accès)
Contrôle caméra
Transitions naturelles
Gestion du mouvement complexe

1.1.11 Gemini (environnement google)

Utilisation de l’écosystème Google
ImageFX : génération d’images détaillées
VideoFX : création de séquences vidéo à partir de texte
Analyse et génération multimodale
Avantages : cohérence, réalisme, simplicité d’usage
Intégration avec Drive, YouTube, Workspace

1.1.12 Veo 3

Modèle vidéo avancé de Google DeepMind
Génération haute cohérence : mouvements fluides, scènes complexes
Paramétrage du plan caméra
Production de vidéos cinématiques
Travail sur la précision des actions, effets, ambiance
Comparaison avec Runway, Pika, Sora

1.1.13 Hunyuan

Modèle image et vidéo chinois (Tencent)
Spécialisation dans les visages cohérents
Génération haute fidélité pour portraits et scènes naturelles
Robustesse sur détails textiles, objets et architecture
Mode vidéo : mouvements réalistes et transitions propres
Complémentarité avec les modèles occidentaux

1.2 Techniques communes à toutes les plateformes

Construction d’un prompt efficace
Références stylistiques, cadrages, ambiances
Utilisation d’images sources
Gestion lumière / couleur / texture
Cohérence entre plusieurs images
Retouches et upscale
Export haute résolution et optimisation

2. Génération locale d’images et de vidéos via ComfyUI

2.1 Installation et configuration

Installation ComfyUI
Compatibilité GPU
Téléchargement des modèles
Organisation des dossiers internes
Interface et navigation

2.2 Principes fondamentaux de ComfyUI

Fonctionnement par nodes
Pipeline de diffusion
CFG, seed, nombre de pas
Personnalisation du workflow
Gestion de la cohérence

2.3 Création d’images

Workflow texte → image
Image de référence
Utilisation de LoRA
Contrôle de composition
Upscale avancé

2.4 Génération vidéo locale

Modèles vidéo : LTX, Hunyuan, Wan
Construction d’un workflow vidéo
Animation image → vidéo
Séquences longues
Export vidéo et GIF
Amélioration fluidité et cohérence

2.5 Modules avancés

ControlNet (pose, profondeur, edges)
IPAdapter (styles, références)
Inpainting / Outpainting
Animation, interpolation, morph
Sauvegarde workflows personnalisés

2.6 Export & intégration

Conversion des fichiers
Préparation pour montage
Pipeline complet image → vidéo → post-production

LIEU ET DATE DE FORMATION

Apprentissage sur site, 8h00–12h00 / 13h00–16h00

PRIX

2 100 € (soit 100 €/heure)

Formation IA Image et vidéo