Autres outils IA.
Le texte n'est qu'une porte d'entrée. Images, transcription audio, vidéo et code : l'écosystème IA dépasse largement le chat. Tour d'horizon des outils qui complètent votre boîte à outils en 2026.
Objectifs de ce chapitre
- Connaître les générateurs d'images
- Utiliser Whisper pour la transcription
- Comprendre la génération vidéo
- Découvrir les outils de niche
1 Générateurs d'images
Pour vos visuels marketing, blog et présentations, 4 options dominent en 2026.
- DALL-E (intégré à ChatGPT) · facile, qualité solide, gratuit avec ChatGPT Plus. Limite : un style un peu reconnaissable
- Midjourney · une qualité photo-réaliste exceptionnelle. Via Discord ou interface web. ~10 €/mois pour un usage commercial
- Stable Diffusion (open-source) · gratuit, à installer localement (matériel requis). Ultra customisable mais courbe d'apprentissage
- Adobe Firefly · intégré à Photoshop. Génération depuis du texte ou modification d'images existantes. Inclus avec l'abonnement Adobe
Visuels blog/réseaux → DALL-E ou Midjourney. Photos produit retouchées → Adobe Firefly. Mascotte ou illustration custom → Midjourney avec des prompts précis. Banque d'images perso au volume → Stable Diffusion en local.
2 Transcription audio (Whisper)
Whisper (OpenAI) est l'un des meilleurs transcripteurs audio du marché. Il convertit n'importe quel audio en texte avec une précision exceptionnelle.
- Cas d'usage · interviews, réunions, podcasts, vidéos YouTube, mémos vocaux
- Précision · 95 %+ même avec des accents et un bruit de fond modéré
- Multi-langues · plus de 100 langues supportées, dont un français nickel
- Outils accessibles · Otter.ai, Whisper Web, Google Recorder, ChatGPT Plus (intégré pour les fichiers audio courts)
- Coût · ~0,006 €/minute via l'API, soit environ 1 € pour 3 heures de transcription
Audio → Whisper → texte → ChatGPT/Claude → résumé, CR ou article. Vous transformez 1 h d'enregistrement en compte-rendu pro en 5 minutes au total.
3 Génération vidéo
La génération vidéo par IA explose en 2026. Encore expérimentale, mais les premiers usages pros émergent.
- Sora (OpenAI) · vidéos courtes (30 s à 1 min) photo-réalistes. Accès via ChatGPT Plus
- Runway · vidéos pros, contrôle créatif fin. ~15 à 95 €/mois selon l'usage
- Synthesia · des avatars IA qui parlent (idéal pour les formations vidéo, les démos produit). ~30 €/mois
- HeyGen · l'équivalent de Synthesia, plus accessible. ~30 €/mois
- Pika Labs · génération vidéo accessible, bon rapport qualité/prix
La génération vidéo IA marche surtout pour les vidéos courtes (15-60 s), explicatives ou marketing. Pour des vidéos longues, narratives, ou des humains naturels, c'est encore loin du résultat pro humain.
4 Génération de code
Si vous (ou votre équipe) faites du code, l'IA est un copilote massif. Et même les non-développeurs peuvent en profiter.
- GitHub Copilot · autocomplétion intelligente dans VS Code. ~10 €/mois. Économise 30 à 50 % du temps de dev
- Cursor · un éditeur de code nativement IA, plus puissant que Copilot. ~20 €/mois
- Claude / ChatGPT · pour expliquer du code, débuguer, écrire des fonctions complètes via le chat
- Cas d'usage PME non-tech · générer des scripts Excel/Google Sheets, des formules complexes, de mini-automatisations Zapier/Make
Pas besoin d'être développeur. « Écris-moi une formule Excel pour calculer X » donne souvent une formule fonctionnelle. Un petit test de validation, et le tour est joué.
Choisissez 1 outil IA non-chat à tester cette semaine : 1) générez 3 images avec DALL-E ou Midjourney pour un projet réel. 2) OU transcrivez un mémo vocal avec Whisper. 3) OU testez la génération vidéo (Synthesia propose 7 jours gratuits).
Voir la solution
Si vous obtenez 1 livrable utilisable (image publiée, transcription propre, vidéo de présentation), vous avez intégré l'outil. Au bout de 6 mois, vous en utiliserez 3 ou 4 différents au quotidien.
À retenir
- Images : DALL-E (facile), Midjourney (photo-réaliste), Stable Diffusion (local), Adobe Firefly (Photoshop).
- Whisper : le transcripteur audio de référence. Le pipeline audio → texte → chat est imbattable.
- Vidéo : Sora, Runway, Synthesia, HeyGen, Pika. Top pour le court, encore limité pour le long.
- Code : Copilot et Cursor pour les devs ; même les non-tech génèrent formules et scripts.
Quiz du chapitre 5
3 questions rapides. Cliquez votre réponse — le feedback apparaît immédiatement.
1. Quel outil pour transcrire un audio en texte ?
2. Quel outil pour générer des images photo-réalistes ?
3. Pour faire des vidéos avec un avatar IA qui parle ?
Aujourd'hui, je peux…
Cliquez pour cocher ce que vous maîtrisez après ce chapitre.
Allez plus loin avec une formation 1-to-1.
Si ce chapitre vous a plu, la Formation IA pour PME 1-to-1 va plus loin : on sélectionne ensemble les outils image, audio et vidéo adaptés à votre activité, et on construit votre workflow hybride sur des cas concrets.