Synthèse des nouveautés open-source et modèles majeurs
📅 06 juin 2026 · Sources : GitHub Trending, HF Models, Ollama, OpenRouter, Arena AI🔥 Claude Opus 4.8 monte en flèche (+851% d'usage OpenRouter). Gemini 3.5 Flash, Muse Spark et MiniMax-M3 apparaissent comme challengers sérieux avec des scores en hausse significative. Le top 10 mélange fortement modèles fermés et ouverts.
Famille multimodale Google — vision, thinking, tools, audio. Disponible sur Ollama (ollama run gemma4). 5 tailles jusqu'à 31B. 12.2M pulls en 24h.
Modèle raisonnement haute performance NVIDIA. Sur HF : NVIDIA-Nemotron-3-Ultra-550B-A55B-BF16 (561B) et variant NVFP4 (335B). Haute qualité reasoning.
Frontier multimodal MiniMax — 1M context window. Score Arena #5 (+16). Usage OpenRouter en hausse de +203%. Prix ultra compétitif $0.6/$2.4.
Nouveau modèle Meta dans la gamme Muse. Score Arena #6 avec +16 points. Modèle propriétaire avec potentiel ouvert.
Google — nouvelle génération Flash. Prêt à l'emploi via Vertex AI. Prix accessible $1.5/$9 avec 1M contexte.
Alibaba — suite logique de Qwen 3.6. Algorithme de raisonnement avancé avec thinking préservé. Prix $1.25/$3.75 sur API.
862B parameters, 5.51M downloads HF. Variante thinking disponible. MIT license. Leader usage OpenRouter 3.12T tokens/semaine.
Model chinois Moonshot — raisonné multimodal. 286.7K pulls Ollama. MIT modifié. Très fort score arena (#7, +9).
Dernière version xAI. 1371 arena score (+10). Variants reasoning rapide disponibles. Prix agressif $1.25/$2.50.
IBM/TwoSigma — 3B/8B/30B. Apache 2.0. Prix bas $0.05/$0.10. Idéal déploiement edge et entreprise. Sur Ollama et HF.
128B paramètres. Multimodal vision+tools. Apache 2.0. Prix $1.50/$7.50. Nouveau modèle de Mistral avec forte montée en score arena (+19).
814 tokens/sec — le modèle le plus rapide du classement. 128K contexte. Spécialisé vitesse de sortie. Propriétaire.
MoE 8B total / 1B actif. Pour deployment edge/low-latency. Ollama ajouté il y a 6 jours. Thinking capabilities.
Famille video generative NVIDIA : Nano (16B), Super (65B), Super Text2Image, Super Image2Video. Modelos abiertos para generación video.
Sulphur.ai — texte vers vidéo. 9B paramètre, 2.18k pulls HF, 1.57k likes. Montée rapide en popularité cette semaine.
BosonAI — 5B TTS model. Sur HF et Ollama. Qualité TTS améliorée, support multi-langues.
Nouveau modèle génération audio/musique Mistral. Score arena 1199. Précision et qualité supérieure pour la production musicale IA.
Compression RAG & tool outputs avant l'LLM. Réduit tokens de 60-95%. Fonctionne comme library, proxy ou MCP server. Essentiel pour réduire les coûts d'inférence.
Memory engine ultra-scalable. "The Memory API for the AI era". Intégrable dans tout pipeline agent.
Meta-skill qui crée des équipes d'agents spécialisés par domaine. Génère automatiquement les skills nécessaires.
Plugin Compound Engineering pour Claude Code, Codex, Cursor. 20k stars en ascension rapide.
Test prompts, agents et RAGs. Red teaming et pentesting sécurité IA. Compare GPT, Claude, Gemini, DeepSeek.
Parseur document rapide Rust par LlamaIndex. Alternative open-source aux parsers coûteux.
IA locale YC(S26) qui enregistre tout ce que vous voyez/dites/entendez. Privé, sécurisé, local. 19k stars.
754 skills cybersécurité structurées mappées MITRE ATT&CK, NIST CSF 2.0, D3FEND. Apache 2.0 libre.
3.12T tokens/semaine OpenRouter. Leader incontesté malgré baisse -5%.
2.73T tokens. Baisse -12% mais reste n°2 mondial.
Usage massif +203%! 2.29T tokens. Version économique très adoptée.
Explosion +851% ! 1.02T tokens. Nouvelle version massively adoptée.
Apparu sur OpenRouter avec statut "new". 1.66T tokens. Multimodal 1M ctx.
Chute -46%. Déplacé par Opus 4.8. Migration nécessaire.