📡

Veille Technologique — IA & Cloud

Synthèse des nouveautés open-source et modèles majeurs

📅 06 juin 2026 · Sources : GitHub Trending, HF Models, Ollama, OpenRouter, Arena AI
#Modèle▲ ScoreVotesPrix / Contexte
1Claude Opus 4.8 Thinking+16 ▲1,578$5/$25 · 1M
2Claude Opus 4.8+14 ▲2,011$5/$25 · 1M
3GPT-5.5 xhigh+9 ▲5,067— · —
4Gemini 3.5 Flash+13 ▲2,212$1.5/$9 · 1M
5MiniMax M3+16 ▲1,680$0.6/$2.4 · 1M
6Meta Muse Spark+16 ▲1,629— · —
7Kimi K2.6+9 ▲4,753$0.95/$4 · 262K
8Qwen 3.7 Max+13 ▲2,466$1.25/$3.75 · 1M
9MiMo V2.5 Pro+9 ▲5,507$0.43/$0.87 · 1M
10DeepSeek V4 Pro Thinking+9 ▲4,862$0.43/$0.87 · 1M

🔥 Claude Opus 4.8 monte en flèche (+851% d'usage OpenRouter). Gemini 3.5 Flash, Muse Spark et MiniMax-M3 apparaissent comme challengers sérieux avec des scores en hausse significative. Le top 10 mélange fortement modèles fermés et ouverts.

🔥 Google Gemma 4 NOUVEAU

Famille multimodale Google — vision, thinking, tools, audio. Disponible sur Ollama (ollama run gemma4). 5 tailles jusqu'à 31B. 12.2M pulls en 24h.

Vision + Audio Apache 2.0 Multimodal
NVIDIA Nemotron-3 Ultra Nouveau

Modèle raisonnement haute performance NVIDIA. Sur HF : NVIDIA-Nemotron-3-Ultra-550B-A55B-BF16 (561B) et variant NVFP4 (335B). Haute qualité reasoning.

561B MoE Reasoning HF + Ollama
🚀 MiniMax-M3 Rising

Frontier multimodal MiniMax — 1M context window. Score Arena #5 (+16). Usage OpenRouter en hausse de +203%. Prix ultra compétitif $0.6/$2.4.

1M contexte $0.60 / $2.40
Meta Muse Spark Nouveau

Nouveau modèle Meta dans la gamme Muse. Score Arena #6 avec +16 points. Modèle propriétaire avec potentiel ouvert.

Meta Reasoning
💎 Gemini 3.5 Flash Nouveau

Google — nouvelle génération Flash. Prêt à l'emploi via Vertex AI. Prix accessible $1.5/$9 avec 1M contexte.

1M contexte Google
🏔️ Qwen 3.7 Max Nouveau

Alibaba — suite logique de Qwen 3.6. Algorithme de raisonnement avancé avec thinking préservé. Prix $1.25/$3.75 sur API.

Reasoning Apache 2.0
🐋 DeepSeek V4 Pro Hot

862B parameters, 5.51M downloads HF. Variante thinking disponible. MIT license. Leader usage OpenRouter 3.12T tokens/semaine.

862B MIT OpenSource
🌙 Moonshot Kimi K2.6 Nouveau

Model chinois Moonshot — raisonné multimodal. 286.7K pulls Ollama. MIT modifié. Très fort score arena (#7, +9).

Thinking Multimodal
🧠 xAI Grok 4.3 Nouveau

Dernière version xAI. 1371 arena score (+10). Variants reasoning rapide disponibles. Prix agressif $1.25/$2.50.

Reasoning $1.25/$2.50
🪨 IBM Granite 4.1 Nouveau

IBM/TwoSigma — 3B/8B/30B. Apache 2.0. Prix bas $0.05/$0.10. Idéal déploiement edge et entreprise. Sur Ollama et HF.

Apache 2.0 $0.05/$0.10
🦎 Mistral Medium 3.5 Nouveau

128B paramètres. Multimodal vision+tools. Apache 2.0. Prix $1.50/$7.50. Nouveau modèle de Mistral avec forte montée en score arena (+19).

128B Apache 2.0
🌊 Inception Mercury 2 Fastest

814 tokens/sec — le modèle le plus rapide du classement. 128K contexte. Spécialisé vitesse de sortie. Propriétaire.

814 t/s 128K contexte
💧 LiquidAI LFM2.5-8B-A1B Edge

MoE 8B total / 1B actif. Pour deployment edge/low-latency. Ollama ajouté il y a 6 jours. Thinking capabilities.

8B/1B MoE Edge computing
🎬 NVIDIA Cosmos 3 Video

Famille video generative NVIDIA : Nano (16B), Super (65B), Super Text2Image, Super Image2Video. Modelos abiertos para generación video.

Text2Video Image2Video
🟡 Sulphur 2 Base Video Gen

Sulphur.ai — texte vers vidéo. 9B paramètre, 2.18k pulls HF, 1.57k likes. Montée rapide en popularité cette semaine.

9B T2V
🔊 Boson Higgs Audio v3 TTS TTS

BosonAI — 5B TTS model. Sur HF et Ollama. Qualité TTS améliorée, support multi-langues.

5B TTS Audio
🎵 Mistral Devstral 2 Music

Nouveau modèle génération audio/musique Mistral. Score arena 1199. Précision et qualité supérieure pour la production musicale IA.

Audio/Music Mistral
+11,993 ⭐
chopratejas/headroom
Compresse tool outputs, logs, RAG chunks avant l'LLM. 60-95% moins de tokens, mêmes réponses. Library, proxy, MCP server.
Python · ⭐15,344 total · 🔀974
+16,376 ⭐
microsoft/markitdown
Outil Microsoft pour convertir fichiers/documents en Markdown. 146k stars totales.
Python · ⭐146k · 🔀10k
+11,333 ⭐
NousResearch/hermes-agent
L'agent qui grandit avec vous — 184k stars. Améliorations continues.
Python · ⭐184k · 🔀32k
+11,388 ⭐
harry0703/MoneyPrinterTurbo
Génère des vidéos HD automatiquement via LLM. 80k stars.
Python · ⭐80k · 🔀11k
+10,326 ⭐
affaan-m/ECC
Agent harness performance optimization — skills, instincts, memory, security for Claude Code, Codex, Cursor.
JavaScript · ⭐209k · 🔀32k
+6,436 ⭐
D4Vinci/Scrapling
Framework web scraping adaptatif — d'une requête au crawl complet. Handles CAPTCHA/bot detection.
Python · ⭐61k · 🔀6k
+6,044 ⭐
Leonxlnx/taste-skill
Donne du « bon goût » à votre AI — stoppe la génération de contenu générique et ennuyeux.
Shell · ⭐35k · 🔀2.6k
+4,424 ⭐
nesquena/hermes-webui
WebUI pour Hermes Agent — chat multi-platforme, gestion sessions, jobs planifiés, analytics d'usage.
Python · ⭐14k · 🔀1.7k
+4,398 ⭐
OpenBMB/VoxCPM
VoxCPM2 — Tokenizer-Free TTS multilingue, design créatif de voix, cloning réaliste.
Python · ⭐27k · 🔀3k
+2,944 ⭐
supermemoryai/supermemory
Engine mémoire scalable — The Memory API for the AI era. Ultra rapide.
TypeScript · ⭐26k · 🔀2.3k
+2,893 ⭐
anthropic/claude-code
Outil agentic de codage dans le terminal — Claude Code officiel Anthropic.
Python · ⭐131k · 🔀21k
+2,492 ⭐
mukul975/Anthropic-Cybersecurity-Skills
754 skills cybersécurité structurées pour agents IA. MITRE ATT&CK, NIST CSF, D3FEND. Apache 2.0.
Python · ⭐15k · 🔀1.7k
+2,380 ⭐
run-llama/liteparse
Parseur document rapide et intelligent, open source. Alternative légère aux parsers propriétaires.
Rust · ⭐9k · 🔀557
+2,317 ⭐
can1357/oh-my-pi
Agent de codage terminal — hash-anchored edits, LSP, Python, browser, subagents optimisés.
TypeScript · ⭐11k · 🔀915
+2,082 ⭐
hardikpandya/stop-slop
Skill file pour retirer les "traces IA" du contenu écrit — prose plus naturelle et humaine.
— · ⭐9k · 🔀620
📦chopratejas/headroom🔥 Hot

Compression RAG & tool outputs avant l'LLM. Réduit tokens de 60-95%. Fonctionne comme library, proxy ou MCP server. Essentiel pour réduire les coûts d'inférence.

RAG optimizationMCP Server
🧬supermemoryai/supermemoryRising

Memory engine ultra-scalable. "The Memory API for the AI era". Intégrable dans tout pipeline agent.

Memory layerTypeScript
⚙️revfactory/harnessNew

Meta-skill qui crée des équipes d'agents spécialisés par domaine. Génère automatiquement les skills nécessaires.

Agent teamsAuto-generate skills
🎨EveryInc/compound-engineering-pluginPopular

Plugin Compound Engineering pour Claude Code, Codex, Cursor. 20k stars en ascension rapide.

Multi-agent IDE20k ⭐
🧪promptfoo/promptfooStable

Test prompts, agents et RAGs. Red teaming et pentesting sécurité IA. Compare GPT, Claude, Gemini, DeepSeek.

TestingRed teaming
📄run-llama/liteparseNew

Parseur document rapide Rust par LlamaIndex. Alternative open-source aux parsers coûteux.

Document parsingRust
🖥️screenpipe/screenpipeY Combinator

IA locale YC(S26) qui enregistre tout ce que vous voyez/dites/entendez. Privé, sécurisé, local. 19k stars.

Local recordingYC S26
🔒mukul975/Anthropic-Cybersecurity-SkillsSecurity

754 skills cybersécurité structurées mappées MITRE ATT&CK, NIST CSF 2.0, D3FEND. Apache 2.0 libre.

Security754 skills
👑DeepSeek V4 FlashLeader

3.12T tokens/semaine OpenRouter. Leader incontesté malgré baisse -5%.

3.12T tokens▼5%
🌊Tencent Hunyuan HY3 Preview▲ Rising

2.73T tokens. Baisse -12% mais reste n°2 mondial.

2.73T tokens▼12%
📈Xiaomi MiMo V2.5▲203%

Usage massif +203%! 2.29T tokens. Version économique très adoptée.

2.29T tokens▲+203%
🤖Anthropic Claude Opus 4.8▲851%

Explosion +851% ! 1.02T tokens. Nouvelle version massively adoptée.

1.02T tokens▲+851%
🏗️Minimax M3New on OR

Apparu sur OpenRouter avec statut "new". 1.66T tokens. Multimodal 1M ctx.

1.66T tokensNEW
🔄Claude Opus 4.7↓ Old

Chute -46%. Déplacé par Opus 4.8. Migration nécessaire.

1.32T tokens▼46%