Nouveautés IA & Cloud

🧠 Modèles Frontier — Leaders de performance (Arena AI)

#Modèle▲ ScoreVotesPrix / Contexte

1Claude Opus 4.8 Thinking+16 ▲1,578$5/$25 · 1M

2Claude Opus 4.8+14 ▲2,011$5/$25 · 1M

3GPT-5.5 xhigh+9 ▲5,067— · —

4Gemini 3.5 Flash+13 ▲2,212$1.5/$9 · 1M

5MiniMax M3+16 ▲1,680$0.6/$2.4 · 1M

6Meta Muse Spark+16 ▲1,629— · —

7Kimi K2.6+9 ▲4,753$0.95/$4 · 262K

8Qwen 3.7 Max+13 ▲2,466$1.25/$3.75 · 1M

9MiMo V2.5 Pro+9 ▲5,507$0.43/$0.87 · 1M

10DeepSeek V4 Pro Thinking+9 ▲4,862$0.43/$0.87 · 1M

🔥 Claude Opus 4.8 monte en flèche (+851% d'usage OpenRouter). Gemini 3.5 Flash, Muse Spark et MiniMax-M3 apparaissent comme challengers sérieux avec des scores en hausse significative. Le top 10 mélange fortement modèles fermés et ouverts.

🤗 Nouveautés HuggingFace & Ollama — Cette semaine

🔥 Google Gemma 4 NOUVEAU

Famille multimodale Google — vision, thinking, tools, audio. Disponible sur Ollama (ollama run gemma4). 5 tailles jusqu'à 31B. 12.2M pulls en 24h.

Vision + Audio Apache 2.0 Multimodal

⚡ NVIDIA Nemotron-3 Ultra Nouveau

Modèle raisonnement haute performance NVIDIA. Sur HF : NVIDIA-Nemotron-3-Ultra-550B-A55B-BF16 (561B) et variant NVFP4 (335B). Haute qualité reasoning.

561B MoE Reasoning HF + Ollama

🚀 MiniMax-M3 Rising

Frontier multimodal MiniMax — 1M context window. Score Arena #5 (+16). Usage OpenRouter en hausse de +203%. Prix ultra compétitif $0.6/$2.4.

1M contexte $0.60 / $2.40

✨ Meta Muse Spark Nouveau

Nouveau modèle Meta dans la gamme Muse. Score Arena #6 avec +16 points. Modèle propriétaire avec potentiel ouvert.

Meta Reasoning

💎 Gemini 3.5 Flash Nouveau

Google — nouvelle génération Flash. Prêt à l'emploi via Vertex AI. Prix accessible $1.5/$9 avec 1M contexte.

1M contexte Google

🏔️ Qwen 3.7 Max Nouveau

Alibaba — suite logique de Qwen 3.6. Algorithme de raisonnement avancé avec thinking préservé. Prix $1.25/$3.75 sur API.

Reasoning Apache 2.0

🐋 DeepSeek V4 Pro Hot

862B parameters, 5.51M downloads HF. Variante thinking disponible. MIT license. Leader usage OpenRouter 3.12T tokens/semaine.

862B MIT OpenSource

🌙 Moonshot Kimi K2.6 Nouveau

Model chinois Moonshot — raisonné multimodal. 286.7K pulls Ollama. MIT modifié. Très fort score arena (#7, +9).

Thinking Multimodal

🧠 xAI Grok 4.3 Nouveau

Dernière version xAI. 1371 arena score (+10). Variants reasoning rapide disponibles. Prix agressif $1.25/$2.50.

Reasoning $1.25/$2.50

🪨 IBM Granite 4.1 Nouveau

IBM/TwoSigma — 3B/8B/30B. Apache 2.0. Prix bas $0.05/$0.10. Idéal déploiement edge et entreprise. Sur Ollama et HF.

Apache 2.0 $0.05/$0.10

🦎 Mistral Medium 3.5 Nouveau

128B paramètres. Multimodal vision+tools. Apache 2.0. Prix $1.50/$7.50. Nouveau modèle de Mistral avec forte montée en score arena (+19).

128B Apache 2.0

🌊 Inception Mercury 2 Fastest

814 tokens/sec — le modèle le plus rapide du classement. 128K contexte. Spécialisé vitesse de sortie. Propriétaire.

814 t/s 128K contexte

💧 LiquidAI LFM2.5-8B-A1B Edge

MoE 8B total / 1B actif. Pour deployment edge/low-latency. Ollama ajouté il y a 6 jours. Thinking capabilities.

8B/1B MoE Edge computing

🎬 NVIDIA Cosmos 3 Video

Famille video generative NVIDIA : Nano (16B), Super (65B), Super Text2Image, Super Image2Video. Modelos abiertos para generación video.

Text2Video Image2Video

🟡 Sulphur 2 Base Video Gen

Sulphur.ai — texte vers vidéo. 9B paramètre, 2.18k pulls HF, 1.57k likes. Montée rapide en popularité cette semaine.

9B T2V

🔊 Boson Higgs Audio v3 TTS TTS

BosonAI — 5B TTS model. Sur HF et Ollama. Qualité TTS améliorée, support multi-langues.

5B TTS Audio

🎵 Mistral Devstral 2 Music

Nouveau modèle génération audio/musique Mistral. Score arena 1199. Précision et qualité supérieure pour la production musicale IA.

Audio/Music Mistral

⭐ GitHub Trending — Cette semaine (Top 15)

+11,993 ⭐

chopratejas/headroom

Compresse tool outputs, logs, RAG chunks avant l'LLM. 60-95% moins de tokens, mêmes réponses. Library, proxy, MCP server.

Python · ⭐15,344 total · 🔀974

+16,376 ⭐

microsoft/markitdown

Outil Microsoft pour convertir fichiers/documents en Markdown. 146k stars totales.

Python · ⭐146k · 🔀10k

+11,333 ⭐

NousResearch/hermes-agent

L'agent qui grandit avec vous — 184k stars. Améliorations continues.

Python · ⭐184k · 🔀32k

+11,388 ⭐

harry0703/MoneyPrinterTurbo

Génère des vidéos HD automatiquement via LLM. 80k stars.

Python · ⭐80k · 🔀11k

+10,326 ⭐

affaan-m/ECC

Agent harness performance optimization — skills, instincts, memory, security for Claude Code, Codex, Cursor.

JavaScript · ⭐209k · 🔀32k

+6,436 ⭐

D4Vinci/Scrapling

Framework web scraping adaptatif — d'une requête au crawl complet. Handles CAPTCHA/bot detection.

Python · ⭐61k · 🔀6k

+6,044 ⭐

Leonxlnx/taste-skill

Donne du « bon goût » à votre AI — stoppe la génération de contenu générique et ennuyeux.

Shell · ⭐35k · 🔀2.6k

+4,424 ⭐

nesquena/hermes-webui

WebUI pour Hermes Agent — chat multi-platforme, gestion sessions, jobs planifiés, analytics d'usage.

Python · ⭐14k · 🔀1.7k

+4,398 ⭐

OpenBMB/VoxCPM

VoxCPM2 — Tokenizer-Free TTS multilingue, design créatif de voix, cloning réaliste.

Python · ⭐27k · 🔀3k

+2,944 ⭐

supermemoryai/supermemory

Engine mémoire scalable — The Memory API for the AI era. Ultra rapide.

TypeScript · ⭐26k · 🔀2.3k

+2,893 ⭐

anthropic/claude-code

Outil agentic de codage dans le terminal — Claude Code officiel Anthropic.

Python · ⭐131k · 🔀21k

+2,492 ⭐

mukul975/Anthropic-Cybersecurity-Skills

754 skills cybersécurité structurées pour agents IA. MITRE ATT&CK, NIST CSF, D3FEND. Apache 2.0.

Python · ⭐15k · 🔀1.7k

+2,380 ⭐

run-llama/liteparse

Parseur document rapide et intelligent, open source. Alternative légère aux parsers propriétaires.

Rust · ⭐9k · 🔀557

+2,317 ⭐

can1357/oh-my-pi

Agent de codage terminal — hash-anchored edits, LSP, Python, browser, subagents optimisés.

TypeScript · ⭐11k · 🔀915

+2,082 ⭐

hardikpandya/stop-slop

Skill file pour retirer les "traces IA" du contenu écrit — prose plus naturelle et humaine.

— · ⭐9k · 🔀620

🛠️ Écosystème Agent Harness & Tooling — Tendances fortes

📦chopratejas/headroom🔥 Hot

Compression RAG & tool outputs avant l'LLM. Réduit tokens de 60-95%. Fonctionne comme library, proxy ou MCP server. Essentiel pour réduire les coûts d'inférence.

RAG optimizationMCP Server

🧬supermemoryai/supermemoryRising

Memory engine ultra-scalable. "The Memory API for the AI era". Intégrable dans tout pipeline agent.

Memory layerTypeScript

⚙️revfactory/harnessNew

Meta-skill qui crée des équipes d'agents spécialisés par domaine. Génère automatiquement les skills nécessaires.

Agent teamsAuto-generate skills

🎨EveryInc/compound-engineering-pluginPopular

Plugin Compound Engineering pour Claude Code, Codex, Cursor. 20k stars en ascension rapide.

Multi-agent IDE20k ⭐

🧪promptfoo/promptfooStable

Test prompts, agents et RAGs. Red teaming et pentesting sécurité IA. Compare GPT, Claude, Gemini, DeepSeek.

TestingRed teaming

📄run-llama/liteparseNew

Parseur document rapide Rust par LlamaIndex. Alternative open-source aux parsers coûteux.

Document parsingRust

🖥️screenpipe/screenpipeY Combinator

IA locale YC(S26) qui enregistre tout ce que vous voyez/dites/entendez. Privé, sécurisé, local. 19k stars.

Local recordingYC S26

🔒mukul975/Anthropic-Cybersecurity-SkillsSecurity

754 skills cybersécurité structurées mappées MITRE ATT&CK, NIST CSF 2.0, D3FEND. Apache 2.0 libre.

Security754 skills

📊 Top Usage OpenRouter — Semaine courante (tokens)

👑DeepSeek V4 FlashLeader

3.12T tokens/semaine OpenRouter. Leader incontesté malgré baisse -5%.

3.12T tokens▼5%

🌊Tencent Hunyuan HY3 Preview▲ Rising

2.73T tokens. Baisse -12% mais reste n°2 mondial.

2.73T tokens▼12%

📈Xiaomi MiMo V2.5▲203%

Usage massif +203%! 2.29T tokens. Version économique très adoptée.

2.29T tokens▲+203%

🤖Anthropic Claude Opus 4.8▲851%

Explosion +851% ! 1.02T tokens. Nouvelle version massively adoptée.

1.02T tokens▲+851%

🏗️Minimax M3New on OR

Apparu sur OpenRouter avec statut "new". 1.66T tokens. Multimodal 1M ctx.

1.66T tokensNEW

🔄Claude Opus 4.7↓ Old

Chute -46%. Déplacé par Opus 4.8. Migration nécessaire.

1.32T tokens▼46%

Veille Technologique — IA & Cloud