WEB

Claude Sonnet 4.5: Anthropic lance son meilleur modèle d’IA en code

Claude Sonnet 4.5

Anthropique révélé Son nouveau modèle d’intelligence artificielle, Claude Sonnet 4.5, qui promet d’aller au-delà du rôle d’assistant simple pour devenir un véritable développeur d’applications. Cette nouvelle version est présentée comme capable de créer un logiciel fonctionnel et prêt pour la production. Cela marque un progrès majeur par rapport aux prototypes générés par les modèles précédents.

Claude Sonnet 4.5

PROFACTION PROSTAGE

La nouveauté principale de Claude Sonnet 4.5 réside dans la fiabilité, lui permettant de gérer des tâches de code complexes sur de longues périodes. Plutôt que de se limiter aux extraits de code, le modèle peut orchestrer la création d’un projet de A à Z. Cette capacité à produire des applications de qualité professionnelle représente un saut qualitatif pour les intelligences artificielles génératives.

Les affirmations d’Anthropic sont appuyées par des résultats concrètes. Le modèle atteint désormais un score de 61,4% sur le benchmark OSWorld, qui évalue l’exécution des tâches d’ordinateur réelles. Cette performance représente un saut par rapport aux 42,2% obtenus par son prédécesseur, Claude Sonnet 4, il y a seulement quatre mois.

Au cours des essais avec des entreprises, le code généré par Claude Sonnet 4.5 a pu fonctionner indépendamment pendant près de 30 heures. Au cours de cette période, l’IA a non seulement développé une application, mais a également configuré les services de base de données, acheté des noms de domaine et effectué un audit de sécurité SOC 2 pour garantir la robustesse du produit.

Amélioration de la fiabilité et du raisonnement

Au-delà du code, le modèle démontre des capacités accrues dans divers domaines tels que le raisonnement et les mathématiques. Selon des experts des secteurs des finances, du droit, de la médecine et des stims (science, technologie, ingénierie et mathématiques), Claude Sonnet 4.5 montre des connaissances et un raisonnement spécialisés beaucoup plus élevés que ceux des anciennes versions, y compris Claude Opus 4.1. Les données comparent également l’IA à GPT-5 d’OpenAI et GEMINI 2.5 Pro de Google.

Claude Sonnet 4.5 Benchmarks

Anthropic affirme également qu’il s’agit de son modèle d’IA le plus aligné à ce jour, présentant des taux de complaisance et de tromperie inférieurs aux versions précédentes. La sécurité a également été renforcée, avec une meilleure résistance aux attaques d’injection rapides, des techniques visant à manipuler le comportement de l’IA.

Accès et outils pour les développeurs

Claude Sonnet 4.5 est accessible via l’API Claude et directement dans le chatbot Claude. Le prix pour les développeurs reste identique à celui de Claude Sonnet 4, ou 3 $ par million de jetons d’entrée (environ 750 000 mots) et de 15 $ par million de jetons de sortie.

En parallèle, Anthropic lance le SDK de l’agent Claude. Cet ensemble d’outils, basé sur l’infrastructure qui alimente déjà Claude Code, est conçu pour aider les développeurs à construire leurs propres agents intelligents en fonction des nouvelles capacités du modèle.

Shares:

Related Posts