• Home
  • Contact Us
  • Disclaimer
  • Privacy Policy
  • Terms & Conditions
No Result
View All Result
ETHAN PIKE
  • Technologie
  • Sports
  • Ecologie
  • Femmes
    • Enfants – Bébé
    • Hommes
  • Gadgets
  • Loisirs
  • 2 roues
  • Voyage
  • Culture – Livre
  • Décoration / Electroménager
  • Technologie
  • Sports
  • Ecologie
  • Femmes
    • Enfants – Bébé
    • Hommes
  • Gadgets
  • Loisirs
  • 2 roues
  • Voyage
  • Culture – Livre
  • Décoration / Electroménager
No Result
View All Result
ETHAN PIKE
No Result
View All Result
Home Technologie

Les modèles d’IA ont toujours du mal à déboguer les logiciels, montre Microsoft Research

by ETHAN PIKE
10 avril 2025
in Technologie
0
Les modèles d’IA ont toujours du mal à déboguer les logiciels, montre Microsoft Research
0
SHARES
4
VIEWS
Share on FacebookShare on Twitter


Les modèles d’IA des laboratoires OpenAI, anthropiques et d’autres meilleurs laboratoires AI sont de plus en plus utilisés pour aider à la programmation des tâches. Le PDG de Google Sundar Pichai dit en octobre Ce 25% du nouveau code de l’entreprise est généré par l’IA et le méta-PDG Mark Zuckerberg a exprimé des ambitions pour déployer largement les modèles de codage d’IA au sein du géant des médias sociaux.

Pourtant, même certains des meilleurs modèles ont aujourd’hui du mal à résoudre les bogues logiciels qui ne trébucheraient pas les développeurs expérimentés.

UN nouvelle étude De Microsoft Analysis, la division R&D de Microsoft, révèle que les modèles, notamment Anthropic Claude 3.7 Sonnet Et Openai o3-min, échouez à déboguer de nombreux problèmes dans un benchmark de développement logiciel appelé Swe-Bench Lite. Les résultats sont un rappel qui donne à réfléchir que, malgré audacieux déclarations Des entreprises comme OpenaiL’IA ne correspond toujours pas aux consultants humains dans des domaines tels que le codage.

Les co-auteurs de l’étude ont testé neuf modèles différents comme l’épine dorsale pour un «agent rapide» qui avait accès à un sure nombre d’outils de débogage, y compris un débogueur Python. Ils ont chargé cet agent de résoudre un ensemble organisé de 300 tâches de débogage de logiciels de Swe-Bench Lite.

Selon les co-auteurs, même lorsqu’ils sont équipés de modèles plus forts et plus récents, leur agent a rarement accompli plus de la moitié des tâches de débogage. Claude 3.7 Sonnet avait le taux de réussite moyen le plus élevé (48,4%), suivi par O1 d’OpenAI (30,2%) et O3-MinI (22,1%).

Microsoft AI Débogage de référence
Un tableau de l’étude. L’augmentation de «l’augmentation relative» fait référence aux modèles Increase que les modèles sont équipés d’un outillage de débogage.Crédits d’picture:Microsoft

Pourquoi la efficiency décevante? Certains modèles ont eu du mal à utiliser les outils de débogage à leur disposition et à comprendre remark différents outils pourraient aider à différents problèmes. Le plus gros problème, cependant, était la pénurie de données, selon les co-auteurs. Ils spéculent qu’il n’y a pas suffisamment de données représentant des «processus de prise de décision séquentiels» – c’est-à-dire des traces de débogage humain – dans les données de formation des modèles actuels.

«Nous croyons fermement que la formation ou le réglage fin (modèles) peuvent en faire de meilleurs débogateurs interactifs», a écrit les co-auteurs de leur étude. «Cependant, cela nécessitera des données spécialisées pour réaliser une telle formation de modèle, par exemple, des données de trajectoire qui enregistrent les brokers interagissant avec un débogueur pour collecter les informations nécessaires avant de suggérer un correctif de bogue.»

Les résultats ne sont pas exactement choquants. De nombreuses études ont indiqué Cette IA générateurs de code have a tendency à introduire des vulnérabilités et des erreurs de sécurité, en raison de faiblesses dans des domaines comme la capacité de comprendre la logique de programmation. Une évaluation récente de Devinun outil de codage AI populaire, a constaté qu’il ne pouvait effectuer que trois des 20 checks de programmation.

Mais le travail Microsoft est l’un des seems les plus détaillés à ce jour sur un problème persistant pour les modèles. Il ne s’amortira probablement pas enthousiasme des investisseurs Pour les outils d’help alimentés par AI, mais avec un peu de likelihood, cela fera que les développeurs – et leurs supérieurs – réfléchissent à deux fois à permettre à l’IA d’exécuter le spectacle de codage.

Pour ce que cela vaut, un nombre croissant de cooks de technologie ont contesté l’idée que l’IA automatisera les emplois de codage. Le co-fondateur de Microsoft Invoice Gates a dit qu’il considérait la programmation comme une career est là pour rester. Aussi Replit PDG Amjad Masad, PDG d’Okta Todd McKinnonet Le PDG d’IBM Arvind Krishna.

Tags: déboguerdIALeslogicielsmalMicrosoftModèlesmontréontStudytoujours
ETHAN PIKE

ETHAN PIKE

Next Post
Pratiquer avant Pâques

Pratiquer avant Pâques

Please login to join discussion

Recommandé

Modèles de tricot Gonk Gnome – Tricoting

Modèles de tricot Gonk Gnome – Tricoting

4 mois ago
Stubbs: les derniers pistolets de Miss Proof de Kyle Busch

Stubbs: les derniers pistolets de Miss Proof de Kyle Busch

6 mois ago

Actualités populaires

  • J’adore ce skybox yakima maigre, mais vous ne croirez pas pourquoi

    J’adore ce skybox yakima maigre, mais vous ne croirez pas pourquoi

    0 shares
    Share 0 Tweet 0
  • Le PDG de Lovable n’est pas trop inquiet pour la compétition de codage d’ambiance

    0 shares
    Share 0 Tweet 0
  • Critique: «Katabasis» pourrait être le meilleur livre de 2025

    0 shares
    Share 0 Tweet 0
  • Delta reprend tous les vols vers l’aéroport majeur

    0 shares
    Share 0 Tweet 0
  • À quoi s’attendre à sortir avec un homme de plus de 60 ans

    0 shares
    Share 0 Tweet 0

À propos de nous

Bienvenue sur ethanpike.eu L'objectif de ethanpike.eu est de vous offrir les meilleures sources d'informations sur n'importe quel sujet ! Nos sujets sont soigneusement sélectionnés et constamment mis à jour car nous savons que le Web évolue rapidement et nous essayons donc de le faire également.

Catégorie

  • 2 roues
  • Culture – Livre
  • Décoration / Electroménager
  • Ecologie
  • Enfants – Bébé
  • Femmes
  • Gadgets
  • Hommes
  • Loisirs
  • Sports
  • Technologie
  • Voyage

Messages récents

  • Transformez Greenback Tree Finds en décor d’Halloween effrayant – un hack de bricolage pour le price range! – maison et jardin
  • Pat Cummins Inquiétude des blessures pour l’Australie avant les cendres alors que Mitchell Starc annonce la retraite T20I | Nouvelles de cricket
  • La diversité et la densité de Liana au Ghana montrent une affiliation optimistic avec les précipitations, précisément opposées aux tendances Pantropicales |
  • Home
  • Contact Us
  • Disclaimer
  • Privacy Policy
  • Terms & Conditions

Copyright © 2024 Ethanpike.eu | All Rights Reserved.

No Result
View All Result
  • Technologie
  • Sports
  • Ecologie
  • Femmes
    • Enfants – Bébé
    • Hommes
  • Gadgets
  • Loisirs
  • 2 roues
  • Voyage
  • Culture – Livre
  • Décoration / Electroménager

Copyright © 2024 Ethanpike.eu | All Rights Reserved.