
Deux informaticiens novateurs ont remporté le prix Turing 2024 pour leur travail en apprentissage par renforcement, une discipline dans laquelle les machines apprennent par une approche d'essai-erreur basée sur la récompense qui leur permet de s'adapter dans des environnements contraints ou dynamiques.
Andrew G. Barto, professeur émérite à l'Université du Massachusetts Amherst; et Richard S. Sutton, professeur à l'Université de l'Alberta, ont développé des algorithmes et des théories clés à travers une série de documents majeurs à partir des années 1980. Cela comprend le travail sur une technique de renforcement appelée apprentissage par différence temporelle; le duo a ensuite publié un manuel universitaire intitulé Apprentissage par renforcement: Une introduction.
Le mathématicien estimé Alan Turing, (sur la photo ci-dessus), d'après lequel le prix Turing est nommé, a également produit un document dans les années 1950 appelé Computing Machinery and Intelligence qui remettait en question la capacité des ordinateurs à penser et abordait des concepts similaires autour de l'apprentissage par l'expérience.
Les pionniers de l'IA notables à avoir remporté le prix Turing incluent le scientifique en chef en intelligence artificielle de Meta Yann LeCun, qui a reçu le prix en 2018 aux côtés de Geoff Hinton et Yoshua Bengio pour leur travail sur les réseaux neuronaux profonds.
Barto et Sutton se partageront le prix en espèces d'un million de dollars, qui a été accordé avec le soutien de Google.