L'ETH Zurich renforce la recherche en sciences des données

Les approches intelligentes des sciences des données transforment la science, l'économie et la société. Dans le cadre d'une nouvelle initiative multidisciplinaire, des chercheurs de l'ETH en mathématiques, informatique et technologie de l'information se consacrent donc davantage aux fondements des sciences des données.

Vue agrandie : Quand les données tombent automatiquement du ciel : les approches intelligentes de la science des données modifient l'interaction entre l'homme et l'ordinateur. (Illustration : Niklas Briner)
Quand les données tombent du ciel : les approches intelligentes des sciences des données modifient l'interaction entre l'homme et l'ordinateur. (Illustration : Niklas Briner)

Aujourd'hui, les personnes qui prennent des photos avec leur smartphone re?oivent automatiquement des albums entiers de photos compilées numériquement avec le titre, la date, la carte de voyage et les noms des lieux. Sans aucune intervention de leur part. Les résultats sont étonnamment bons, en tout cas tels qu'un observateur ne peut pas facilement juger qui a créé l'album : un être humain ou une machine ?

Ce n'est qu'un exemple parmi d'autres de la manière dont les ordinateurs peuvent accomplir au quotidien certaines t?ches qui semblaient autrefois réservées à l'homme, car elles nécessitent intelligence et capacité d'apprentissage. Des noms évocateurs comme "intelligence artificielle" ou "apprentissage automatique" se sont imposés pour les technologies et les méthodes qui rendent cela possible.

Il s'agit en règle générale de méthodes de calcul avec apprentissage, appelées algorithmes intelligents, qui permettent d'automatiser la résolution intelligente de t?ches. Dans l'apprentissage automatique, par exemple, un ordinateur apprend, à l'aide d'exemples de données, comment reconna?tre de manière autonome des modèles et des régularités dans des ensembles de données.

Comment les données deviennent des connaissances

Les algorithmes efficaces et intelligents qui apprennent par eux-mêmes comment trouver les connaissances souhaitées dans les données n'ont pas seulement un impact sur les utilisateurs privés et les processus industriels, ils modifient également la manière dont les chercheurs et les ordinateurs se partagent le travail. En particulier dans le cas de très grandes quantités de données complexes et hétérogènes, de tels algorithmes peuvent permettre d'acquérir de précieuses connaissances qui seraient sinon passées inaper?ues.

Peter Bühlmann est à la fois observateur et créateur de cette évolution rapide des méthodes axées sur les données. Ce professeur de l'ETH est statisticien de formation. Depuis le début de l'année, il dirige la nouvelle initiative de l'ETH Zurich pour les "bases de la science des données" ("Fondements de la science des données de l'ETH"). Comment obtenir des informations et des connaissances à partir de données, tel est depuis toujours le c?ur de métier de la statistique.

Vue agrandie : Peter Bühlmann dirige l'initiative "Bases de la science des données". Le statisticien a une bonne dose d'humour et convainc également en tant que modérateur. (Photo : PPR / Christian Merz)
Peter Bühlmann (au centre, entre Alessio Figalli et Cédric Villani) dirige l'initiative "Fondements de la science des données". (Photo : PPR / Christian Merz)

Les approches axées sur les données se distinguent toutefois des approches classiques, explique Bühlmann avec la pointe d'humour qui le caractérise : "Dans l'approche classique de la statistique, un chercheur partait d'une question scientifique et réfléchissait très soigneusement aux données qu'il allait collecter et à la méthode qu'il allait utiliser pour en tirer des conclusions aussi informatives que possible. Comme les données tombent aujourd'hui comme automatiquement du ciel, en for?ant le trait, ce n'est souvent plus le cas".

Une nouvelle dimension

Les nouvelles approches utilisant des algorithmes intelligents peuvent extraire automatiquement des informations intéressantes de volumes de données existants, même sans collecte de données planifiée. Les sciences des données sont nées de ces nouvelles possibilités au cours des dernières années : Elles constituent aujourd'hui un domaine de recherche et de développement multidisciplinaire à la croisée des statistiques, de l'informatique, des technologies de l'information et des mathématiques.

"Les sciences des données sont quelque chose de nouveau. Elles ne sont pas simplement des statistiques, ni simplement de l'informatique, ni simplement des technologies de l'information, mais une interaction des trois", explique Bühlmann. Avec cette nouvelle initiative, l'ETH Zurich renforce la recherche fondamentale en sciences des données en regroupant l'expertise existante. Onze chaires de trois départements de l'ETH y participent, dans les domaines suivants Statistique, Apprentissage automatique et Technologie de l'information faire de la recherche.

L'accent est mis sur les questions fondamentales des théories mathématiques et des méthodes algorithmiques. Il existe à cet effet un programme pour les post-doctorants et un autre pour les invités scientifiques. L'initiative complète les activités dans le domaine de la formation (Master en science des données, DAS en science des données) et dans le transfert de savoir et de technologie entre les disciplines et vers l'industrie (page externeCentre suisse des sciences des données). Elle a été lancée le 1er janvier 2019 et est soutenue à hauteur de 2,7 millions de francs par "ETH+", l'initiative à l'échelle de l'ETH visant à promouvoir les projets multidisciplinaires.

Responsabilité et algorithmes équitables

Comme les innovations en matière de science des données ont des répercussions sur de nombreux utilisateurs dans les domaines de la science, de l'économie et de la société, la recherche fondamentale a une responsabilité particulière, selon Bühlmann. Selon lui, l'un des défis consiste à développer des algorithmes qui fournissent des résultats causalement corrects, stables, fiables et faciles à interpréter, même pour des ensembles de données exigeants. En 2018, Bühlmann a re?u la prestigieuse "Guy Medal in Silver" de la Royal Statistical Society et un "ERC Advanced Grant" pour ses recherches sur la stabilité et la causalité (cause-effet).

L'automatisation ne réussit finalement pas toujours aussi élégamment que dans l'application photo mentionnée. L'application d'algorithmes intelligents peut parfois s'avérer problématique : Par exemple, lorsque des ordinateurs déterminent qui est solvable sur la base de données caractéristiques (?ge, sexe, nationalité, santé, etc.) ou lorsqu'ils donnent aux juges des indications sur la probabilité que des accusés soient coupables - il ne devrait pas en résulter de désavantages.

Pour Bühlmann, "l'apprentissage automatique interprétable" et "les algorithmes équitables" sont donc deux grandes questions de recherche qui l'intéressent personnellement beaucoup : "En tant que chercheur fondamental, je veux produire quelque chose d'utile pour la société. Je veux savoir quand une application donne des résultats fiables et quand elle en donne moins", dit Bühlmann, "c'est mon attitude".

Permettre l'innovation : ETH+ Grants

L'initiative ETH+ soutient des projets multidisciplinaires menés par des étudiants, des chercheurs et d'autres membres de l'ETH, qui contribuent à mieux exploiter le potentiel d'innovation de l'ETH aux frontières des disciplines et des départements.

Les nouveaux ETH+ Grants encouragent la recherche multidisciplinaire : ils soutiennent des projets auxquels participent au moins trois chercheurs de différents départements ou groupes de l'ETH.

Un ETH+ Grant peut aller jusqu'à 3 millions de francs pour trois ou quatre ans et couvrir les trois quarts des co?ts du projet. Il peut être utilisé pour des post-doctorants et/ou des chercheurs expérimentés. Les chercheurs de l'ETH peuvent déposer leur candidature deux fois par an. Prochains délais de soumission : 1er mars et 1er septembre 2019.

Plus d'informations (en anglais)
 

JavaScript a été désactivé sur votre navigateur