«Nous voulons que toutes nos données soient transformées en connaissances utiles»

-

lundi 3 juin 2024, 07:28

Le Congrès mondial Dialnet a réuni la semaine dernière à Logroño plus de 200 spécialistes espagnols et ibéro-américains de la science ouverte. “Nous voulons que toutes nos données soient transformées en connaissances utiles”, résume la directrice de la Fondation Dialnet, Elena López Tamayo.

– Qu’est-ce que Dialnet déjà et qu’aspire-t-il à devenir ?

– Dialnet est un système complexe d’informations scientifiques, de résultats scientifiques, de groupes de recherche, de chiffres de financement de la science… Dans la base de données Dialnet, il y a toujours des articles, des thèses ou des actes de conférences. C’est formidable, mais cela ne peut pas être organisé pour rendre visible ce que vous faites en tant qu’organisation. Le système CRIS vous permet de visualiser tout cela : comment vous êtes structuré organisationnellement et quelle est votre production scientifique. À partir de là, des fonctionnalités commencent à se construire : par exemple, vous pouvez voir l’argent qu’une université reçoit pour ses projets et quelle production scientifique elle génère. Il s’agit toujours d’un système d’information : chez Dialnet, nous disposons de données de très bonne qualité, d’une équipe qui y travaille et nous collaborons avec de nombreuses universités espagnoles et latino-américaines. Nous avons toutes ces données organisées et nous sommes déjà capables de bien les afficher, mais nous voulons faire plus.

– Dans quel sens?

– Nous parlons toujours d’espaces de données. Il s’agit d’informations qui vous proviennent de nombreuses sources, que vous enrichissez, que vous mettez dans des formats que vos systèmes comprennent bien et à partir de là, vous pouvez créer plusieurs cas d’utilisation.

– Par exemple?

– Par exemple : je veux voir de quelle infrastructure scientifique et technique dispose mon université ou je veux que la machine me donne un résumé d’articles scientifiques sur un certain sujet ou qu’elle suggère des relations entre chercheurs… Si le système agrège les informations de tous les universités espagnoles, ça commence à être important. Je peux rapidement savoir qui fait des recherches sur les nanotechnologies appliquées aux antibiotiques et le système les classera également en fonction de la qualité de leurs recherches. Je peux utiliser l’intelligence artificielle pour générer des cartes de connaissances et savoir où se concentre la production scientifique. Il peut même servir d’outil pour savoir où les avancées scientifiques peuvent avoir lieu et où les pouvoirs publics financent certaines recherches.

– Dialnet Global a l’avantage d’être construit sur Dialnet, ce qui est une réussite. Ce bond en avant désormais envisagé, combien de temps peut-il prendre et quel peut-il coûter ?

– Nous n’avons pas fait le voyage ici seuls. C’est un projet collaboratif et doit le rester : tel est le modèle de réussite. Nos utilisateurs sont des universités et des centres de recherche. Le délai dont nous disposons actuellement pour atteindre des objectifs extrêmement ambitieux est la durée du mécanisme de relance, puisqu’une partie est financée par ce mécanisme et une partie par le gouvernement de La Rioja. Nous avons jusqu’en décembre 2025.

– Mais ça ne devrait pas s’arrêter là, je suppose.

– Clair; On n’atteint pas décembre 2025 et c’est fini. C’est un projet que nous construisons pour pouvoir assurer sa pérennité. C’est-à-dire que si nous avons augmenté nos effectifs pour offrir certaines fonctionnalités, nous pouvons maintenir tout cela au-delà de 2025. Le budget de l’accord de collaboration que nous avons avec le gouvernement de La Rioja est de six millions pour 2023, 2024 et 2025.

– Il s’agit d’un projet à ambition internationale, mais il est né lié à une petite université. Y a-t-il beaucoup de concurrence ? Peut-être que d’autres universités, plus musclées, pourraient essayer de faire de même ?

– Il est vrai que Dialnet est un modèle de réussite né d’une petite université située dans la plus petite communauté autonome d’Espagne. Mais c’est là que réside son succès. Il y avait un groupe de personnes dans la Bibliothèque de l’UR et dans le service informatique qui croyaient qu’il était possible de créer une grande bibliothèque numérique avec le plus grand nombre de contenus en espagnol. C’est tout, donc pour le moment, je pense que personne ne peut faire ce que Dialnet fait. Il est vrai qu’il existe des multinationales et des sociétés commerciales qui disposent de ces bases de données, mais elles proposent leurs produits aux prix du marché. Nous, en revanche, sommes une fondation à but non lucratif ; Toutes les informations sur Dialnet sont en libre accès. La seule chose que nous faisons est d’assurer la durabilité de nos produits. La base de données est ouverte à tous, mais si une université nous demande de développer un système CRIS – il y en a aujourd’hui une quarantaine – nous facturons le coût du développement.

– Parlons-nous uniquement de production scientifique en espagnol ou également dans d’autres langues ?

– Dans la base de données Dialnet, ces 9,3 millions de documents, une grande partie du contenu est en espagnol. Mais lorsque nous créons les systèmes d’information – les CRIS – sur ce qui se produit dans une université, nous apportons avec nous toute la production scientifique des chercheurs de cette université, qu’elle soit en espagnol, en anglais ou en chinois. Désormais, grâce aux modèles multilingues, je peux appliquer l’intelligence artificielle sans prêter attention à la langue dans laquelle elle est écrite.

– Et l’Amérique Latine ? Est-ce un territoire d’expansion ?

– Il s’agit d’un champ d’expansion évident. Celui qui vous connaît, vous connaît beaucoup et utilise votre système. Sur les 3 millions d’utilisateurs enregistrés sur Dialnet, la moitié sont latino-américains. Une autre chose est qu’ils sont nos collaborateurs. Les collaborateurs sont des universités qui saisissent les informations dans le système. En Ibéro-Amérique, il existe 55 universités collaboratrices (en Espagne, il y en a 66 et il existe 40 autres types d’institutions). Le nombre est élevé, mais l’Amérique latine est un monde et chaque pays a ses particularités.

– Une question d’un utilisateur occasionnel. Pourquoi y a-t-il de nombreuses références dans Dialnet mais, pour la plupart, le texte intégral n’est pas disponible ?

– Ceci est motivé par le système de production scientifique. La même chose se produit partout dans le monde. Elle vient d’être définie ces jours-ci par le professeur Roberto Escalante (secrétaire général de l’Union des universités d’Amérique latine et des Caraïbes) : les États paient pour que la science soit produite, les chercheurs paient pour que leurs articles soient publiés dans certaines revues et l’utilisateur paie pour y accéder. Cela ne dépend pas de Dialnet ; C’est ainsi que le système est construit. Mais le modèle de la science ouverte préconise de briser ce cercle vicieux. En théorie, tout ce qui est financé par des fonds publics devrait être accessible à la société ; Dans la pratique, cela arrive de plus en plus, mais cette dépendance perdure. Je crois cependant que le moment n’est pas loin où nous aurons un contenu beaucoup plus ouvert. Nous donnons ouvert tout ce qui est ouvert, et tout est accessible.

Ce contenu est exclusif aux abonnés

2€/mois pendant 4 mois

Êtes-vous déjà abonné? Se connecter

-