Catégories
Actualité pharmacieutique

Une métrique de nouveauté pour évaluer les articles et les auteurs de revues

Publié le 7 juillet 2020 par Matthew Clark dans Pharma R&D

Les scientifiques ont longtemps cherché des moyens de mesurer l'impact et la valeur de leurs recherches. Dans cet article, nous proposons une nouvelle métrique qui tente de mesurer la récence des faits discutés dans un article.

Bon nombre des bibliométries actuelles proviennent des travaux d'Eugene Garfield qui a été parmi les premiers à suivre les citations et à utiliser le nombre de citations dans divers algorithmes pour mesurer l'impact des articles et des scientifiques. Depuis son travail, de nombreuses métriques ont été développées à partir de citations. Il s'agit notamment de ces mesures populaires (ce n'est pas une liste exhaustive):

Tous ces éléments sont basés sur la fréquence à laquelle d'autres auteurs ont trouvé un travail digne d'être cité dans les articles suivants. Ce sont toutes de bonnes mesures.

Ici, je propose une mesure de la nouveauté d'un article – le nombre de nouveaux faits rapportés rapportés dans l'article. RESNET d'Elsevier a extrait des millions de relations biologiques des résumés d'articles et du texte intégral de la littérature de. Dans cette étude, ce sont les «faits» utilisés pour évaluer la nouveauté d'un article.

Voici un exemple de relation biologique, «le citrate régule à la hausse la différenciation cellulaire», qui est mentionné dans 17 articles.

Les types de relations extraites dans RESNET comprennent la régulation, la liaison, les événements indésirables, les liens voie-maladie, la liaison ligand-protéine et bien d'autres. Chacun est annoté avec tous les articles qui en font état.

Les articles de revues traitent généralement de nombreuses relations connues en plus d'en proposer de nouvelles. L'algorithme de pondération que nous expérimentons avec les relations de décroissance par le nombre d'articles précédents qui indiquent la relation pour se concentrer sur les articles qui énoncent de nouvelles relations. Par conséquent, le «score de nouveauté» d'un article peut être calculé avec la formule suivante, sur la base de toutes les relations extraites de l'article:

Une relation inédite, jamais rapportée auparavant, contribue à 1,0, tandis qu'une relation indiquée dans 100 articles précédents (précédente: même année ou année précédente que l'article évalué) n'ajoute que 0,01 au score. Par conséquent, les articles indiquant des relations plus récentes et moins signalées auront des scores plus élevés. Les relations qui apparaissent dans l'introduction d'un article expliquant le contexte de l'exemple de recherche peuvent ne pas ajouter de manière significative au score de nouveauté. Contrairement aux scores de citation, cette métrique est statique. Puisqu'il ne prend en compte que les années en cours et précédentes pour l'article évalué, la métrique n'est pas modifiée par les futurs articles.

Nous avons testé le concept avec environ 10 000 articles de biologie – tous à partir de 2015 afin qu'ils aient tous eu la même chance d'être cités. Cela devait permettre de comparer le score de nouveauté avec le nombre de citations.

Le graphique ci-dessous compare le score de nouveauté au nombre de citations depuis 2015 pour chaque article du corpus. Le graphique montre que le score de nouveauté n'est pas lié aux citations et fournit donc des informations différentes. Il n'est pas surprenant que le score soit à peu près lié au nombre total de relations extraites d'un article.

Les meilleurs articles de 2015, classés selon le score de nouveauté, sont présentés ci-dessous.

La note la plus élevée pour 2015 était «Les analyses protéomiques révèlent des complexes distincts de facteurs de transcription associés à la chromatine et solubles» Ce travail a identifié un grand nombre de nouvelles interactions protéine-protéine. Les interactions signalées pour la première fois dans l'article, ainsi que certaines signalées dans un seul autre article, sont présentées ci-dessous.

On peut ensuite créer des partitions d'auteur en additionnant ou d'autres fonctions basées sur la nouveauté des articles qu'ils ont publiés ou co-écrits. Ce tableau montre les scores des auteurs avec la plus grande somme de faits nouveaux publiés. Cependant, les fonctions autres que la simple somme peuvent mieux représenter une métrique d'auteur.

On peut voir que certains types de documents signalent plus de relations, par exemple ceux qui ont des tableaux avec la liaison cible des composés ont tendance à avoir un grand nombre de faits nouveaux. Ainsi, les scores peuvent être plus comparables entre les articles et les auteurs lorsque l'on compare le même type de recherche en biologie ou en chimie médicinale.

Cette expérience bibliométrique est basée sur les relations biologiques extraites pour l'ensemble de données RESNET dans PathwayStudio, elle se concentre donc sur la biologie et les sujets liés aux sciences de la vie. On pourrait imaginer une analyse similaire pour d'autres domaines tels que la chimie ou la physique comme un moyen d'identifier plus rapidement des travaux faisant état de faits nouveaux.

L'équipe d'Elsevier Services peut appliquer ce type d'analyse, et bien d'autres, pour vous aider à identifier de nouvelles découvertes et des chercheurs qui rapportent la science la plus innovante dans les domaines qui vous intéressent. Nous nous efforçons de trouver de nouvelles métriques et analyses pour répondre à vos besoins.

Solutions R&D pour Pharma & Life Sciences

Nous sommes heureux de discuter de vos besoins et de vous montrer comment la solution d'Elsevier peut vous aider.

Contacter le service commercial

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *