Catégories
Actualité pharmacieutique

Le FAIR Toolkit aide les chercheurs à relever les défis liés aux données

Publié le 16 juin 2020 par Ted Slater dans Pharma R&D

Depuis que la propagation de COVID-19 a été signalée pour la première fois, les chercheurs
de tous types se sont mobilisés pour relever les défis de son agent causal,
SARS-CoV-2, présente au monde. Les scientifiques des données en particulier ont été
appliquer rapidement leur expertise aux problèmes d'identification, de suivi et de
prévoir les éclosions; diagnostiquer COVID-19; identifier les individus infectés et
détecter la non-conformité aux contre-mesures virales; découvrir de nouveaux
interventions thérapeutiques ou réorientation des interventions existantes; et chercher un
vaccin sûr et efficace.

Nous en apprenons chaque jour davantage sur le SRAS-CoV-2 et le COVID-19,
et les chercheurs sont de plus en plus sophistiqués dans leur exploration de
tout, de la biologie de base du virus à l'amélioration des résultats pour les patients. Presque
chaque question qu'ils demandent nécessite de trouver des informations provenant de plusieurs sources
et intégré, et presque chaque fois qu'une question est répondue, elle invite
une autre question qui nécessite des informations provenant d'une autre source.

Le processus d'assemblage des données et des informations pour répondre
les questions de recherche importantes commencent généralement par les chercheurs qui évaluent:

  • Quelles données sont disponibles? Les données requises existent-elles du tout?
  • Comment accéder aux données une fois que nous les avons trouvées? Quels droits avons-nous
    devez utiliser les données?
  • Les données et métadonnées sont-elles compréhensibles? Pouvons-nous tous les mettre
    ensemble d'une manière significative?
  • Toutes les données sont-elles valides ou existe-t-il des valeurs aberrantes ou des doublons
    éliminer?

Ce processus itératif consistant à trouver des informations dans tous les lieux où elles résident, à les rassembler, à les nettoyer et à les organiser peut prendre beaucoup de temps à un data scientist, peut-être jusqu'à 80% de son temps selon une enquête de 2016. Les 20% restants sont dépensés de manière plus productive en utilisant réellement les données pour l'analyse ou pour la formation de modèles prédictifs. Le diagramme ci-dessous illustre un workflow typique de science des données sur une chronologie.

Appuyez sur, Gil. Forbes, mars 2016. Nettoyage des mégadonnées: tâche de science des données la plus consommatrice de temps et la plus agréable, selon une enquête,
https://www.forbes.com/sites/gilpress/2016/03/23/data-preparation-most-time-consuming-least-enjoyable-data-science-task-survey-says/

Ce processus de rassemblement des données pour permettre l'analyse et la modélisation qui conduisent à la compréhension est généralement lent et fastidieux car la majorité des données disponibles pour les chercheurs aujourd'hui ne sont pas FAIR, ce qui signifie que les données et les métadonnées ne respectent généralement pas les principes directeurs FAIR de trouvabilité, d'accessibilité, d'interopérabilité et de réutilisation. L'adhésion aux principes FAIR rend les données plus facilement réutilisables, de sorte qu'elles peuvent être appliquées efficacement à n'importe quel but, même imprévu, en réduisant le temps de visionnement et en augmentant la valeur inhérente des données. Faire l'effort de FAIRifier les données pour les rendre efficacement réutilisables permet des résultats plus rapides sur une plus large gamme d'applications.

Chez Elsevier, nous nous engageons à aider les scientifiques et les cliniciens à trouver de nouvelles réponses, à remodeler les connaissances humaines et à lutter contre les crises humaines les plus urgentes – et nous pensons que les données et les informations sont les clés du succès. Nous sommes fiers d'appuyer les efforts visant à aider les chercheurs à utiliser les principes FAIR pour être les meilleurs gestionnaires de données possibles. Nous sommes particulièrement fiers d’avoir participé au développement du FAIR Toolkit de la Pistoia Alliance, accessible gratuitement à tous les administrateurs de données, scientifiques de laboratoire, analystes commerciaux et responsables scientifiques.

Le FAIR Toolkit contient des cas d'utilisation pour aider les chercheurs en sciences de la vie à mieux comprendre les données FAIR et comment FAIRifier leurs propres données. Il permet également d'accéder aux outils et à la formation FAIR, ainsi que de contenir des informations pour aider les organisations à gérer le changement qu'exige le respect des principes FAIR. Comme bon nombre des organisations que nous servons, nous, chez Elsevier, nous sommes engagés envers FAIR Data et encourageons les chercheurs à consulter le FAIR Toolkit de la Pistoia Alliance pour en savoir plus.

Solutions R&D pour Pharma & Life Sciences

Nous sommes heureux de discuter de vos besoins et de vous montrer comment la solution d'Elsevier peut vous aider.

Contacter le service commercial

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *