Stage en Data Sciences
Famille de fonction : Biométrie, Data managementressources-humaines@biofortis.fr
Description du poste et des missions
Outils d’automatisation et d’IA appliqués à la veille et à la rédaction scientifique
L’entreprise
Biofortis SAS est une société de services en recherche clinique ou CRO (Contract Research Organization) dédiée à l’innovation dans les secteurs agroalimentaire, nutrition, santé, cosmétique et pharmaceutique. Biofortis accompagne le développement des produits de ses clients en offrant des services originaux et innovants allant du développement scientifique de nouveaux produits, en passant par l’apport de preuves précliniques et cliniques, jusqu’aux analyses du microbiote et leur interprétation scientifique.
Forte de ses 80 collaborateurs, notre entreprise présente à son actif plus de 500 projets, 300 essais cliniques gérés full-service en France, en Europe et à l'international.
Dans le cadre de ses activités de R&D, Biofortis recherche un(e) stagiaire(e) en Data Science pour une durée de 6 mois au sein de la Business Unit Biométrie et Data Science.
Contexte
L'essor de l'intelligence artificielle (IA) a considérablement transformé le paysage de la recherche médicale, offrant des possibilités sans précédent pour optimiser les essais cliniques (gain de temps, maximisation des chances de succès, diminution des coûts, …).
Dans ce cadre, l’équipe Data Science conçoit et développe des outils innovants d’automatisation, de traitement de données et d’analyse destinés à soutenir les activités de recherche clinique, de veille réglementaire et de production en général.
Dans le cadre de la feuille de route 2025–2026, plusieurs projets visent à renforcer l’efficacité et la fiabilité des processus de veille et de production documentaire, en s’appuyant sur l’automatisation, l’intelligence artificielle et l’ingénierie de données. Ces projets associent expertise métier, rigueur réglementaire et exploitation des technologies d’intelligence artificielle (LLM, NLP, MLOps).
Le ou la stagiaire participera activement au développement et à l’intégration de ces outils, avec un focus particulier sur l’automatisation de la veille réglementaire, scientifique et technologique, ainsi que sur l’assistance à la rédaction de protocoles et de documents de synthèse.
Objectifs et missions
Le ou la stagiaire participera activement au développement et à l’intégration d’outils d’automatisation et d’intelligence artificielle appliqués à la veille (réglementaire, scientifique, technologique) et à l’assistance à la rédaction de documents de synthèse et de protocoles d’études cliniques.
Ses activités s’articuleront autour des axes suivants :
- Automatisation et ingénierie de données
- Concevoir et déployer des pipelines automatisés pour la collecte, le nettoyage, la transformation et la synthèse d’informations issues de multiples sources (bases réglementaires, publications scientifiques, …).
- Mettre en place des workflows reproductibles et traçables (Python, APIs, fichiers JSON, GitLab CI/CD, Docker, …).
- Expérimenter des approches de surveillance automatisée (veille continue, extraction périodique, alertes intelligentes).
- Intelligence artificielle et génération de contenu
- Intégrer et tester des modèles de machine learning et LLM pour la classification, la traduction, la synthèse et la rédaction assistée de contenus techniques ou réglementaires.
- Développer des outils d’aide à la rédaction (résumés automatiques, suggestions de formulation, synthèses de protocoles).
- Évaluer la pertinence et la fiabilité des résultats produits par les modèles dans un contexte réglementé.
- Qualité, validation et documentation
- Contribuer à la validation des performances des pipelines et modèles (tests, mesures, suivi des versions).
- Participer à la rédaction de la documentation technique et à l’alignement avec les exigences qualité internes.
- Produire des livrables conformes aux exigences de traçabilité et de gestion de la donnée dans le cadre de la recherche clinique.
- Collaboration et reporting
- Travailler au sein d’une équipe pluridisciplinaire associant Data Science, Rédaction scientifique et médicale, Affaires réglementaires et Qualité.
- Participer aux réunions de suivi de projet, aux démonstrations et à la présentation des résultats intermédiaires (notebooks, tableaux de bords automatisés, …).
- Contribuer à la capitalisation des connaissances et à la diffusion des bonnes pratiques d’automatisation et d’IA.
Livrables attendus
- Prototype(s) fonctionnel(s) intégré(s) aux plateformes internes de Data Science.
- Documentation technique et guide utilisateur.
- Rapport de validation et journal de tests automatisés.
Profil recherché
- Étudiant(e) en Master 2 ou école d’ingénieurs spécialisé(e) en Data Science, Machine Learning, Mathématiques appliquées ou Informatique.
- Compétences attendues :
- Python et outils LLM (Pytorch, scikit-learn, pandas, numpy, FastAPI, transformers, ...)
- Connaissance des outils MLOps (Docker, GitLab CI/CD, MLflow ou équivalent)
- Notions de validation des systèmes informatisés
- Esprit analytique, rigoureux(se) et orienté(e) solution
- Motivation à explorer et à développer des applications concrètes de l’IA et de l’automatisation au service de la santé, de la recherche clinique et de la qualité.
- Excellentes capacités de communication et esprit d’équipe pour présenter régulièrement les résultats aux équipes pluridisciplinaires.
- Bonne maîtrise de l’anglais et capacité à évoluer dans un environnement international.
Date de début : Janvier 2026 (flexible)
Durée : 4 à 6 mois
Horaire hebdomadaire de travail : 35h
Gratification :
. Rémunération convention de stage
. Participation aux titres restaurant et frais de transport en commun
Contact :
Merci d’adresser CV + lettre de motivation à :
Diego Tomassi, Senior Data Scientist : diego.tomassi@biofortis.fr