PATH est une organisation mondiale à but non lucratif qui œuvre pour l’équité en santé. Forte de plus de 40 ans d’expérience dans la création de partenariats multisectoriels et d’une expertise en sciences, en économie, en technologie, en plaidoyer et dans des dizaines d’autres spécialités, PATH développe et déploie à grande échelle des solutions innovantes aux défis sanitaires les plus urgents au monde.
PATH recherche un ingénieur en IA pour contribuer au développement de SnapiForm, une plateforme d’IA accessible via Telegram (mini-application), WhatsApp et navigateur web. Cette plateforme permet aux professionnels de santé de numériser les formulaires HMIS papier en les photographiant simplement.
Responsabilités :
- Concevoir et optimiser des pipelines d’IA pour la compréhension de documents complexes. Se concentrer sur l’extraction de données structurées à partir de formulaires HMIS saisis sur mobile, en s’attaquant notamment aux défis tels que la reconnaissance d’écriture manuscrite, l’extraction de tableaux complexes et l’analyse multilingue.
- Rechercher, évaluer et optimiser les modèles de vision-langage de pointe (par exemple, Qwen-VL) et les modèles OCR fondamentaux sur des ensembles de données spécifiques au domaine. Utiliser des techniques avancées (LoRA/QLoRA, DeepSpeed) pour maximiser la précision sur des images mobiles réelles et bruitées.
- Concevoir et déployer des pipelines d’inférence de qualité production à l’aide de vLLM ou de moteurs similaires. Optimiser le traitement par lots continu, la gestion du cache KV et la quantification afin de maximiser le débit tout en respectant scrupuleusement nos objectifs de faible coût de traitement par page.
- Concevoir une architecture adaptée aux environnements cloud auto-hébergés/locaux (comme Linode) et au matériel sur site, en tenant compte de la souveraineté des données et de l’efficacité des coûts.
- Optimisez les modèles d’IA pour l’optimisation des données visuelles. Développez des stratégies de segmentation, de tuilage et de prétraitement des images afin de permettre aux modèles de traiter efficacement les images haute résolution et les tableaux volumineux et complexes sans perte de contexte.
- Évaluer, sélectionner et provisionner une infrastructure GPU cloud et sur site optimale pour gérer un volume cible de 10 millions de formulaires.
- Évaluer le matériel de nouvelle génération (par exemple, les nœuds NVIDIA Blackwell) pour équilibrer l’évolutivité massive, les performances et l’efficacité budgétaire.
- Établir les bases techniques des itérations futures, notamment la prise en charge du traitement hors ligne/en périphérie, des capacités multilingues étendues et l’interopérabilité au-delà de DHIS2.
- Disposition à se déplacer dans les pays du PATH selon les besoins et à respecter les décalages horaires avec les fuseaux horaires GMT et ESA.
Qualifications et expérience requises :
- Formation : Licence ou Master en informatique, intelligence artificielle, apprentissage automatique ou dans un domaine quantitatif connexe.
- Expérience : Plus de 7 ans d’expérience en ingénierie de l’apprentissage automatique, dont au moins 1 à 2 ans spécifiquement axés sur la vision par ordinateur, l’IA documentaire ou les modèles de langage multimodaux de grande taille.
- Frameworks principaux : Expertise approfondie en PyTorch et dans l’écosystème Hugging Face (Transformers, PEFT).
- Moteurs d’inférence : Expérience pratique et en production du déploiement de modèles utilisant vLLM.
- Expertise du domaine : Expérience avérée dans le domaine de l’IA documentaire, de la reconnaissance optique de caractères (OCR), de la reconnaissance de l’écriture manuscrite (HTR) ou des modèles vision-langage.
- Traitement d’images : Maîtrise des bibliothèques de vision par ordinateur (OpenCV, Pillow) et expérience du traitement d’images mobiles réelles de qualité variable, y compris les stratégies de tuilage et de découpage.
- Infrastructure et cloud : Solide expérience de Docker, Kubernetes et du provisionnement de GPU dans le cloud. Maîtrise de l’entraînement distribué et de l’optimisation de l’inférence.
- Programmation : Excellentes compétences en Python, avec une expérience en écriture de code propre, modulaire et hautement optimisé.
- Langue : Maîtrise de l’anglais oral et écrit
Attributs personnels :
- Passionné par le développement de technologies qui améliorent les systèmes de santé et soutiennent les professionnels de santé en première ligne dans les contextes à faibles ressources.
- Forte orientation vers la création de solutions d’IA rentables et évolutives, performantes sur du matériel limité.
- Capable de concilier la recherche de pointe en IA avec les décisions d’ingénierie pratiques et les contraintes du monde réel.
- Proactif et capable de travailler aussi bien de manière autonome qu’en collaboration.
- Un sens aigu des responsabilités et un engagement envers l’amélioration continue.
Ce que nous proposons :
- Opportunité de contribuer à des initiatives à fort impact dans le domaine de la santé numérique et des données.
- Rémunération compétitive et modalités de travail flexibles.