Offre d’emploi à l’ONG humanitaire IRC / Divers emplacements (17 Avril 2026)

Informations sur l'emploi

Titre du Poste : consultant en apprentissage automatique

Lieu du Travail : Flexible

Description de l'emploi

Fondé en 1933 à l’initiative d’Albert Einstein, l’IRC est l’une des plus importantes organisations non gouvernementales humanitaires internationales (ONGI) au monde.

Rôle : Consultant en apprentissage automatique – Science des données pour  les programmes : projet pilote d’évaluation des besoins, de regroupement et de modélisation prédictive

 

Lieu : Télétravail Effort estimé : 42 jours
   

 

1. À propos du Comité international de secours

 

Le Comité international de secours (IRC) intervient lors des crises humanitaires les plus graves au monde, contribuant à rétablir la santé, la sécurité, l’éducation,  le bien-être économique  et l’autonomie des populations dévastées par les conflits et les catastrophes. Présent dans plus de 40 pays et plus de 20 villes américaines, l’IRC œuvre à l’intersection de l’aide humanitaire et du développement à long terme, et vient en aide à des millions de personnes chaque année.

 

L’unité METAL de l’IRC pilote la stratégie  de l’organisation  en matière de suivi, d’évaluation, de technologie,  de redevabilité et d’apprentissage, et accompagne les programmes  nationaux  dans la collecte, la gestion et l’utilisation des données afin d’améliorer leur programmation. L’unité dispose d’une gamme d’ outils numériques de collecte et de visualisation des données – notamment CommCare , Power BI et Databricks – et investit de plus en plus dans l’analyse avancée des données pour extraire des informations exploitables à partir des volumes importants de données collectées par l’IRC dans le cadre de ses programmes .

 

2. Contexte

 

L’IRC a récemment mené une étude d’apprentissage automatique à partir des données d’inscription des bénéficiaires de son  programme en Équateur et au Pérou . Grâce à un clustering par k-médoïdes appliqué à un ensemble de données d’environ 13 000 bénéficiaires, l’analyse a révélé quatre segments de population distincts, et notamment un constat crucial : 41 % des enfants et des familles en transit ne bénéficiaient d’aucun service. Cette information, invisible avec les analyses démographiques classiques, a depuis lors permis d’adapter  les programmes  dans les deux pays et d’éclairer les propositions formulées auprès des bailleurs de fonds.

 

Cet exercice  a validé  un principe simple : l’apprentissage automatique peut  identifier des tendances dans les données de programmes  existantes  que l’analyse humaine ne permet pas de déceler, ce qui permet un ciblage plus précis, des propositions plus pertinentes et une programmation davantage axée sur les besoins des bénéficiaires . L’IRC souhaite désormais s’appuyer sur cette preuve de concept dans deux directions : appliquer le clustering à un nouveau contexte d’évaluation des besoins et développer un premier modèle prédictif pour une intervention de programme spécifique .

 

Cette mission de conseil vise à fournir les deux volets de travail en tant que résultats distincts de la phase 1 de l’initiative plus large de l’IRC en matière d’apprentissage automatique pour  les programmes  .

 

3. Objectifs

 

Le consultant devra :

  • Appliquer l’apprentissage automatique non supervisé (clustering) aux données clients et populationnelles du [Pays A] pour produire une évaluation des besoins fondée sur des segments de population  dérivés empiriquement  plutôt que sur des catégories démographiques supposées.
  • Effectuer une évaluation méthodologique et tenter d’appliquer des techniques de régression multiniveau et de post-stratification (MRP) pour estimer les besoins dans les zones où la couverture des données est clairsemée ou inégale, en indiquant à la fois ce que montrent les estimations et le degré de confiance qui peut  raisonnablement  leur être accordé.
  • Effectuer une évaluation de la faisabilité des données sur les ensembles de données  des programmes candidats  dans le [Pays B] afin d’  identifier  le projet pilote le plus approprié pour la modélisation prédictive.
  • Produire un guide méthodologique pour les conseillers régionaux en mesure (RMA) de l’IRC, s’appuyant sur les deux axes de travail, leur permettant d’évaluer la disponibilité des données, de commander ou de mener des analyses similaires et de communiquer les résultats aux publics du développement  des programmes  et des activités dans des contextes futurs.
  • Concevoir,  valider et documenter un premier modèle prédictif pour le  programme sélectionné  en suivant les meilleures pratiques  reconnues  en matière de développement de modèles,  de tests de robustesse  et de déploiement responsable.

 

4. Étendue des travaux

 

Volet de travail A : Regroupement des évaluations des besoins – [Pays A]

  • A1 Évaluation et préparation des données . Examiner les ensembles de données disponibles (  probablement  les données d’inscription des clients, les résultats de l’évaluation multisectorielle des besoins et les données  de suivi des programmes ) et évaluer leur qualité, leur exhaustivité et leur pertinence pour le regroupement. Rédiger une brève note d’évaluation des données (2 à 3 pages) documentant les sources utilisées, leurs limites et les hypothèses formulées lors de la préparation. Procéder au nettoyage et à la structuration des données. Cette note servira de validation formelle avant le début des analyses.
  • A2 Analyse de regroupement . Appliquer  un  algorithme de regroupement approprié ( par exemple ,  K-médoïdes, regroupement hiérarchique ou similaire) pour  identifier  des segments de population distincts. Le choix de la méthode doit être justifié et documenté. Parallèlement, réaliser une évaluation méthodologique afin de déterminer si les techniques de recherche de population multiple (RPM) peuvent étendre la portée de l’analyse aux zones où les données sont rares. Le consultant doit  tenter d’élaborer  un modèle RPM lorsque les données le permettent, présenter les estimations obtenues avec des intervalles d’incertitude explicites et documenter clairement ce que montrent ces estimations, les limites de l’approche compte tenu des données auxiliaires disponibles et les données  supplémentaires qui  seraient  nécessaires  pour améliorer la fiabilité. La  composante RPM  est considérée comme exploratoire ; sa valeur réside autant dans la mise en évidence des limites des données probantes actuelles que dans la production d’estimations ponctuelles.
  • Rapport d’évaluation des besoins (A3) . Rédiger un rapport d’évaluation des besoins interprétant les résultats du groupe en termes de programmes. Ce rapport doit traduire les données statistiques en recommandations concrètes, en décrivant les segments de population concernés, leurs besoins spécifiques et les implications pour la conception et le ciblage  des programmes  . Les estimations du budget prévisionnel (MRP) doivent être clairement identifiées et assorties  des mises en garde appropriées . L’équipe S&E et le personnel  de programme de l’IRC  contribueront à l’interprétation contextuelle et à la rédaction finale ; le consultant pilotera l’analyse narrative.

 

Volet B : Projet pilote de modélisation prédictive – [Pays B]

  • B1 Évaluation de la faisabilité des données . Examiner les ensembles de données des programmes candidats  – couvrant probablement deux à trois domaines d’intervention (pouvant inclure la relance et le développement économiques, l’éducation ou la protection) – et évaluer leur pertinence pour la modélisation prédictive. Les critères de pertinence comprennent : la disponibilité de données historiques sur les résultats, la taille de l’échantillon, l’exhaustivité des données et les considérations éthiques liées à l’utilisation des prédictions dans ce contexte programmatique. Rédiger une brève note de faisabilité recommandant le programme à privilégier et justifiant ce choix, en accord avec l’IRC avant le début du développement du modèle.
  • B2 Développement et validation du modèle . Après accord avec l’IRC sur le  programme sélectionné , élaborer un modèle prédictif à partir  des données historiques du programme . Ce modèle doit prédire un résultat clairement défini ( par exemple, la réussite du programme , le risque d’abandon ou un résultat spécifique pour un client) à partir des données disponibles au moment de l’admission du client ou peu après.
  • Le développement du modèle doit suivre  les meilleures pratiques reconnues tout au long du processus, notamment :
  • Une division documentée en ensembles d’entraînement et de test, ou validation croisée où la taille de l’échantillon contraint un ensemble de test mis de côté, avec des indicateurs de performance rapportés sur des données sur lesquelles le modèle n’a pas été entraîné.
  • Des contrôles de robustesse sont effectués sur des sous-groupes démographiques clés — au minimum le sexe et l’âge, et lorsque les données  le permettent,  le statut de déplacement et d’autres caractéristiques contextuelles pertinentes — afin d’  identifier  les différences de performance et les sources potentielles de biais.
  • Analyse de l’importance des fonctionnalités et documentation suffisante du fonctionnement interne du modèle pour permettre aux examinateurs non spécialistes de comprendre ce que le modèle fait et ne fait pas.
  • Documentation explicite des conditions dans lesquelles le modèle ne doit pas être utilisé ou doit être réentraîné, notamment en cas de variations de population, de modifications de la conception  du programme  ou de détérioration de la qualité des données.
  • Tout le code analytique écrit en R ou Python, partagé sur IRC dans un format commenté et entièrement reproductible, avec un fichier README clair.
  • Outil opérationnel et documentation B3 . Transformer le modèle validé en un outil opérationnel simple d’utilisation (module de notation, intégration à un tableau de bord ou données structurées) que le personnel  du programme  puisse utiliser sans connaissances spécialisées en science des données. Produire une documentation  expliquant  le fonctionnement de l’outil, l’interprétation des résultats, ses limitations connues et les protocoles recommandés pour la supervision et la correction humaines. L’outil doit être déployable au sein de l’infrastructure Databricks et Power BI existante de l’IRC.

 

Volet C : Guide méthodologique à l’intention des conseillers régionaux en matière de mesure

  • Guide méthodologique C1 RMA :  En s’appuyant sur l’expérience et les enseignements tirés des deux groupes de travail, élaborez un guide méthodologique pratique ( environ 8 à 10 pages) destiné aux conseillers régionaux en mesure de l’IRC. Ce guide doit être rédigé pour un public ayant des connaissances en analyse quantitative, mais non spécialisé en science des données. Il doit aborder les points suivants : comment évaluer si les données disponibles se prêtent au clustering ou à la modélisation prédictive ; les règles générales de sélection des méthodes ; les questions clés à se poser lors de la commande ou de l’évaluation de ce type de travail ; comment vérifier la cohérence des résultats analytiques ; et comment présenter les résultats aux équipes de développement  des programmes  et des activités. Ce guide doit s’appuyer sur l’expérience spécifique de cette mission de conseil plutôt que sur une méthodologie générique  et  doit être relu par au moins un conseiller régional en mesure avant  sa finalisation .

 

5. Livrables et calendrier

 

Livrable  1 : Note d’évaluation des données (Volet de travail A)

Période : Semaines 1 à 2

Jours estimés : 3

 

Livrable  2 :  Nettoyage et préparation des données (Volet de travail A)

Période : Semaines 2 à 5

Jours estimés : 7

 

Livrable  3 :  Analyse de regroupement et évaluation MRP (Volet de travail A)

Période : Semaines 5 à 9

Jours estimés : 8

 

Livrable  4 :  Rapport final d’évaluation des besoins (Volet de travail A)

Période : Semaines 9 à 12

Jours estimés : 5

 

Livrable  5 : Note d’évaluation de la faisabilité des données (Volet de travail B)

Période : Semaines 2 à 4

Jours estimés : 3

 

Livrable  6 : Développement et validation du modèle (Volet de travail B)

Période : Semaines 8 à 14

Jours estimés : 8

 

Livrable  7 : Outil opérationnel et documentation (Volet de travail B)

Période : Semaines 14 à 17

Jours estimés : 4

 

Livrable  8 : Guide méthodologique RMA (Volet de travail C)

Période : Semaines 15 à 18

Jours estimés : 4

Nombre total de jours estimés : 42 

 

Remarque : Les volets A et B sont menés en parallèle. Le calendrier suppose un accès rapide aux données dès  le début du projet  et que la validation de l’évaluation des données (volet A) et l’accord sur l’étude de faisabilité (volet B)  se déroulent  sans délai important. Tout retard dans l’accès aux données ou leur validation aura une incidence sur le calendrier.

 

6. Considérations éthiques et protection des données

 

L’IRC prend la protection des données très au sérieux et  applique  sa  politique de protection des données à l’échelle de l’organisation . Le consultant devra signer un accord de partage de données avant d’accéder aux données des clients. Toutes les données fournies seront anonymisées. Le consultant s’engage à ne pas partager, publier ni conserver les données de l’IRC au-delà des termes du présent accord.

 

Les modèles prédictifs élaborés dans le cadre de ce  mandat  sont exclusivement destinés à faciliter l’allocation de ressources  supplémentaires  et un accompagnement personnalisé, et non à exclure des clients des services ou à prendre des décisions automatisées affectant des cas individuels. Les contrôles de robustesse et l’analyse des performances des sous-groupes décrits à la section 4B constituent une  composante obligatoire  du travail, et non des améliorations facultatives. Le consultant est tenu de prendre en compte ces paramètres éthiques dès l’évaluation de la faisabilité et de les refléter explicitement dans la documentation de l’outil et dans tous les livrables partagés avec le personnel  du programme de l’IRC  .

 

7. Qualifications requises

 

  • Diplôme d’études supérieures ( Master  ou Doctorat) en économie, science des données, statistiques, informatique ou dans un domaine quantitatif connexe, ou expérience professionnelle équivalente.
  • Expérience avérée dans l’application de techniques de clustering et de modélisation prédictive à des ensembles de données réels, avec des exemples de travaux présentés lors de la candidature.
  • Maîtrise  de R ou Python (obligatoire) ; l’expérience avec Databricks est un atout.
  • Expérience avérée du travail avec des données désordonnées, incomplètes ou générées administrativement – ​​et pas seulement avec des ensembles de données de recherche propres.
  • Une expérience des techniques MRP ou d’estimation similaires pour les petits domaines est souhaitable ; les candidats doivent  indiquer  clairement leur niveau de familiarité avec cette méthode.
  • Connaissance du secteur humanitaire ou du développement international, idéalement avec une expérience directe au sein d’une ONG ou d’un institut de recherche  opérant  dans des contextes de crise.
  • Excellentes compétences en rédaction technique et capacité à traduire les résultats analytiques pour un public non spécialisé.

 

8. Gestion et rapports

 

Le consultant relèvera de [Philip Blue / Conseiller régional en mesure, Amérique latine] et travaillera en étroite coordination avec l’unité de mesure de l’IRC et  le personnel MEAL du programme de pays concerné.

 

Une réunion de lancement aura lieu dans la première semaine afin de définir l’accès aux données, le plan de travail et les modalités de communication. Des points d’étape brefs toutes les deux semaines sont prévus. Deux points d’examen formels sont intégrés au calendrier : la validation de la note d’évaluation des données du volet A et l’approbation de la recommandation de faisabilité du volet B, avant le début des analyses de fond. Le guide  méthodologique du volet C  sera examiné par au moins un conseiller régional en mesure, en plus du superviseur principal, avant sa  finalisation .

 

9. Exigences de soumission

 

  • CV mettant en valeur l’expérience pertinente en science des données.
  • Une brève déclaration d’intérêt (une page maximum) décrivant votre approche de l’un des deux axes de travail.
  • Deux exemples de travaux analytiques antérieurs : publications, dépôts de code ou rapports techniques.
  • Taux journalier en USD.
  • Noms et coordonnées de deux personnes de référence parmi  d’anciens  clients ou employeurs.

Cliquez ici pour postuler