Modèle de Kirkpatrick
Un cadre d’évaluation en quatre niveaux — Réaction, Apprentissage, Comportement, Résultats — qui mesure l’impact d’une formation depuis la satisfaction des participants jusqu’aux résultats business.
Qu’est-ce que c’est ?
Vous avez déployé votre formation. Les participants l’ont suivie. Et maintenant ? « Est-ce que ça a marché ? » La réponse dépend de ce que vous entendez par « marcher ».
Donald Kirkpatrick, professeur à l’Université du Wisconsin, a proposé en 1959 un cadre qui distingue quatre significations très différentes de cette question1. Chaque niveau répond à une question plus exigeante que la précédente — et chaque niveau est plus difficile à mesurer, mais aussi plus utile.
Le modèle est devenu le standard de l’évaluation de formation dans le monde entier. Soixante ans plus tard, c’est encore le cadre le plus cité en formation professionnelle2. Pas parce qu’il est parfait — il a ses critiques — mais parce qu’il pose les bonnes questions dans le bon ordre.
Le « New World Kirkpatrick Model », actualisé par Jim et Wendy Kirkpatrick en 2016, ajoute un conseil clé : planifiez l’évaluation en commençant par le niveau 4 et en remontant3. Ça rejoint directement le Backward Design — on définit l’impact visé avant de concevoir la formation.
En termes simples
Le modèle de Kirkpatrick, c’est le thermomètre de la formation. Le niveau 1, c’est demander au patient s’il se sent mieux (subjectif). Le niveau 2, c’est vérifier que la fièvre a baissé (mesurable). Le niveau 3, c’est observer s’il reprend ses activités normales (comportement). Le niveau 4, c’est vérifier qu’il ne retombe plus malade (résultat durable). La plupart des organisations ne prennent que la température subjective.
Comment ça marche — en un coup d’oeil
Les quatre niveaux (cliquez pour développer)
graph TD R[Niveau 1<br/>Réaction] --> A[Niveau 2<br/>Apprentissage] A --> C[Niveau 3<br/>Comportement] C --> RE[Niveau 4<br/>Résultats] style R fill:#fde8e8,stroke:#e74c3c style RE fill:#4a9ede,color:#fffLégende : La pyramide va du plus facile à mesurer (rouge, en bas) au plus difficile mais plus utile (bleu, en haut). La plupart des organisations s’arrêtent au niveau 1.
Comment ça marche ?
Niveau 1 — Réaction
Question : Les participants ont-ils trouvé la formation pertinente, engageante et utile ?
C’est le questionnaire de satisfaction classique. Facile à administrer, rapide à analyser. Mais attention : la satisfaction ne corrèle presque pas avec l’apprentissage réel1. Un participant peut adorer une formation divertissante sans avoir rien appris. À l’inverse, une formation exigeante peut recevoir des notes médiocres tout en produisant un apprentissage profond.
Outils : questionnaire post-formation, sondage rapide, focus group.
Quand : immédiatement après la formation.
Le piège du niveau 1
Un score de 4,5/5 en satisfaction ne prouve rien sur l’efficacité de la formation. Utilisez le niveau 1 pour détecter des problèmes (logistique, pertinence, clarté), pas comme preuve d’impact.
Le New World Kirkpatrick Model insiste sur un indicateur spécifique au niveau 1 : la pertinence3. Si le participant estime que le contenu n’est pas pertinent pour son travail, le transfert au niveau 3 est quasi impossible — et c’est une information plus utile que « j’ai aimé ».
Niveau 2 — Apprentissage
Question : Les participants ont-ils acquis les connaissances, compétences et attitudes visées ?
On mesure si la formation a produit un changement dans ce que le participant sait ou sait faire. C’est plus exigeant que le niveau 1 : il ne suffit pas d’avoir apprécié — il faut avoir appris.
Outils : test pré/post, mise en situation, démonstration, évaluation par les pairs.
Quand : pendant et à la fin de la formation.
Exemple : niveau 2 pour un module sécurité (cliquez pour développer)
Pré-test (avant la formation) : 10 questions sur l’identification des risques. Score moyen : 4/10.
Post-test (après la formation) : les mêmes 10 questions. Score moyen : 8/10.
Interprétation : l’écart de 4 points montre que les connaissances ont progressé. Mais attention — ça ne dit rien sur ce que les participants feront réellement sur un chantier.
Niveau 3 — Comportement
Question : Les participants appliquent-ils ce qu’ils ont appris dans leur travail quotidien ?
C’est le niveau où la formation rencontre la réalité. Et c’est aussi le niveau où la plupart des organisations abandonnent l’évaluation — parce qu’il faut du temps, de la coordination avec les managers, et des observations sur le terrain.
Outils : observation directe, entretien avec le supérieur hiérarchique à 30 et 90 jours, analyse des données de performance, auto-évaluation structurée.
Quand : 30 à 90 jours après la formation.
C'est ici que se trouve la vraie mesure
Pour une PME, le niveau 3 est souvent le niveau le plus atteignable et le plus utile. Un simple entretien avec le manager direct trois mois après la formation (« Est-ce que cette personne fait quelque chose de différent depuis la formation ? ») donne plus d’information que mille questionnaires de satisfaction.
Le New World Kirkpatrick Model ajoute la notion de « drivers requis »3 — les conditions qui doivent être en place dans l’environnement de travail pour que le transfert se produise (soutien du manager, outils disponibles, processus adaptés). Sans ces drivers, même une excellente formation ne produira pas de changement de comportement.
Niveau 4 — Résultats
Question : La formation a-t-elle produit des résultats mesurables pour l’organisation ?
C’est le Graal — et le plus difficile à mesurer. On relie la formation à des indicateurs business : taux d’erreur, délais, coûts, incidents, satisfaction client, chiffre d’affaires.
Outils : KPIs métier existants, analyse comparative avant/après, isolement des variables (autant que possible).
Quand : 3 à 12 mois après la formation.
La difficulté du niveau 4, c’est l’attribution. Le taux d’accidents a baissé de 15 % — est-ce grâce à la formation, au nouveau matériel, ou à la météo clémente ? Isoler l’effet de la formation est rarement possible avec certitude. Mais on peut établir des corrélations crédibles.
Pensez-y comme...
Le niveau 4, c’est comme mesurer l’effet d’un engrais sur une récolte. Vous savez que la récolte est meilleure, et vous savez que vous avez mis de l’engrais. Mais la pluie, le soleil et la qualité du sol ont aussi joué. On ne peut pas isoler l’engrais à 100 % — mais si les champs sans engrais produisent moins, la corrélation est solide.
La boucle avec le Backward Design
Le modèle de Kirkpatrick prend tout son sens quand il est utilisé en amont, pas seulement en aval. Si vous définissez dès la phase d’analyse quel niveau de Kirkpatrick vous visez, vous concevez la formation et l’évaluation en conséquence.
| Si vous visez… | Vous concevez pour… | Vous mesurez avec… |
|---|---|---|
| Niveau 1 | La satisfaction | Un questionnaire |
| Niveau 2 | L’acquisition de compétences | Un test pré/post |
| Niveau 3 | Le changement de comportement | Un suivi à 90 jours |
| Niveau 4 | L’impact business | Des KPIs métier |
Pourquoi l’utiliser ?
Raisons clés
1. Crédibilité. Quand un responsable formation peut montrer des résultats au niveau 3 ou 4, il parle le langage de la direction. La formation n’est plus un « coût » — c’est un investissement avec des résultats mesurables2.
2. Diagnostic. Si les participants sont satisfaits (niveau 1) et ont appris (niveau 2) mais ne changent pas de comportement (niveau 3), le problème n’est pas la formation — c’est l’environnement de travail3.
3. Priorisation. Vous n’avez pas besoin de mesurer les quatre niveaux pour chaque formation. Une sensibilisation de 15 minutes peut se contenter des niveaux 1-2. Un programme de leadership à 50’000 CHF justifie l’effort du niveau 4.
Quand l’utiliser ?
- Vous devez justifier le budget formation auprès de la direction
- Vous soupçonnez que vos formations sont appréciées mais ne changent rien sur le terrain
- Vous concevez un programme à fort enjeu (compliance, sécurité, leadership) et vous devez prouver l’impact
- Vous voulez un cadre commun pour toutes vos évaluations de formation
Règle de base
Le niveau d’évaluation doit correspondre aux enjeux de la formation. Formation compliance obligatoire → niveaux 1-3 minimum. Atelier de sensibilisation → niveaux 1-2 suffisent. Programme stratégique à gros budget → visez le niveau 4.
Comment y penser ?
Le bilan médical complet
Un médecin qui se contente de demander « vous vous sentez bien ? » fait du niveau 1. S’il fait une prise de sang, c’est du niveau 2 (mesure objective). S’il vérifie trois mois plus tard que vous avez changé vos habitudes alimentaires, c’est du niveau 3. S’il constate que vos indicateurs de santé se sont améliorés sur un an, c’est du niveau 4. Les quatre niveaux ensemble donnent une image complète — un seul ne suffit pas.
L'évaluation d'un investissement
Un investisseur ne se contente pas de demander « est-ce que l’action vous plaît ? » (niveau 1). Il vérifie si l’entreprise a les compétences pour exécuter sa stratégie (niveau 2). Il observe si les dirigeants prennent les bonnes décisions au quotidien (niveau 3). Et il mesure le rendement réel sur trois ans (niveau 4). Évaluer une formation avec la même rigueur qu’un investissement financier — voilà la logique de Kirkpatrick.
Concepts à explorer ensuite
| Concept | Ce qu’il couvre | Statut |
|---|---|---|
| backward-design | Définir l’impact visé avant de concevoir — la boucle se ferme avec Kirkpatrick | complet |
| addie | Le processus complet dont Kirkpatrick nourrit la phase Évaluation | complet |
Vérifiez votre compréhension
Testez-vous (cliquez pour développer)
- Nommez les quatre niveaux du modèle de Kirkpatrick dans l’ordre.
- Expliquez pourquoi un score de satisfaction élevé (niveau 1) ne prouve pas que la formation a fonctionné.
- Distinguez le niveau 2 (apprentissage) du niveau 3 (comportement) — pourquoi le passage de l’un à l’autre est-il si difficile ?
- Interprétez cette situation : votre questionnaire de satisfaction montre 4,5/5 mais les managers reportent que rien n’a changé sur le terrain. Quel est le problème en termes de Kirkpatrick ?
- Reliez Kirkpatrick au Backward Design — comment le fait de définir le niveau visé dès le départ change-t-il la conception de la formation ?
Où ce concept se situe
Position dans le graphe
graph TD P[Pédagogie] --> KP[Kirkpatrick] P --> BD[Backward Design] P --> AD[ADDIE] BD -.->|définit l'impact| KP KP -.->|nourrit l'évaluation| AD style KP fill:#4a9ede,color:#fffConcepts liés :
- backward-design — définir l’impact dès le départ facilite l’évaluation aux niveaux 3 et 4
- addie — Kirkpatrick fournit le cadre structurant pour la phase Évaluation d’ADDIE
Sources
Lectures complémentaires
Ressources
- The Kirkpatrick Model — Kirkpatrick Partners — site officiel avec le New World Kirkpatrick Model et les « required drivers »
- Kirkpatrick Model: How to Use All 4 Levels — Valamis — guide pratique avec des exemples pour chaque niveau et une comparaison avec d’autres cadres d’évaluation
- The Kirkpatrick Model: Four Levels — Devlin Peck — guide complet avec template de planification et questions d’évaluation par niveau
- How to Use Kirkpatrick’s 4 Levels — The L&D Academy — introduction accessible avec des exemples concrets pour les débutants en L&D
