Pour que les résultats d’un test d’évaluation soient pertinents, il faut que ce test soit à la fois fiable et valide. Un test est réputé fiable si la précision de la mesure qu’il effectue est optimale. Un test est réputé valide s’il mesure uniquement ce qu’il est censé mesurer. Ces deux qualités sont interdépendantes : un test peu valide est nécessairement imprécis, un test imprécis est bien souvent peu valide.
Sans entrer dans de grandes considérations docimologiques ou métrologiques, nous livrons dans les lignes qui suivent quelques conseils simples et pratiques de composition d’un test à choix multiples.
1. Exprimer de façon opérationnelle l’aptitude que l’on veut mesurer. Ne pas écrire un test pour vérifier si un apprenant a développé de bonnes compétences de compréhension en général. Préférer un micro-objectif exprimé en termes précis et concrets. Par exemple, mesurer si les apprenants sont capables de reconnaître, après visionnement d’une séquence de 15 secondes extraite d’un reportage télévisé, l’acte de parole (demander de faire quelque chose, donner des informations sur soi-même, donner un conseil, etc.) effectué par un locuteur.
2. Répéter la mesure au moins trois fois. On ne peut conclure sans risquer de se tromper qu’un apprenant a développé une compétence précise si, par trois fois au moins, il n’a pas prouvé cette capacité. Pour reprendre notre exemple, on ne peut dire qu’un apprenant identifie facilement les actes de paroles effectués dans une courte séquence qu’après avoir proposé à cet apprenant de reconnaître au moins trois actes de paroles différents dans trois séquences différentes. Dans les examens de français PALSO
3. Pour chaque question, proposer entre trois et cinq réponses. Elles ne doivent pas se recouvrir, aucune d’entre elles ne doit être stupide, une seule d’entre elles doit être correcte. La limitation du nombre de réponses à deux donnerait 50% de chance de réussir aux apprenants. Une multiplication exagérée du nombre de réponses ne pourrait que déstabiliser l’apprenant.
4. Proposer des questionnaires différents aux voisins de table. Le mieux (tant sur le plan de l’objectivité relative de la mesure que sur celui du temps de préparation) est de simplement changer l’ordre des questions et aussi celui des réponses.
5. Formuler les questions et les réponses avec des phrases minimales rédigées en grec. On offre ainsi à l’apprenant des chances maximales de bonne compréhension et on neutralise le risque qu’une réponse soit choisie (le plus souvent avec bonheur !) tout simplement parce qu’elle comporte un mot que l’on retrouve dans le document authentique investigué.
6. Veiller à ce que les questions ne constituent pas en elle-même des aides à la compréhension sinon l’activité d’évaluation devient activité d’apprentissage. Ainsi, au lieu de demander à quel âge X est tombé sur la tête, il vaut mieux demander ce qui est arrivé à X.
7. Éliminer tout ce qui peut contraindre l’apprenant à faire appel à des connaissances/compétences autres que celles que l’on veut mesurer.
8. Ne jamais redonner un même test à moins de 15 jours d’intervalle. Les apprenants peuvent se souvenir de bonnes réponses sans pour autant être capable d’en justifier le choix.
9. Exprimer les résultats individuels par comparaison à la moyenne de la classe. Sinon, ils ne signifient pratiquement rien.
10. Si les résultats d’une majorité d’apprenants sont mauvais, ne pas hésiter à remettre en cause l’efficacité des cours qui visaient à l’acquisition des compétences évaluées. Ne pas gronder les apprenants : plutôt battre sa coulpe.
Paru dans la revue mensuelle de la Panhellenic Federation of Language School Owners (PALSO) en novembre 2001.