Project Files
PEDAGOGIE.md
Pourquoi ce dispositif, comment il est construit, et ce que vous pouvez en attendre — ou pas.
Ce document s'adresse aux parents et aux enseignant·e·s qui découvrent le dispositif. Pour la documentation technique, voir
README.md. Pour la liste des risques et limites, voirWARNING.md.
La dissertation de philosophie est, pour beaucoup d'élèves de terminale, une montagne abstraite : on leur demande de problématiser, de conceptualiser, d'illustrer, d'objecter, de synthétiser — sans qu'ils sachent toujours à quoi ces verbes correspondent dans leur tête. La méthode est enseignée comme un plan (I/II/III, A/B/C), mais le geste intellectuel reste invisible.
Notre intuition : on apprend mieux ces gestes en les faisant qu'en les écoutant décrire. La fiction interactive — le « livre dont vous êtes le héros » — est un format que les adolescents connaissent : à chaque tour, on leur propose 3 choix qui engagent l'histoire différemment. Ici, chaque tour correspond en réalité à une opération intellectuelle de la dissertation. L'élève ne le sait pas pendant qu'il joue. Il le découvre à la fin, quand on lui montre que ses choix successifs forment déjà le squelette d'une dissertation argumentée.
« Tu viens de problématiser : tu as repéré la tension entre l'absence de contrainte extérieure et l'exercice véritable de la liberté. »
— mise en lien italique, après le premier tour
Le pari : transformer une compétence méta (« faire une dissertation ») en une suite d'actions concrètes (« faire un choix dans une scène »), puis révéler la structure méta à la fin. C'est ce qu'on appelle en sciences de l'éducation un échafaudage (scaffolding) : on porte temporairement l'élève au-dessus de ses moyens, pour qu'il ressente ce qu'on lui demandera bientôt de produire seul.
L'élève entre dans une scène (un cadre, des personnages, une tension liée au sujet de bac choisi — par exemple un tribunal, une salle de garde médicale, un atelier d'artiste). À chaque tour il a trois options A / B / C — ou peut répondre librement. Le narrateur enchaîne précisément cinq opérations, dans un ordre choisi par le serveur au démarrage de la session :
| Tour | Carte | Ce que ça veut dire concrètement |
|---|---|---|
| 1 | problématiser ou conceptualiser (tirage aléatoire) | Poser la tension philosophique du sujet, ou clarifier précisément les mots-clés |
| 2 | l'autre carte d'ouverture | (la complémentaire du tour 1) |
| 3 | illustrer | Donner un exemple concret incarné qui fait sentir l'enjeu |
| 4 | objecter | Faire porter par un personnage de la scène une position adverse réelle |
| 5 | synthétiser | Formuler une position qui tient ensemble les tensions précédentes |
Au tour 5, l'élève voit que toutes les cartes ont été jouées. Le narrateur l'invite à voir le squelette de dissertation qu'il vient d'écrire sans le savoir : une problématique, un plan en deux ou trois parties avec une vraie antithèse, et une citation authentique par partie — accompagnée d'une suggestion de transposition vers un exemple académique réel.
C'est le point le plus important pour vous, parents et enseignant·e·s. Les modèles de langage actuels — y compris les plus avancés — ont une tendance bien documentée à inventer des citations qui sonnent juste mais n'existent nulle part, ou à attribuer un texte de Spinoza à Nietzsche. Un élève qui réutiliserait une telle citation dans une copie de bac perdrait des points, et pire : il apprendrait à faire confiance à une source qui ment.
Nous avons construit ce dispositif sur une règle dure non-négociable : le narrateur n'a le droit de mettre entre guillemets que des citations qui figurent dans un corpus fermé de référence, et il doit les attribuer correctement à leur auteur et à leur œuvre.
| Quantité | Valeur |
|---|---|
| Citations vérifiées | 15 |
| Auteurs du programme couverts | 10 |
| Notions du programme touchées | 9 (sur 17) |
| Sources distinctes minimum par citation | 2 (hostnames différents) |
Le corpus actuel couvre surtout la notion liberté en profondeur (15 citations). Les autres notions (justice, État, conscience, devoir, vérité…) sont à peine effleurées. C'est volontaire pour la démo : on a préféré couvrir une notion à fond plutôt que toutes à moitié. Voir
README.mdsection « Vision communautaire » pour l'extension possible.
Une citation entre dans le corpus seulement si elle est attestée par au moins deux sources web distinctes (hostnames différents), avec préférence donnée aux sources canoniques : Wikisource, palimpsestes.fr, philolog.fr, hyperspinoza.caute.lautre.net, éditions universitaires en ligne. Pour chaque citation on conserve :
À chaque fois que le narrateur produit une réponse, quatre niveaux de garde-fous s'enchaînent côté serveur :
Tout cela est visible dans l'interface : un bandeau orange signale les révisions automatiques quand elles ont eu lieu, un badge vert confirme les citations corpus-vérifiées.
Le squelette final passe par un validateur pédagogique spécifique qui attrape :
Si une de ces deux fautes est détectée, le narrateur doit réécrire le squelette.
Tout ce que produit le système est auditable :
Voir
WARNING.mdpour la version détaillée. Résumé court ici.
Les outils d'IA générative arrivent dans la vie des lycéens — la plupart en utilisent déjà , le plus souvent sans cadrage. Notre choix est d'assumer cette présence et de construire des dispositifs qui en bornent les usages :
Pas de magie cachée ; pas de promesse de remplacer le travail de l'élève ; pas de monétisation des données.
Concrètement, le narrateur et la session de jeu ne font aucun
appel à une API externe — tout tourne en local sur LM Studio.
Seul l'écran d'enrichissement du corpus (/corpus) fait des
requêtes sortantes ciblées vers Wikisource (recherche et lecture
de page) et vers les URLs que vous fournissez manuellement comme
2ᵉ source — pour vérifier qu'une citation y figure bien avant
qu'elle entre dans le corpus actif. Ces appels sont visibles dans
l'interface ; aucun ne se déclenche pendant qu'un enfant joue.
Si vous voulez creuser n'importe lequel de ces points — la construction du corpus, le fonctionnement du vérificateur, les limitations du dispositif — n'hésitez pas à demander. Tout le code est ouvert et tout le contenu est traçable.
Le dispositif est un plugin LM Studio en TypeScript qui expose un serveur HTTP local. Le narrateur est un modèle de langage qui tourne soit en local soit sur une machine dédiée du réseau. Le vérificateur de citations et le validateur pédagogique du squelette sont des modules Node.js indépendants qui lisent un corpus au format JSONL.
Chaque session est persistée localement dans
~/.livre-heros-bac/sessions/ et peut ĂŞtre relue via la vue admin.
Pour les détails d'architecture, d'installation et de
contribution : README.md.
Document maintenu en synchronisation avec la page web
/pedagogie du dispositif (générée par
src/pedagogie.ts). Si vous trouvez une incohérence entre ce
fichier et la page web, c'est probablement que le code a évolué et
que ce document n'a pas suivi — signalez-le.
Toutes les sessions jouées sont conservées sur disque dans
des fichiers de transcript intégraux (un par session, format
JSONL append-only). Vous pouvez les relire après coup Ă
l'adresse /admin — l'enfant tape, le narrateur répond, le
vérificateur audite, tout est consigné.
Le détail de chaque citation apparaît dans le rapport d'audit de chaque tour : citation extraite, auteur détecté, statut (vérifiée corpus / hors corpus / décorative), distance au texte canonique, et — si vérifiée — la source à laquelle elle a été matchée.
Le corpus complet est un fichier texte lisible
(src/data/verified.jsonl) qui inclut, pour chaque citation,
les URLs des sources qui l'attestent. Vous pouvez les ouvrir
une par une pour vérifier vous-mêmes.
Les diagnostics serveur sont également visibles : si le narrateur a dû s'y reprendre à plusieurs fois, ou si le serveur a dû corriger une étiquette, vous voyez les badges correspondants dans le transcript.
Ce n'est pas un coach magique. L'élève qui joue une session sans réfléchir n'apprendra rien — c'est un échafaudage, pas un téléphérique.
Ce n'est pas un remplacement du professeur. Le dispositif révèle la structure d'une dissertation ; il n'enseigne ni la nuance d'un auteur, ni la maturité d'un développement, ni la pratique de la copie de quatre heures. Le prof reste central.
Ce n'est pas une encyclopédie de philosophie. Le corpus actuel couvre quelques notions du programme avec une poignée de citations bien sourcées par notion. Il n'est pas encyclopédique — il est solide, ce qui est différent.
Le narrateur n'est pas infaillible. Sur des questions de nuance philosophique fine (interprétation, contexte historique, comparaison d'auteurs), il reste un outil — l'élève doit garder son esprit critique et confronter ce qu'il lit à ses cours et à son prof.
Ce n'est pas un produit. Pas de support utilisateur, pas d'engagement de disponibilité, pas de garantie pédagogique. C'est une démonstration ouverte, livrée telle quelle.
Programme officiel : arrêté du 19 juillet 2019, NOR MENE1921238A, paru au Bulletin Officiel. Définit les 17 notions canoniques de terminale et la liste des ~80 auteurs au programme.
Sources prioritaires pour les citations : Wikisource (textes en accès libre, éditions historiques), palimpsestes.fr, philolog.fr, hyperspinoza.caute.lautre.net, rousseauonline.ch, archive.org pour les éditions originales.
Méthode de vérification du corpus : règle de la double source — une citation n'entre dans le corpus actif que si elle est attestée par au moins deux hostnames distincts, avec extraction contextuelle conservée pour traçabilité.
Garde-fous techniques : extraction par expression régulière de toutes les phrases entre guillemets de chaque réponse, comparaison par distance de Levenshtein normalisée (tolérance 18 %) contre le corpus, détection de l'attribution avant ou après la citation, boucle de retry corrective si la vérification échoue, et patch défensif côté serveur si le modèle persiste dans l'erreur après les retries.
Validation pédagogique du squelette : module séparé
(src/skeleton-validator.ts) qui détecte les misuses
sémantiques connus (Rousseau « né libre dans les fers » placé
dans une partie de développement, Descartes « indifférence »
utilisée pour défendre la liberté arbitraire…) et le manque de
diversité d'auteurs.