🤖 AI Research Edition

Landing

Français

Gouvernance architecturale de l'IA à l'échelle de la communauté - Un examen technique de la gouvernance de l'IA à l'échelle de la communauté Village AI

Pour les chercheurs en IA/ML et les chercheurs en sécurité


Une série technique en cinq parties examinant une approche alternative à l'alignement de l'IA : la contrainte architecturale au moment de l'inférence plutôt que l'alignement par la formation. Cette série s'adresse aux chercheurs qui connaissent la RLHF, l'IA constitutionnelle, l'interprétabilité mécaniste et la littérature plus large sur l'alignement.


La série

1. Ce qu'est l'IA - et où se situe le problème de l'alignement

Le raisonnement émergent, les lois d'échelle et la distinction entre capacité et contrôlabilité. Pourquoi le problème d'alignement tel qu'il est vécu par les systèmes communautaires déployés diffère du problème d'alignement tel qu'il est étudié en laboratoire - et pourquoi cet écart est important.

2. Modèles de base vs. inférence spécialisée par domaine - Une analyse structurelle

Déplacement de la distribution, biais du taux de base et problème de la substitution silencieuse. Comment la composition des données d'entraînement détermine le comportement par défaut, pourquoi l'incitation et la RLHF ne résolvent pas les aprioris distributionnels à la queue, et ce qu'une stratégie de couche spécialisée sur un modèle à 8B paramètres offre (et sacrifie) par rapport aux systèmes frontières.

3. Pourquoi la gouvernance du temps de formation échoue - Les contraintes architecturales comme alternative

L'incident du 27027 comme étude de cas de l'échec de l'alignement : un système d'IA substituant silencieusement le langage thérapeutique au langage théologique en dépit d'instructions explicites. Pourquoi le réglage fin, la RLHF et l'IA constitutionnelle ne résolvent pas cette catégorie de problèmes. Guardian Agents comme séparation épistémique - systèmes de vérification structurellement indépendants du modèle qu'ils contrôlent.

4. Ce qui est en direct dans la production - Un inventaire sans fard

Le système actuel : villageai-8b-corrected-v4, réglage fin des couches spécialisées, inférence AMD RX 7900 XTX via WireGuard avec repli de l'unité centrale, vérification de la similarité du cosinus par rapport aux documents sources, quatre couches Guardian Agent et une boucle de rétroaction adaptative. Ce qui fonctionne, ce qui n'a pas encore été prouvé et les limites dont nous sommes conscients.

5. Au-delà du modèle - Architecture de la plate-forme et intégration de la gouvernance

L'IA en tant que composante d'une plateforme communautaire souveraine. Comment les contraintes architecturales s'étendent au-delà du modèle dans l'isolation des données, l'architecture de consentement, l'encadrement basé sur le vocabulaire et la gouvernance inter-communautaire fédérée. Ce que cette approche sacrifie en termes de capacité et ce qu'elle gagne en vérifiabilité.


A qui s'adresse ce document ?

Ces articles s'adressent aux chercheurs qui travaillent sur l'alignement, la sécurité, l'interprétabilité et la gouvernance de l'IA. Ils supposent une bonne connaissance des architectures de transformateurs, des méthodes de réglage fin, de l'apprentissage par renforcement à partir du retour d'information humain et de la littérature actuelle sur l'alignement.

La contribution n'est pas théorique. Il s'agit d'une description d'un système déployé - opérationnel depuis octobre 2025 - qui adopte une approche différente du problème de l'alignement : contrainte architecturale au moment de l'inférence plutôt qu'alignement par le biais de l'apprentissage. L'approche est jeune, fonctionne à une échelle modeste et n'a pas été évaluée de manière indépendante. Nous la présentons comme une étude de cas et non comme une solution.

Nous sommes francs quant à ses limites. Un modèle de 8B paramètres avec une spécialisation par domaine ne peut pas rivaliser avec les systèmes d'avant-garde en termes de capacité générale. L'architecture Guardian Agent ajoute de la latence. La vérification de la similarité cosinus dépend de la qualité et de la couverture du corpus du document source. Il s'agit là de compromis réels, dont nous discutons tout au long de l'ouvrage.

Lectures complémentaires


Series: Architectural AI Governance at Community Scale - A Technical Examination of Village AI Author: My Digital Sovereignty Ltd Date: Mars 2026 Licence: CC BY 4.0 International

Published under CC BY 4.0 by My Digital Sovereignty Ltd. You are free to share and adapt this material, provided you give appropriate credit.