Architecturaal AI-bestuur op communautaire schaal - Een technisch onderzoek van Village AI

Voor AI/ML-onderzoekers en veiligheidsonderzoekers

Een vijfdelige technische serie waarin een alternatieve benadering van AI-uitlijning wordt onderzocht: architecturale beperking tijdens inferentie in plaats van uitlijning via training. Geschreven voor onderzoekers die bekend zijn met RLHF, constitutionele AI, mechanistische interpreteerbaarheid en de bredere afstemmingsliteratuur.

De serie

1. Wat AI is - en waar het afstemmingsprobleem eigenlijk zit

Emergent redeneren, schaalwetten en het onderscheid tussen capability en controllability - nu aangescherpt door de 2024-2026 verschuiving van chatbots naar agents (capability vs productisation) en door chain-of-thought-unfaithfulness resultaten die CoT-gebaseerd toezicht beperken. Waarom het afstemmingsprobleem zoals dat wordt ervaren door ingezette gemeenschapssystemen verschilt van het afstemmingsprobleem zoals dat in het laboratorium is bestudeerd - en waarom de agentic turn de straal van die kloof vergroot.

2. Fundamentele modellen versus domeinspecifieke inferentie - een structurele analyse

Distributieverschuiving, vertekening van het basistarief en het probleem van stille substitutie. Hoe de samenstelling van trainingsgegevens het standaardgedrag bepaalt, waarom prompting en RLHF geen distributievoorkeuren aan de staart oplossen, en wat een Specialised Layer-strategie op een 14B-parameter model biedt (en opoffert) in vergelijking met frontier-systemen - inclusief de action-containment eigenschap die bounded inference biedt zodra AI handelt in plaats van antwoordt.

3. Waarom Trainingstijdbeheer faalt - Architecturale beperkingen als alternatief

Het 27027 incident als casestudy van falende afstemming: een AI-systeem dat stilletjes therapeutische taal vervangt door theologische taal ondanks expliciete instructies. Waarom fijnafstemming, RLHF en constitutionele AI deze klasse van problemen niet oplossen. Guardian Agents als epistemische scheiding - verificatiesystemen die structureel onafhankelijk zijn van het model dat ze controleren.

4. What Is Live in Production - An Unvarnished Inventory

Het werkelijke systeem: een 14B Qwen2 basismodel met verfijning per producttype van de gespecialiseerde laag, zelf gehoste GPU-inferentie met CPU fallback, cosine-similariteitsverificatie tegen brondocumenten, vier Guardian Agent lagen, een adaptieve feedbacklus en een enkel begrensd agentoppervlak (feedbackresolutie). Wat werkt, wat nog onbewezen is en waar we ons bewust zijn van beperkingen.

5. Voorbij het model - Platformarchitectuur en bestuurlijke integratie](05_village_beyond_ai.md)

AI als één component binnen een soeverein gemeenschapsplatform. Hoe de architecturale beperkingen verder reiken dan het model, naar data-isolatie, toestemmingsarchitectuur, woordenschat-gedreven framing en gefedereerd intercommunautair bestuur. Wat deze benadering opoffert aan vermogen en wat het oplevert aan controleerbaarheid.

Voor wie is dit

Deze artikelen zijn geschreven voor onderzoekers die werken aan AI-afstemming, veiligheid, interpreteerbaarheid en governance. Er wordt uitgegaan van bekendheid met transformatorarchitecturen, fijnafstemmingsmethoden, leren van menselijke feedback en de huidige afstemmingsliteratuur.

De bijdrage is niet theoretisch. Het is een beschrijving van een geïmplementeerd systeem - operationeel sinds oktober 2025 - dat het afstemmingsprobleem op een andere manier benadert: architecturale beperking op het moment van inferentie in plaats van afstemming door training. De aanpak is jong, werkt op bescheiden schaal en is nog niet onafhankelijk geëvalueerd. We presenteren het als een case study, niet als een oplossing.

We zijn openhartig over beperkingen. Een 14B-parametermodel met domeinspecialisatie kan niet tippen aan grensverleggende systemen op het gebied van algemene capaciteit. De Guardian Agent architectuur voegt latentie toe. De verificatie van de cosinusovereenkomst is afhankelijk van de kwaliteit en dekking van het corpus brondocumenten. Dit zijn echte afwegingen en we bespreken ze overal.

Verder lezen

Serie: Architecturaal AI-bestuur op communautaire schaal - Een technisch onderzoek van Village AI Auteur: My Digital Sovereignty Ltd Datum: Juni 2026 Licentie: CC BY 4.0 International