🤖 AI Research Edition

Landing

Deutsch

Architectural AI Governance at Community Scale - A Technical Examination of Village AI

Für AI/ML-Forscher und Sicherheitsforscher


Eine fünfteilige technische Serie, die einen alternativen Ansatz zur KI-Anpassung untersucht: architektonische Einschränkungen zum Zeitpunkt der Inferenz anstelle von Anpassung durch Training. Geschrieben für Forscher, die mit RLHF, konstitutioneller KI, mechanistischer Interpretierbarkeit und der breiteren Alignment-Literatur vertraut sind.


Die Serie

1. Was KI ist - und wo das Ausrichtungsproblem tatsächlich liegt

Emergentes Denken, Skalierungsgesetze und die Unterscheidung zwischen Fähigkeit und Beherrschbarkeit - jetzt verschärft durch die 2024-2026-Verschiebung von Chatbots zu Agenten (Fähigkeit vs. Produktisierung) und durch die Ergebnisse der Gedankenketten-Untreue, die die CoT-basierte Aufsicht einschränken. Warum sich das Ausrichtungsproblem, wie es von eingesetzten Community-Systemen erlebt wird, von dem Ausrichtungsproblem, wie es im Labor untersucht wird, unterscheidet - und warum die agentenbasierte Wende den Explosionsradius dieser Kluft vergrößert.

2. Basismodelle vs. domänenspezialisierte Inferenz - eine strukturelle Analyse

Verteilungsverschiebung, Basisratenverzerrung und das Problem der stillen Substitution. Wie die Zusammensetzung der Trainingsdaten das Standardverhalten bestimmt, warum Prompting und RLHF die Verteilungsprioritäten am Ende nicht auflösen und was eine Specialised-Layer-Strategie auf einem 14B-Parameter-Modell im Vergleich zu Frontier-Systemen bietet (und opfert) - einschließlich der Action-Containment-Eigenschaft, die Bounded Inference bietet, sobald KI agiert statt zu antworten.

3. Warum Governance in der Trainingszeit scheitert - Architektonische Einschränkungen als Alternative

Der 27027-Vorfall als Fallstudie für das Scheitern der Anpassung: ein KI-System, das trotz ausdrücklicher Anweisungen stillschweigend die therapeutische Sprache durch die theologische Sprache ersetzt. Warum Feinabstimmung, RLHF und konstitutionelle KI diese Art von Problemen nicht lösen. Guardian Agents als epistemische Trennung - Verifikationssysteme, die strukturell unabhängig von dem Modell sind, das sie überwachen.

4. Was ist Live in der Produktion - eine ungeschminkte Bestandsaufnahme

Das aktuelle System: ein 14B Qwen2 Basismodell mit Feinabstimmung pro Produkttyp der spezialisierten Schicht, selbstgehostete GPU-Inferenz mit CPU-Fallback, Kosinus-Ähnlichkeitsprüfung gegen Quelldokumente, vier Guardian Agent Schichten, eine adaptive Feedback-Schleife und eine einzige begrenzte Agentenoberfläche (Feedback-Auflösung). Was funktioniert, was unbewiesen bleibt und wo wir uns der Grenzen bewusst sind.

5. Jenseits des Modells - Plattformarchitektur und Governance-Integration

KI als eine Komponente innerhalb einer souveränen Gemeinschaftsplattform. Wie sich architektonische Einschränkungen über das Modell hinaus auf die Datenisolierung, die Zustimmungsarchitektur, das vokabulargesteuerte Framing und die föderierte gemeinschaftsübergreifende Governance erstrecken. Was dieser Ansatz an Fähigkeiten einbüßt und was er an Verifizierbarkeit gewinnt.


Für wen ist das?

Diese Artikel richten sich an Forscher, die sich mit KI-Alignment, Sicherheit, Interpretierbarkeit und Governance beschäftigen. Vorausgesetzt wird die Vertrautheit mit Transformator-Architekturen, Feinabstimmungsmethoden, Verstärkungslernen aus menschlichem Feedback und der aktuellen Literatur zum Thema Alignment.

Der Beitrag ist nicht theoretisch. Es handelt sich um die Beschreibung eines installierten Systems, das seit Oktober 2025 in Betrieb ist und einen anderen Ansatz für das Ausrichtungsproblem verfolgt: architektonische Beschränkungen zum Zeitpunkt der Inferenz anstelle von Ausrichtung durch Training. Der Ansatz ist noch jung, arbeitet in bescheidenem Umfang und wurde noch nicht unabhängig evaluiert. Wir präsentieren ihn als Fallstudie, nicht als Lösung.

Wir sind offen für Einschränkungen. Ein Modell mit 14B-Parametern und einer Spezialisierung auf einen bestimmten Bereich kann nicht mit den allgemeinen Fähigkeiten von Frontier-Systemen mithalten. Die Guardian Agent Architektur erhöht die Latenzzeit. Die Kosinus-Ähnlichkeitsprüfung hängt von der Qualität und dem Umfang des Quelldokumentkorpus ab. Dies sind echte Kompromisse, die wir im Folgenden erörtern.

Weitere Lektüre


Serie: Architektonische KI-Governance im Gemeinschaftsmaßstab - Eine technische Untersuchung von Village AI Autor: My Digital Sovereignty Ltd Datum: Juni 2026 Lizenz: CC BY 4.0 International

Published under CC BY 4.0 by My Digital Sovereignty Ltd. You are free to share and adapt this material, provided you give appropriate credit.