Tier 3 · Guard & build3.322 min

Entwickeln mit Claude Code – zwei Agenten

A country road curving past an old woolshed under a green hillside at golden hour

Bis jetzt haben wir alles darauf ausgerichtet, dich darauf vorzubereiten, einen davon zu erstellen, ohne dabei jemanden zu verletzen – dich selbst eingeschlossen. Jetzt geht es ans Erstellen. Zwei Agenten, und der zweite ist nicht das, was du erwarten würdest: Du erstellst einen, der funktioniert, und einen, der scheitert. Das Scheitern ist die Lektion.

Wenn du „Arbeiten mit Claude“ absolviert hast, bist du dort auf Claude Code gestoßen – die Version von Claude, die deine Dateien lesen, Tools ausführen und eine Aufgabe von Anfang bis Ende auf deinem eigenen Rechner erledigen kann. Genau darauf zielen wir mit einem Auftrag ab. Du musst kein Programmierer sein; du musst in der Lage sein, einen Auftrag klar zu beschreiben und die Disziplin aus den letzten fünf Lektionen beizubehalten. Das ist Anker 1 – lerne, indem du es einmal in kleinem Maßstab umsetzt.

Erstellen Sie A – einen guten Agenten, von Anfang bis Ende (das übertragbare Muster)

Wir erstellen einen Abgleich-Checker: einen Agenten, der einen Stapel Rechnungen und einen Kontoauszug liest und diejenigen markiert, die nicht übereinstimmen. Die Wahl fiel bewusst darauf – wenn man es durch die Tier-1-Triage laufen lässt, landet es nahtlos im Agenten-Bereich: eine Regel, die man aufschreiben kann, leicht rückgängig zu machen ist, ein Fehler, der niemanden besonders trifft, und deine eigenen Zahlen statt der Daten anderer. Das ist kein Zufall; genau so solltest du dein erstes echtes Projekt auswählen.

Bauen Sie es in der Reihenfolge auf, die im Kurs vermittelt wurde, denn diese Reihenfolge ist das übertragbare Muster:

Legen Sie den Wirkungsbereich fest (2.1). Schreibgeschützt. Es sieht einen Ordner mit Rechnungen und eine Kontoauszugsdatei. Es kann nichts schreiben, versenden, bezahlen oder auf etwas anderes zugreifen. Das Schlimmste, was passieren kann, ist, dass eine Zeile fälschlicherweise markiert wird, und das werden Sie bemerken.
Schreibe die Kriterien auf, nicht das Bauchgefühl (2.3). Die Abgleichsregel, explizit: Was gilt als Übereinstimmung, welche Toleranz gilt, was ist eine Ausnahme. Der Agent gibt die gefundenen Abweichungen und deren Gründe zurück – Beweise – und nicht „die Bücher sehen in Ordnung aus“.
Schreiben Sie die Sicherheitsvorkehrungen fest (3.1). Es kennzeichnet das, worbei es unsicher ist, anstatt zu raten. Es errät niemals eine Zahl. Es hält bei allem an, was die Maschine verlassen würde – hier gibt es nichts zu senden, und genau darum geht es bei einer ersten Version.
Testen Sie es (3.2). Überprüfen Sie stichprobenartig eine Auswahl anhand der Quelle. Geben Sie ihm eine absichtlich fehlerhafte Anweisung ein und vergewissern Sie sich, dass es den Fehler erkennt. Vertrauen Sie ihm, weil es bestanden hat, nicht weil Sie es erstellt haben.

Das ist ein vollständiger, nützlicher und sicherer Agent – und seine Struktur lässt sich direkt auf den nächsten übertragen, den Sie erstellen. (Wenn dein Engpass der Posteingang und nicht die Bücher ist, lassen sich mit denselben vier Schritten ein Assistentzur Posteingangs-Triage erstellen, der sortiert und Entwürfe erstellt, aber niemals etwas versendet – beachte nur, dass er nun auf die Daten anderer Personen zugreift, sodass die Datenfrage aus Stufe 1 an erster Stelle steht.)

Entwicklung B – der Recruiter, entwickelt, um zu beobachten, wie er versagt

Nun zum unangenehmen Fall. Wir entwickeln den „Redact-then-Score“- Recruiter – den Agenten, von dem die bequemen Ratschläge sagen, er sei in Ordnung: Namen entfernen, bewerten lassen, am Ende einen Menschen einbeziehen. Wir entwickeln ihn speziell, damit Sie mit eigenen Augen sehen können, wie dieser Ratschlag in Ihren eigenen Händen zerbricht.

Erstellen Sie den „Redact-then-Score“-Agenten. Er nimmt Bewerbungen entgegen, schwärzt die offensichtlichen Identitätsfelder – Name, Alter, Foto, Adresse – und bewertet den Rest anhand von Kriterien. Genau das „sichere KI- Screening“, das Ihnen ein Anbieter verkaufen würde.
Führen Sie den Namensaustausch-Test darauf durch (3.2). Nehmen Sie einen Antrag. Bewerten Sie ihn. Ändern Sie nun nur den Namen – sonst nichts – und bewerten Sie ihn erneut. Wiederholen Sie das dann für einen ganzen Stapel: Tauschen Sie Geschlechter aus, tauschen Sie Namen mit offensichtlich unterschiedlicher Herkunft aus, halten Sie alles andere konstant.
Beobachten Sie, was passiert. Die Bewertung verschiebt sich. Sie verschiebt sich, weil das Modell die Identität anhand der Indikatoren rekonstruiert, die Sie nicht geschwärzt haben – die Schule, die Adresse, die Lücken, die Formulierung –, genau wie Tier 2 gewarnt hat. Sie haben den Namen geschwärzt, und die Verzerrung schlich sich über die Postleitzahl ein.
Nun lass die eigentliche Lektion auf dich wirken. Du hast alles getan, was dir die bequeme Variante vorgeschrieben hat. Du hast Daten unkenntlich gemacht. Du hast am Ende einen Menschen im Spiel gelassen. Und dein eigener Test hat gerade gezeigt, dass das Modell aufgrund der Identität verzerrt ist, von der du dachtest, du hättest sie entfernt. Hier verdient sich ein Agent-Entwickler sein Geld: Du lernst, Nein zu sagen. Bei einer Entscheidung mit hohen Risiken über eine Person, bei der die Korrekturen durchscheinen und der Test verzerrt ausfällt, ist die disziplinierte Antwort ein eng gefasster, nicht auf Ranglisten basierender, von Menschen entschiedener Prozess – oder die Entscheidung gar nicht zu automatisieren.

Das Ziel von Build B war nie ein funktionierender CV-Ranker. Es ist die Einsicht, sich zurückzuziehen – das Wertvollste, was dir dieser Kurs vermitteln kann, und das, was du erst glauben wirst, wenn du selbst gesehen hast, wie es auf deinem eigenen Bildschirm scheitert.

Was du tatsächlich erstellt hast

Zwei Muster, die du in der gesamten Galerie wiederverwenden kannst: den sicheren Ansatz (Umfang → Kriterien → Leitplanken → Test) für Aufgaben, die in den Zuständigkeitsbereich eines Agenten fallen, und den ehrlichen Stopp für Aufgaben, die dazu nicht gehören – ganz gleich, wie leistungsfähig das Tool auch werden mag. Beide sind dieselbe Disziplin, die in entgegengesetzte Richtungen weist – und für beide musst du die Verantwortung übernehmen.

Nach welchem Aufbau würdest du zuerst greifen – und sei ehrlich, warum? Wenn es der Personalvermittler ist, weil es am meisten Zeit sparen würde, ist das genau der Anreiz, den diese Lektion überprüfen soll.

Weiter

kannst du eine auf einem öffentlichen Tool erstellen. Die letzte Lektion dieser Stufe stellt eine schärfere Frage: Auf wessen Computer läuft sie, und welchen Gesetzen unterliegen die Daten? Die souveräne Option.

Kostenlos und in gutem Glauben geteilt. Wenn es für dich von Nutzen war, ist ein koha zur Deckung der Entwicklungs- und Betriebskosten herzlich willkommen.

koha hinterlassen →

← 3.2 3.4 →