Paperclip: KI-Unternehmen ohne menschliches Zutun orchestrieren
Ich hatte nicht vor, über Paperclip zu schreiben. Ich hatte gesehen, wie es auf GitHub trendete, beobachtet, wie die Sternanzahl in weniger als drei Wochen die 24.000 überschritt, und es unter "interessant, aber wahrscheinlich überbewertet" abgelegt. Noch ein Agent-Orchestrierungstool. Noch ein Dashboard zur Bot-Verwaltung. Ich hatte meine eigenen Multi-Agent-Systeme mit Claude Code gebaut, und sie funktionierten. Warum wechseln?
Dann schickte mir ein Freund einen Screenshot seines Paperclip-Dashboards. Er hatte einen CEO-Agenten auf Claude Opus, zwei Ingenieur-Agenten auf Cursor Coder, einen QA-Agenten, der seine Staging-Umgebung durchsuchte, und einen Content-Strategen, der Blogbeiträge entwarf -- alles innerhalb einer Unternehmensstruktur mit Organigramm, Budgetgrenzen und Aufgabenverfolgung. Kein Mensch hatte das Projekt seit 36 Stunden angefasst.
Die Agenten hatten nicht nur ihre Aufgaben erledigt. Sie hatten neue erstellt. Der CEO hatte eine Lücke in der Marketing-Roadmap identifiziert und ein Issue eröffnet. Der Ingenieur hatte es aufgegriffen, den Umfang festgelegt und mit dem Programmieren begonnen. Der QA-Agent hatte den Pull Request überprüft und zwei Bugs markiert. All das geschah, während mein Freund schlief.
Ich schloss mein eigenes Projekt, öffnete das Paperclip-Repository und begann zu lesen.
Warum Agentenorchestration ein anderes Denkmodell brauchte
Hier ist das Problem, auf das ich bei meinen eigenen Multi-Agent-Setups immer wieder stieß: Ich war der Flaschenhals. Ich startete Agenten, wies Aufgaben zu, überwachte den Fortschritt, prüfte die Ergebnisse, verteilte Arbeit neu, wenn etwas fehlschlug. Mein "autonomes" System brauchte mich an jeder Stelle. Ich schrieb über genau diese Frustration in meinem Artikel darüber, wie OpenClaw-Agenten Mitarbeiter ersetzen, nicht Aufgaben -- der Unterschied zwischen einem Agenten eine Aufgabe geben und ihm einen Job geben.
Paperclip greift diese Unterscheidung auf und treibt sie weiter. Viel weiter.
Die meisten Agent-Orchestrierungstools behandeln KI wie eine Sammlung freier Mitarbeiter. Man engagiert sie für einen Auftrag, definiert den Umfang, wartet auf die Lieferung und verwaltet die Übergabe selbst. Paperclip behandelt KI-Agenten wie Angestellte in einem Unternehmen. Sie haben Rollen. Sie berichten einander. Sie arbeiten innerhalb von Budgets. Sie befolgen Governance-Regeln. Und entscheidend: Sie erstellen und weisen einander Arbeit zu, ohne darauf zu warten, dass ein Mensch die Interaktion vermittelt.
Der Wandel ist nicht inkrementell. Er ist architektonisch. Statt Aufgaben zu orchestrieren, orchestriert Paperclip eine Organisation. Der Unterschied klingt semantisch, bis man es laufen sieht. Dann trifft es einen -- das ist die Schicht, die bei jedem Agent-Framework gefehlt hat, das ich benutzt habe.
2025 war das Jahr des KI-Mitarbeiters. 2026 entwickelt sich zum Jahr des KI-Unternehmens. Und Paperclip ist der klarste Ausdruck dieses Wandels, den ich bisher gesehen habe.
Was Paperclip tatsächlich ist (unter der Haube)
Lässt man die Marketing-Sprache weg, ist Paperclip ein Node.js-Server gekoppelt mit einer React-Benutzeroberfläche. Es läuft lokal auf Ihrem Rechner, verbindet sich mit den KI-Modellen, für die Sie bereits bezahlen, und bietet das Gerüst, um diese Modelle zu einem funktionierenden Unternehmen zu organisieren.
Die technische Architektur ist sauber. PostgreSQL übernimmt die Persistenz -- und hier kommt der nette Teil -- es wird mit einer eingebetteten Datenbank ausgeliefert, sodass Sie beim ersten Start nichts konfigurieren müssen. Der API-Server startet unter http://localhost:3100, und der Setup-Assistent führt Sie durch Authentifizierung und die erste Unternehmensgründung. Vom Kaltstart bis zum laufenden Dashboard hatte ich es in unter zehn Minuten am Laufen.
Aber die Architekturentscheidungen, die wirklich zählen, betreffen nicht den Tech-Stack. Sie betreffen die organisatorischen Grundbausteine, die Paperclip einführt.
Organigramme sind real, nicht metaphorisch. Wenn Sie einen CEO-Agenten erstellen, sitzt er tatsächlich an der Spitze einer Hierarchie. Wenn dieser CEO einen Ingenieur "einstellt", berichtet der Ingenieur an den CEO. Delegation fließt in diesem Diagramm auf und ab. Der CEO kann Aufgaben erstellen und nach unten delegieren. Ingenieure können Probleme nach oben eskalieren. Das ist nicht nur visuelle Spielerei -- es bestimmt, wie Information und Autorität durch Ihr KI-Unternehmen fließen.
Budgetdurchsetzung ist atomar. Jeder Agent erhält ein Monatsbudget. Wenn er das Limit erreicht, stoppt er. Sofort. Keine außer Kontrolle geratenen API-Kosten um 3 Uhr nachts. Sie erhalten eine sanfte Warnung bei 80 % Auslastung und eine automatische Pause bei 100 %. Nachdem ich in meinem ersten Monat mit autonomen Agenten $847 verbrannt hatte (ich habe diese schmerzhafte Lektion in meinem Leitfaden zur KI-Agent-Kostenoptimierung dokumentiert), fühlen sich eingebaute Budgetkontrollen weniger wie ein Feature und mehr wie eine Notwendigkeit an.
Aufgabenverwaltung basiert auf Issues. Arbeit wird über ein Issue-basiertes System verfolgt, das sich sofort vertraut anfühlt, wenn Sie Linear oder GitHub Issues benutzt haben. Agenten erstellen Issues, nehmen sie auf, aktualisieren ihren Status und schließen sie ab. Jede Aktion, jeder ausgegebene Dollar, jede Entscheidung wird protokolliert. Der Audit-Trail ist lückenlos.
Heartbeat-Planung hält Agenten am Leben. Agenten laufen nicht einmal und verschwinden dann. Sie erwachen nach einem Zeitplan, prüfen ihre Arbeitswarteschlange und handeln. Das ist das Element, das Agenten von Werkzeugen, die man aufruft, in Mitarbeiter verwandelt, die zur Arbeit erscheinen. Kein Babysitting nötig -- obwohl Sie das Dashboard absolut in Echtzeit beobachten können, wenn Sie möchten (und das werden Sie, zumindest die ersten Male, weil es wirklich faszinierend ist).
Die Bring-Your-Own-Bot-Philosophie
Hier trifft Paperclip eine Entscheidung, die meiner Meinung nach über sein langfristiges Überleben entscheidet: Es bindet Sie an keinen bestimmten KI-Anbieter.
Ihre Agenten können Claude Code-Sitzungen sein, OpenClaw-Bots, Cursor-Instanzen, Python-Skripte, Shell-Befehle oder HTTP-Webhooks. Alles, was ein Heartbeat-Signal empfangen und auf eine Aufgabe reagieren kann, funktioniert. Das bedeutet, Sie können Claude Opus für strategisches Denken, GPT-5 für spezifische Programmieraufgaben und ein leichtgewichtiges Open-Source-Modell für routinemäßige Statusprüfungen mischen -- alles innerhalb derselben Unternehmensstruktur.
Ich plädiere seit Monaten für diesen Model-Mixing-Ansatz. In meinem Artikel über Agent-Swarm-Architektur habe ich darüber gesprochen, wie verschiedene Aufgaben unterschiedliche Intelligenzniveaus erfordern. Paperclip baut dieses Prinzip in sein Kerndesign ein. Ihr CEO läuft vielleicht auf Opus, weil strategische Entscheidungen tiefes Nachdenken erfordern. Ihr QA-Agent läuft vielleicht auf Claude Browser, weil er Webseiten visuell inspizieren muss. Ihr routinemäßiger Monitoring-Agent läuft vielleicht auf einem lokalen Modell, weil er Heartbeats prüft und keine neuartigen Probleme löst.
Das praktische Ergebnis? Ich betrieb ein Testunternehmen mit fünf Agenten bei drei verschiedenen KI-Anbietern, und die täglichen Gesamtkosten lagen unter $4. Der CEO (Opus) verbrauchte etwa 15 % des gesamten Token-Verbrauchs, traf aber die wirkungsvollsten Entscheidungen. Die Ingenieure (Cursor Coder) verbrauchten den Großteil der Tokens, aber zu niedrigeren Kosten pro Token. Der QA-Agent (Claude Browser) führte intermittierende Prüfungen durch, die kaum im Budget auffielen.
Das ist keine Theorie. Das ist, was mir das Dashboard nach 48 Stunden vollautonomen Betriebs zeigte.
"Moola" bauen: Ein realer Workflow Schritt für Schritt
Theorie ist einfach. Umsetzung ist, wo es interessant wird -- und wo Dinge schiefgehen.
Ich folgte dem von Paperclip empfohlenen Workflow, um eine einfache Finanz-Tracking-App namens "Moola" zu bauen. Hier ist, was passierte, Schritt für Schritt, einschließlich der Teile, die nicht reibungslos liefen.
Schritt 1: Unternehmen definieren. Man beginnt damit, ein Unternehmen in Paperclip zu erstellen und übergeordnete Ziele festzulegen. Ich formulierte drei Ziele: einen MVP-Finanztracker mit Ausgabenkategorisierung bauen, ihn in einer Staging-Umgebung deployen und eine Landingpage generieren. Einfach genug.
Schritt 2: Den CEO einstellen. Der erste Agent, den Sie erstellen, fungiert als CEO. Ich wies Claude Opus zu, gab ihm die Unternehmensziele und stellte seine Persona auf methodisch und qualitätsorientiert ein. Das Persona-System ist wichtiger, als man erwarten würde -- dazu komme ich gleich.
Schritt 3: Dem CEO bei der Arbeit zusehen. Hier wurde es interessant. Innerhalb von Minuten analysierte der CEO-Agent die Ziele, teilte sie in einen Einstellungsplan und eine technische Roadmap auf und erstellte sein erstes Issue: "Gründungsingenieur einstellen." Er wartete nicht darauf, dass ich ihm sagte, was als Nächstes zu tun sei. Er identifizierte, was das Unternehmen brauchte, und handelte.
Schritt 4: Der CEO stellt einen Ingenieur ein. Der CEO erstellte einen neuen Agenten -- einen Gründungsingenieur auf Cursor Coder -- und wies ihm die erste Charge technischer Aufgaben zu. Das Onboarding des Ingenieurs geschah über seine Persona-Datei und die zugewiesenen Issues. Kein Prompt von mir. Der CEO schrieb die Stellenbeschreibung und die anfängliche Aufgabenliste des Ingenieurs.
Schritt 5: Aufgaben beginnen zu fließen. Der Ingenieur zerlegte die Roadmap des CEO in einzelne Issues: Datenbankschema aufsetzen, Eingabeformular für Ausgaben bauen, Kategorisierungslogik erstellen, Dashboard-Ansicht implementieren. Jedes Issue erhielt einen Status, eine Priorität und eine Abhängigkeitskette. Der Ingenieur arbeitete sie der Reihe nach ab und aktualisierte dabei den Status.
Schritt 6: QA kommt ins Spiel. Nachdem die ersten drei Features fertig waren, erstellte ich manuell einen QA-Agenten (Sie können auch den CEO damit beauftragen). Der QA-Agent überprüfte die Arbeit des Ingenieurs, eröffnete zwei Fehlerberichte, und der Ingenieur nahm sie ohne jegliches menschliches Eingreifen auf.
Der gesamte Zyklus -- von der Unternehmensgründung bis zu einem funktionierenden MVP mit vier abgeschlossenen Features und zwei Bugfixes -- dauerte etwa sechs Stunden Echtzeit. Ich schaute dreimal rein. Zweimal aus Neugier, einmal wegen einer Budget-Warnbenachrichtigung.
Hier ist der Teil, den niemand erwähnt: Der erste Versuch schlug fehl.
Wo Paperclip versagt (und wie man es behebt)
Mein erster Durchlauf scheiterte spektakulär. Der CEO-Agent formulierte vage Ziele, die der Ingenieur nicht verarbeiten konnte. Der Ingenieur erstellte Aufgaben, die sich überschnitten. Zwei Issues beschrieben am Ende dasselbe Feature in leicht unterschiedlicher Sprache, und der Agent versuchte beide umzusetzen, was zu doppeltem Code führte.
Die Ursache war Gedächtnis -- oder dessen Fehlen.
Die Macher von Paperclip beschreiben das wunderbar mit einer Referenz an den Film Memento: KI-Agenten sind fähig, aber vergesslich. Sie können exzellenten Code schreiben, ausgeklügelte Architekturen planen und über komplexe Probleme nachdenken. Aber ohne explizite Gedächtnissysteme verlieren sie ihre Identität und ihren Kontext zwischen den Heartbeats. Sie erwachen, prüfen ihre Warteschlange und starten von vorn. Jedes Mal.
Paperclip begegnet dem mit Persona-Dateien und Gedächtniskontexten. Jeder Agent erhält eine persistente Persona, die ihm sagt, wer er ist, wofür er verantwortlich ist, was er tun soll und was nicht, und welche Werte das Unternehmen hat. Das ist nicht nur ein System-Prompt -- es ist ein Identitätsdokument, das über Sitzungen hinweg bestehen bleibt.
Bei meinem zweiten Versuch verbrachte ich zwanzig Minuten damit, detaillierte Personas zu schreiben. Der CEO erhielt explizite Anweisungen, wie Ziele zu kommunizieren sind (spezifische Akzeptanzkriterien, keine Mehrdeutigkeit). Der Ingenieur bekam Vorgaben zur Code-Organisation und Namenskonventionen. Der QA-Agent erhielt eine Prüf-Checkliste.
Der Unterschied war wie Tag und Nacht. Klare Personas erzeugten klare Kommunikation, was zu sauberen Aufgabenübergaben führte, was funktionierende Software ergab.
Die Lektion gilt über Paperclip hinaus: Wenn Sie ein Multi-Agent-System betreiben und inkonsistente Ergebnisse erhalten, liegt das Problem fast nie an der Fähigkeit der KI. Es liegt am Kontext, den Sie ihr zuführen. Ich habe dieses Muster wiederholt in meiner Arbeit mit Claude Code Agent Skills beobachtet -- Agenten leisten dramatisch mehr, wenn sie strukturiertes Wissen über ihre Rolle und Einschränkungen haben.
Das Gedächtnisproblem ist real (und nur teilweise gelöst)
Lassen Sie mich ehrlich über etwas sein, worüber die meiste Paperclip-Berichterstattung hinweggeht: Das Gedächtnissystem funktioniert, aber es ist keine Magie.
Agenten behalten den Kontext innerhalb einer Sitzung durch ihre Persona-Dateien und das Issue-basierte Aufgabensystem. Zwischen Heartbeats können sie auf das Getane referenzieren, indem sie geschlossene Issues und ihr eigenes Aktivitätsprotokoll lesen. Aber sie "erinnern" sich nicht wirklich so, wie es ein menschlicher Mitarbeiter tun würde.
Ein Ingenieur-Agent, der vier Stunden mit dem Debuggen einer kniffligen Datenbankmigration verbracht hat, wird nicht instinktiv dieselbe Falle beim nächsten Mal vermeiden. Er muss die Issue-Historie erneut lesen, die Codebase erneut analysieren und möglicherweise dieselbe Lösung erneut entdecken. Das Gedächtnis ist extern (in Issues und Logs gespeichert) statt verinnerlicht.
Das ist bei lang laufenden Projekten relevant. Über Tage und Wochen wächst die Issue-Historie. Agenten müssen mehr Kontext lesen, um ihren aktuellen Stand zu verstehen. Token-Kosten für das Laden von Kontext steigen. Ab einem bestimmten Punkt erreicht man eine praktische Obergrenze, an der die angesammelte Historie zu teuer oder zu umfangreich wird, um sie effizient zu verarbeiten.
Ich erreichte diesen Punkt um Tag vier meines Tests. Der Ingenieur-Agent verwendete 30 % seines Token-Budgets allein dafür, frühere Issues zu lesen, um den aktuellen Zustand der Codebase zu verstehen. Die Lösung? Periodische "Kontextzusammenfassungen" -- ich ließ den CEO ein neues Issue erstellen, das den aktuellen Projektstand zusammenfasste und ältere Issues als archiviert markierte. Betrachten Sie es als organisatorisches Gedächtnismanagement. Nicht elegant, aber funktional.
Das Paperclip-Team arbeitet an besseren Artefaktverwaltungs- und Evaluierungstools, um dies anzugehen. Die Roadmap umfasst Features zur Verfolgung der Agentenleistung über die Zeit und zur Reduzierung des Overheads durch historischen Kontext. Aber heute, im März 2026, müssen Sie das selbst verwalten.
Skills, Clipmart und das modulare Agenten-Ökosystem
Eine der klügeren Designentscheidungen von Paperclip ist das Skill-System. Agenten sind nicht auf das beschränkt, was ihr Basismodell kann -- Sie können sie mit installierbaren Skills erweitern, die ihnen neue Fähigkeiten beibringen.
Skills funktionieren ähnlich wie skills.sh für Claude Code: strukturierte Instruktionsdateien, die Agenten domänenspezifisches Wissen und Workflows vermitteln. Ein Videobearbeitungs-Skill lehrt einen Agenten den Umgang mit Remotion. Ein Deployment-Skill lehrt ihn, auf Vercel oder AWS zu deployen. Ein Content-Strategie-Skill gibt ihm Frameworks für Redaktionsplanung.
Die aktuelle Skill-Quelle ist eine Kombination aus dem skills.sh-Marktplatz und Community-Beiträgen. Die SKILLS.md-Datei von Paperclip in jedem Projekt sagt Agenten, wie sie die benötigten Skills finden und laden können. Es ist ein durchdachtes Design, das Agenten selbstständig hält -- sie brauchen Sie nicht, um Skills manuell zu installieren, sie können finden, was sie brauchen.
Demnächst verfügbar (und das ist der Teil, der mich wirklich begeistert): Clipmart. Es ist ein Marktplatz, auf dem Sie komplette, vorgefertigte Unternehmensvorlagen herunterladen können. Content-Agenturen, Trading Desks, Entwicklungsbüros, Marketing-Teams -- vollständige Organisationsstrukturen mit vorkonfigurierten Agenten, Personas, Skills und Workflow-Vorlagen. Ein Klick, und Sie haben eine funktionsfähige KI-Unternehmensstruktur, maßgeschneidert für einen bestimmten Geschäftstyp.
Die Implikationen sind enorm. Stellen Sie sich vor, Sie laden eine "Spielestudio"-Vorlage herunter, die einen Kreativdirektor, zwei Ingenieure, einen Künstler-Agenten, einen QA-Tester und einen Community-Manager enthält. Geben Sie Ihre API-Keys ein, legen Sie Ihre Projektziele fest, und das Studio beginnt zu bauen. Das ist die Vision. Ob es in der Praxis funktioniert, muss sich zeigen, aber das architektonische Fundament ist solide.
Ein Wort der Vorsicht zu Skills: Die Installation von Drittanbieter-Skills bedeutet, Drittanbieter-Code im Kontext Ihres Agenten auszuführen. Paperclip führt gewisse Sicherheitsprüfungen durch, und die kuratierten Skills von skills.sh durchlaufen eine Überprüfung, aber das Risiko ist nicht null. Prüfen Sie Ihre Skills sorgfältig, besonders alles mit Dateisystem- oder Netzwerkzugriff. Das sage ich als jemand, der ausführlich über Sicherheitsrisiken autonomer Agenten geschrieben hat -- die Angriffsfläche modularer Agentensysteme ist real und wird unterschätzt.
Routinen: Das Feature, das es tatsächlich nützlich macht
Skills machen Agenten fähig. Routinen machen sie zuverlässig.
Eine Routine in Paperclip ist eine wiederkehrende Workflow-Vorlage. Sie definieren den Auslöser (zeitbasiert, ereignisbasiert oder manuell), die Abfolge der Schritte und welche Agenten jeden Schritt übernehmen. Dann läuft sie. Automatisch. Wiederholt. Ohne Sie.
Ein konkretes Beispiel, das ich eingerichtet habe: Jeden Morgen um 8 Uhr scannt ein Content-Strategie-Agent meine GitHub-Repositories nach neuen Commits, erstellt eine Zusammenfassung der Änderungen, formatiert sie als Discord-Nachricht und postet sie in meinem Teamkanal. Die Routine brauchte fünf Minuten zur Konfiguration. Sie läuft seither jeden Tag ohne einen einzigen Ausfall.
Eine weitere Routine: Jeden Freitag überprüft der QA-Agent alle in der Woche geöffneten Pull Requests, erstellt einen Qualitätsbericht und sendet ihn an den CEO-Agenten. Der CEO liest den Bericht und erstellt Issues für identifizierte Muster -- wiederkehrende Code Smells, fehlende Tests, Dokumentationslücken. Montagmorgen finden die Ingenieur-Agenten diese Issues in ihrer Warteschlange und beginnen sie zu bearbeiten.
Hier hört Paperclip auf, ein Spielzeug zu sein, und wird zur Infrastruktur. Einzelne Aufgabenerfüllung ist beeindruckend, aber isoliert. Routinen schaffen einen nachhaltigen operativen Rhythmus -- die Art vorhersehbarer, wiederkehrender Arbeit, die ein Unternehmen tatsächlich am Laufen hält.
Der Unterschied zwischen einer einmaligen KI-Aufgabe und einer Routine ist der Unterschied zwischen jemanden nach dem Weg fragen und einen Fahrer einstellen. Das eine löst das heutige Problem. Das andere beseitigt das morgige.
Governance und Genehmigungsschleusen: Menschen im Prozess behalten (wenn Sie möchten)
"Ohne Menschen" muss nicht "ohne Aufsicht" bedeuten.
Paperclip enthält eine Governance-Schicht, mit der Sie Genehmigungsschleusen an beliebiger Stelle im Workflow einfügen können. Möchten Sie jede Agenteneinstellung genehmigen, bevor sie erfolgt? Fügen Sie eine Genehmigungsschleuse hinzu. Möchten Sie Deployments freigeben, aber alles andere autonom laufen lassen? Konfigurieren Sie es so. Möchten Sie voll autonom agieren und das Dashboard nur einmal pro Woche prüfen? Auch das ist eine Option.
Das Governance-System arbeitet auf zwei Ebenen:
Agenten-Kontrollen legen fest, was ein einzelner Agent tun darf und was nicht. Sie können einem Ingenieur-Agenten das Erstellen neuer Agenten verbieten (nur der CEO kann einstellen). Sie können dem QA-Agenten verbieten, Code direkt zu ändern (er kann nur Issues eröffnen). Diese Einschränkungen werden durchgesetzt, nicht empfohlen -- das System lässt einen Agenten seine Berechtigungen nicht überschreiten.
Unternehmensrichtlinien definieren Regeln, die für die gesamte Organisation gelten. Konfigurationsänderungen werden versioniert, sodass Sie zurückrollen können, wenn ein Agent etwas ändert, das Ihnen nicht gefällt. Jede Aktion wird in einem vollständigen Audit-Trail protokolliert. Budgetgrenzen werden global durchgesetzt, nicht nur pro Agent.
Ich schätze dieses Design, weil es eine Wahrheit anerkennt, die die meisten "vollautonomen" Agent-Frameworks ignorieren: Vertrauen wird schrittweise aufgebaut. Wenn Sie zum ersten Mal ein KI-Unternehmen einrichten, wollen Sie strenge Kontrollen. Wenn Ihr Vertrauen in die Urteilsfähigkeit des Systems wächst, lockern Sie sie. Paperclip ermöglicht beides, ohne Ihren gesamten Workflow umgestalten zu müssen.
Mein aktuelles Setup läuft mit Genehmigungsschleusen für Agenteneinstellungen, Deployments und alle Ausgaben über $10 pro Aufgabe. Alles andere läuft autonom. Diese Balance fühlt sich für jetzt richtig an. In einem Monat werde ich sie wahrscheinlich weiter lockern.
Das organisatorische Import/Export-Muster
Allein dieses Feature könnte den Einrichtungsaufwand wert sein.
Paperclip ermöglicht den Export Ihrer gesamten Unternehmenskonfiguration -- Agenten, Personas, Skills, Routinen, Governance-Regeln, Organigramm -- als portables Paket. Sie können es teilen, versionieren und in eine neue Paperclip-Instanz importieren.
Die Community baut bereits darauf auf. Beliebte GitHub-Repos enthalten jetzt komplette KI-Unternehmenskonfigurationen, die Sie direkt importieren können. Ein Spielestudio-Setup. Eine Marketing-Agentur. Ein Content-Creation-Team. Ein SaaS-Entwicklungsbüro. Jede davon ist eine praxiserprobte Organisationsvorlage, erstellt von jemandem, der die Struktur so lange verfeinert hat, bis sie funktionierte.
Das Paperclip-Team nennt dies "Aqua-Hiring" -- statt einzelne Agenten einzustellen, übernehmen Sie ein ganzes bewährtes Team. Clevere Namensgebung und ein wirklich nützliches Muster. Statt Tage mit dem Konfigurieren von Agenten und dem Debuggen von Persona-Konflikten zu verbringen, importieren Sie eine funktionierende Struktur und passen sie an Ihre spezifischen Ziele an.
Ich importierte eine "Content-Agentur"-Vorlage zum Testen. Sie enthielt einen Content-Strategen, zwei Autor-Agenten, einen Lektor und einen Social-Media-Manager. Ich wechselte die KI-Modelle zu meinen bevorzugten Anbietern, aktualisierte die Unternehmensziele auf meine Blog-Themen und hatte alles innerhalb einer Stunde am Laufen. Die Qualität der Ergebnisse war überraschend gut -- besser als das, was ich von Grund auf gebaut hätte, weil der Vorlagenersteller die Koordinationsprobleme bereits gelöst hatte, auf die ich gestoßen wäre.
Dieses Muster -- Open-Source-Organisationsvorlagen für KI-Unternehmen -- ist etwas, wovon ich denke, dass wir es 2026 viel häufiger sehen werden. Es senkt die Einstiegshürde von "ein Multi-Agent-System von Grund auf bauen" zu "eine bewährte Vorlage anpassen." Das ist ein enormer Unterschied in der Zugänglichkeit.
Was Paperclip falsch macht (ehrliche Bewertung)
Ich bin aufrichtig beeindruckt, aber ich werde nicht so tun, als wäre dies ein fertiges Produkt. Hier bleibt Paperclip heute hinter den Erwartungen zurück.
Die Lokal-First-Anforderung ist eine Hürde. Paperclip zu betreiben bedeutet, einen Rechner eingeschaltet und verbunden zu halten. Wenn Ihr Laptop in den Ruhezustand geht, schläft Ihr KI-Unternehmen. Cloud-gehostete Lösungen stehen auf der Roadmap, sind aber noch nicht verfügbar. Für Solo-Entwickler, die experimentieren, ist lokal in Ordnung. Für jeden, der einen echten 24/7-Betrieb aufbauen will, ist das eine spürbare Einschränkung.
Das Onboarding ist rauer als nötig. Der Setup-Assistent funktioniert, aber das Konfigurieren von Agenten erfordert Verständnis von Persona-Dateien, Gedächtniskontexten und Heartbeat-Zeitplänen. Es gibt keinen geführten Ablauf für "Ich möchte einfach ein Team, das Web-Apps baut." Man muss die Grundbausteine verstehen, bevor man sie effektiv nutzen kann. Das 7-Tage-Tutorial auf paperclipai.info hilft, aber die Lernkurve ist steiler als nötig.
Agentenkommunikation ist noch primitiv. Agenten kommunizieren über Issues und Aufgabenzuweisungen, was funktioniert, aber Nuancen vermissen lässt. Ein CEO-Agent kann kein Gespräch mit einem Ingenieur-Agenten über eine Designentscheidung führen. Er kann nur ein Issue mit Anweisungen erstellen und auf das Ergebnis warten. Echte organisatorische Koordination erfordert reichhaltigere Kommunikationsmuster -- Diskussionsthreads, Feedback-Schleifen, Brainstorming-Sitzungen. Diese gibt es noch nicht.
Keine Einnahmen und ungewisse Nachhaltigkeit. Paperclip ist Open-Source, MIT-lizenziert und generiert derzeit null Einnahmen. Das Projekt wird vom Community-Momentum und den Ressourcen des Gründerteams getragen. GitHub-Stars bezahlen keine Serverrechnungen. Die langfristige Tragfähigkeit hängt davon ab, ein nachhaltiges Geschäftsmodell zu finden -- wahrscheinlich über Clipmart, Managed Hosting oder Enterprise-Features. Das ist eine reale Überlegung, wenn Sie daran denken, kritische Workflows darauf aufzubauen.
Qualität ist ohne intensive Persona-Arbeit inkonsistent. Ich komme immer wieder darauf zurück: Paperclip ist nur so gut wie die Personas und Ziele, die Sie definieren. Vage Ziele produzieren vage Ergebnisse. Das ist nicht einzigartig bei Paperclip -- jedes Agentensystem hat diese Eigenschaft -- aber die Unternehmensmetapher von Paperclip kann ein falsches Gefühl von "Einrichten und Vergessen" erzeugen, das die aktuelle Technologie nicht unterstützt.
Die strategische Wette: Warum diese Architektur bestehen könnte
Hier ist, was Paperclip meiner Meinung nach grundlegend richtig macht, und warum ich glaube, dass dieses Projekt (oder etwas sehr Ähnliches) noch lange nach dem aktuellen Hype-Zyklus relevant sein wird.
KI-Modelle werden schnell besser. GPT-5, Claude Opus, Gemini 3 -- alle paar Monate erscheint ein neues Modell, das die Fähigkeiten der vorherigen Generation überholt. Jedes Tool, das auf die Fähigkeiten eines bestimmten Modells setzt, hat eine kurze Haltbarkeit. Der Code, den Claude heute schreibt, wird von dem, was nächstes Quartal erscheint, besser geschrieben werden.
Paperclip setzt nicht auf Modellfähigkeiten. Es setzt auf Organisationsstruktur.
Unternehmen brauchen Ziele, Werte, Budgets, Rechenschaftspflicht und Governance, unabhängig davon, wie intelligent die einzelnen Mitarbeiter sind. Ein brillanter Ingenieur muss immer noch die Prioritäten des Unternehmens verstehen. Ein talentierter Marketingexperte muss immer noch im Budget bleiben. Diese organisatorischen Grundbausteine ändern sich nicht, wenn die zugrundeliegende KI intelligenter wird -- sie werden wertvoller, weil intelligentere Agenten bessere Koordination brauchen, nicht weniger.
Das ist die Erkenntnis, die Paperclip von den Dutzenden "Agent Framework"-Projekten unterscheidet, die ich evaluiert habe. Es versucht nicht, Agenten intelligenter zu machen. Es versucht, sie so zu verwalten, wie man jedes Team verwalten würde -- mit klaren Rollen, expliziten Erwartungen und Systemen der Rechenschaftspflicht.
Die Memento-Analogie des Paperclip-Teams ist treffend. KI-Agenten sind wie der Protagonist in dem Film: hochfähig, aber ständig den Kontext verlierend. Man behebt das nicht, indem man sie fähiger macht. Man behebt es, indem man ihnen ein organisatorisches Gerüst gibt, das ihre Einschränkungen kompensiert. Notizen an den Wänden. Fotos mit Anmerkungen. Ein System, das ihnen sagt, wer sie sind und was sie als Nächstes tun sollen, jedes Mal wenn sie aufwachen.
Das ist Paperclip. Kein besserer Agent. Ein besseres System zur Verwaltung von Agenten. Und Systeme überdauern jede einzelne Technologiegeneration.
Wer Paperclip nutzen sollte (und wer nicht)
Nutzen Sie Paperclip, wenn: Sie bereits mehrere KI-Agenten betreiben und mehr Zeit mit deren Koordination verbringen als von ihrer Arbeit zu profitieren. Wenn Sie an die Orchestrierungsgrenze gestoßen sind, die ich eingangs beschrieben habe -- Agenten funktionieren einzeln großartig, aber Sie sind der Klebstoff, der alles zusammenhält -- gibt Ihnen Paperclip die Struktur, sich selbst aus der Gleichung zu nehmen.
Nutzen Sie Paperclip, wenn: Sie ein Produkt bauen oder ein Nebenprojekt betreiben und ein kleines Team simulieren möchten. Ein CEO, ein Ingenieur und ein QA-Agent auf Autopilot können überraschend funktionale MVPs produzieren. Die Kosten sind ein Bruchteil dessen, was echte Freelancer kosten würden, und die Iterationsgeschwindigkeit ist unübertroffen.
Nutzen Sie Paperclip nicht, wenn: Sie einen einzelnen Agenten für eine einzelne Aufgabe brauchen. Wenn Ihr Anwendungsfall "Dokumente zusammenfassen" oder "Code schreiben, wenn ich frage" ist, ist Paperclip massiver Overkill. Man braucht kein Organigramm für einen einzelnen Mitarbeiter.
Nutzen Sie Paperclip nicht, wenn: Sie keine Zeit für Persona-Engineering aufwenden können. Das Label "ohne Menschen" ist ein Ziel. Im Moment ist der Einrichtungsaufwand real. Planen Sie mindestens einen Tag für Konfiguration und Iteration ein, bevor Ihr KI-Unternehmen nützliche Ergebnisse liefert.
Nutzen Sie Paperclip nicht, wenn: Sie garantierte Verfügbarkeit brauchen. Die Lokal-First-Architektur bedeutet, dass Ihr Unternehmen auf Ihrer Hardware läuft. Bis Cloud-Hosting verfügbar ist, ist es nicht für produktionskritische Workflows geeignet.
Mein Setup: Was ich gerade betreibe
Nach zwei Wochen Tests ist dies die Paperclip-Konfiguration, bei der ich gelandet bin:
Unternehmen: Content & Development Studio Agenten: 5 insgesamt
| Rolle | Modell | Budget/Monat | Hauptverantwortung |
|---|---|---|---|
| CEO | Claude Opus 4.6 | $15 | Zielsetzung, Agentenkoordination, Wochenplanung |
| Lead Engineer | Claude Code (Sonnet) | $25 | Feature-Entwicklung, Code-Architektur |
| QA Engineer | Claude Browser | $8 | Visuelles Testen, Bug-Reporting, PR-Review |
| Content-Stratege | Claude Opus 4.6 | $12 | Blog-Planung, Entwürfe, SEO-Analyse |
| DevOps | Shell Script Agent | $2 | Deployment, Monitoring, Statusprüfungen |
Monatliche Gesamtkosten: ~$62 (deutlich unter meiner Budgetobergrenze von $100)
Aktive Routinen:
- Täglich: GitHub-Commit-Zusammenfassung auf Discord gepostet
- Täglich: Content-Stratege prüft Trendthemen und schlägt Beiträge vor
- Wöchentlich: QA-Agent erstellt Qualitätsbericht; CEO erstellt Maßnahmen
- Wöchentlich: DevOps-Agent führt Staging-Deployment und Health Checks durch
Governance: Genehmigungsschleusen für neue Agenteneinstellungen und jede einzelne Aufgabe über $10. Alles andere läuft autonom.
Bisherige Ergebnisse: Zwei Blogbeiträge entworfen (einer brauchte leichte Überarbeitung, einer brauchte umfassende Revision), ein Bugfix-PR ohne menschlichen Input gemergt, und ein Landingpage-Grundgerüst, für das ich ein Wochenende gebraucht hätte.
Ersetzt es meinen Workflow? Noch nicht. Erweitert es ihn auf eine Weise, die drei bis vier Stunden pro Woche freisetzt? Absolut.
Was als Nächstes kommt
Paperclips Roadmap verrät, wo der Kopf des Teams steht:
Cloud-gehostetes Deployment wird die Lokal-First-Einschränkung beseitigen. Das ist das wichtigste fehlende Feature für den Produktionseinsatz. Kein Zeitplan angekündigt, aber die Nachfrage ist laut genug, dass ich es im zweiten Quartal 2026 erwarte.
CEO-Chat-Schnittstelle wird es ermöglichen, in natürlicher Sprache mit Ihrem KI-Unternehmen zu kommunizieren, statt manuell Issues zu erstellen. Stellen Sie sich einen Slack-Kanal vor, in dem Sie dem CEO schreiben und der CEO die Delegation übernimmt. Das ändert das Interaktionsmodell von "Konfigurieren und Beobachten" zu "Sprechen und Lenken."
Maximizer Mode wird es ermöglichen, Agentenbudgets für bestimmte Aufgaben aufzuheben, wenn Sie maximalen Durchsatz ungeachtet der Kosten wollen. Sprintmodus für Ihr KI-Unternehmen -- nützlich für Deadlines und Demos, gefährlich für Ihre Geldbörse, wenn dauerhaft aktiviert.
Bessere Evaluierungstools werden die Agentenleistung über die Zeit verfolgen und identifizieren, welche Agenten die beste Arbeit liefern, welche Aufgaben am längsten dauern und wo die Engpässe liegen. Leistungsbeurteilungen für KI-Mitarbeiter. Ich bin mir nicht sicher, ob ich das faszinierend oder beunruhigend finden soll.
Clipmart-Marktplatz für Unternehmensvorlagen und Skills wird die Einstiegshürde drastisch senken. Wenn das gut umgesetzt wird, geht das Einrichten eines KI-Unternehmens von "einem Tag Konfiguration" auf "zehn Minuten Anpassung."
Das große Ganze
Ich baue und schreibe seit über einem Jahr über KI-Agentensysteme. Ich habe beobachtet, wie das Ökosystem sich entwickelte -- von Einzelprompt-Interaktionen zu skill-basierten Agenten zu autonomen Agenten-Schwärmen. Paperclip repräsentiert den nächsten logischen Schritt: Agenten, die nicht nur in Schwärmen, sondern in Unternehmen organisiert sind.
Der Wandel ist bedeutsam, weil er KI-Fähigkeiten auf eine Struktur abbildet, die Menschen über Jahrhunderte optimiert haben. Wir wissen, wie Unternehmen funktionieren. Wir verstehen Delegation, Rechenschaftspflicht, Budgets, Qualitätskontrolle und Governance. Durch die Anwendung dieser bewährten organisatorischen Muster auf KI-Agenten macht Paperclip Multi-Agent-Systeme lesbar -- Sie können das Organigramm ansehen und verstehen, was passiert, ohne Token-Logs lesen zu müssen.
Wird jedes Unternehmen 2026 auf KI-Agenten laufen? Nein. Aber die Werkzeuge, um es möglich zu machen, sind innerhalb eines einzigen Quartals von theoretisch zu praktisch geworden. Paperclip, mit seinen 24.000+ GitHub-Stars, der MIT-Lizenz und der Bring-Your-Own-Bot-Philosophie, ist die zugänglichste Manifestation dieses Wandels, die heute verfügbar ist.
Die Frage ist nicht, ob KI-Unternehmen existieren werden. Sie existieren bereits -- Aaron Sneed betreibt 15 benutzerdefinierte GPT-Agenten als einen Rat, der ihm über 20 Stunden pro Woche spart, und er ist einer von vielen. Die Frage ist, ob Sie Ihr eigenes von Grund auf aufbauen oder mit einem Framework starten, das die organisatorische Komplexität für Sie übernimmt.
Ich weiß, welche Option ich wähle. Meine Paperclip-Instanz läuft noch. Der CEO hat gerade ein neues Issue eröffnet.
Häufig gestellte Fragen
Welche KI-Modelle unterstützt Paperclip?
Paperclip unterstützt jedes KI-Modell oder jeden Agenten, der ein Heartbeat-Signal empfangen kann -- Claude Code, OpenClaw, GPT, Cursor, Python-Skripte, Shell-Befehle oder HTTP-Webhooks. Sie bringen Ihre eigenen API-Keys mit und bezahlen direkt bei Ihren bestehenden Anbietern. Kein Vendor Lock-in.
Was kostet es, ein Paperclip-KI-Unternehmen zu betreiben?
Paperclip selbst ist kostenlos und Open-Source. Ihre Kosten entstehen durch die KI-Modelle, die Ihre Agenten nutzen. Ein Unternehmen mit fünf Agenten und gemischten Modellen (Opus für Strategie, Sonnet für Programmierung, leichtgewichtige Modelle für Monitoring) kann je nach Arbeitslast für $50-100 pro Monat betrieben werden. Eingebaute Budgetkontrollen verhindern unkontrollierte Ausgaben.
Ist Paperclip produktionsreif?
Noch nicht für geschäftskritische Workflows. Die Lokal-First-Anforderung bedeutet, dass Ihr KI-Unternehmen stoppt, wenn Ihr Rechner stoppt, und Cloud-Hosting ist per März 2026 noch nicht verfügbar. Für Nebenprojekte, Content-Operationen und MVP-Entwicklung ist es heute funktional und wirklich nützlich.
Wie unterscheidet sich Paperclip von anderen Agent-Frameworks?
Die meisten Agent-Frameworks orchestrieren Aufgaben. Paperclip orchestriert eine Organisation -- mit Organigrammen, Budgetdurchsetzung, Governance, Genehmigungsschleusen und Audit-Logs. Die Unternehmensmetapher bedeutet, dass Agenten Rollen haben, einander berichten und innerhalb expliziter Einschränkungen operieren, statt als unabhängige Bots zu agieren.
Kann ich ein vorgefertigtes KI-Unternehmen importieren?
Ja. Paperclip unterstützt das Importieren und Exportieren vollständiger Unternehmenskonfigurationen einschließlich Agenten, Personas, Skills, Routinen und Governance-Regeln. Von der Community erstellte Vorlagen für Content-Agenturen, Entwicklungsbüros und Marketing-Teams sind bereits auf GitHub verfügbar, und der Clipmart-Marktplatz kommt bald.
Lassen Sie uns zusammenarbeiten
Sie möchten KI-Systeme aufbauen, Workflows automatisieren oder Ihre technische Infrastruktur skalieren? Ich helfe gerne.
- Fiverr (Individualentwicklung & Integrationen): fiverr.com/s/EgxYmWD
- Portfolio: mejba.me
- Ramlit Limited (Enterprise-Lösungen): ramlit.com
- ColorPark (Design & Branding): colorpark.io
- xCyberSecurity (Sicherheitsdienstleistungen): xcybersecurity.io