Viaviva Agent System β Entwicklungskontext fΓΌr Claude Code
Wer bin ich
Ich (Claude Code) bin der Senior-Entwickler und Systemadmin der das Viaviva Agent System auf diesem Hostinger-Server aufbaut. Chapaty ist der Auftraggeber und strategische Kopf. Ich setze um, Chapaty gibt frei.
---
Server
- Hostinger KVM8: 8 vCPU AMD EPYC, 32GB RAM, 400GB NVMe
- Ubuntu 24, Docker, kein GPU
- Hostname: srv1356047
Laufende Container (Stand April 2026)
- openclaw-sh3f-openclaw-1 (Port 59268) β Haupt-Agent "Lenny"
- perfex-web-1 (Port 8081) β CRM, Command-Center
- perfex-db-1 (Port 3306) β Perfex Datenbank MySQL
- ollama-pmhq-ollama-1 (Port 32770) β lokales AI-Modell
- nginx-proxy-manager (Port 80/443) β Reverse Proxy
Wichtige Dateipfade
- Openclaw Config: /docker/openclaw-sh3f/data/.openclaw/openclaw.json
- Openclaw Compose: /docker/openclaw-sh3f/docker-compose.yml
- Perfex App: /docker/perfex/app/
- Perfex DB: /docker/perfex/db/
- Ollama Compose: /docker/ollama-pmhq/
- Wiki (geplant): /root/openclaw-wiki/
Openclaw / Lenny β Konfiguration
- Ollama URL intern: http://ollama-pmhq-ollama-1:11434/v1
- Telegram Bot: @Penelope_bestbuddybot
- Erlaubte Telegram-User-ID: 838021596
- Control UI: https://ultimo.hochfrequenz.tech
- Agents: Lenny (Dispatcher), Howard (Builder), Sheldon (Architekt),
Amy (QA), Raj (Ops), ZackPixel (Media), Bernadette (Security)
Aktuell geladene Ollama-Modelle (MΓSSEN getauscht werden)
- qwen2.5-coder:7b β PrimΓ€rmodell (falsch! Coding-Modell, kein Instruction-Modell)
- qwen2.5:14b β Sheldon
- llama3.1:8b β Amy, Raj, ZackPixel, Bernadette
- llama3.1:8b-16k β Heartbeat, Subagents
- llama3.2:3b β Fallback
Ziel-Modelle (Phase 1 β sofort umsetzen)
- qwen3:1.7b β Chat-Agent, permanent geladen, OLLAMA_KEEP_ALIVE=-1
- qwen3:8b β Worker Standard, bei Bedarf laden
- qwen3:14b β Worker Komplex, bei Bedarf laden
GRUND: qwen2.5-coder ist fΓΌr IDE-Autocomplete, nicht fΓΌr Agenten. Beweis: Lenny halluziniert, mischt Sprachen (Chinesisch/Japanisch im Deutschen Text)
---
Gesamtziel
Aufbau einer vollstΓ€ndigen digitalen Agentur-Infrastruktur mit folgenden 8 Abteilungen:
- IT & Infrastruktur (WordPress, Perfex, Plugins, Deployment)
- Content-Produktion (Videos, Artikel, Mehrsprachig DE/EN/ES)
- Marketing & Distribution (Multi-Platform, SEO, GEO)
- Lead-Pflege & Kommunikation (WhatsApp, Telegram, Email)
- Buchhaltung & Finanzen (Digistore24, Rechnungen, LLC)
- Analyse & Learning (Analytics, Lernschleifen, Wiki)
- Wissensmanagement (RAG-Wiki, Snippets, PDF-Ingestion)
- Studien-Framework (Kunden-Tracking, Reports, DSGVO)
Projekte
- hochfrequenz.tech (Gesundheitstechnologie, Digistore24-Affiliate)
- gfkb.org (Krisenvorsorge-Nonprofit, Partner: Robert)
- viaviva.team (Hauptmarke)
- Tierheim-SaaS (in Entwicklung, Zielgruppe ~550 deutsche Tierheime)
- Agrar-Export Paraguay (Mango, MbokajΓ‘, Fruchtpulver)
- Immobilien Paraguay (in Planung)
- Container-Export-Broker Paraguay (Consolidator-Modell)
---
Eskalations-Pyramide (7 Stufen)
Stufe 1: Qwen3 1.7B lokal (kostenlos)
- RAM: ~1-2GB, PERMANENT im RAM (OLLAMA_KEEP_ALIVE=-1)
- Aufgaben: Chat, Klassifizierung, kurze Antworten, Telegram-Interface
- Trigger: Alle eingehenden Nachrichten, einfache Abfragen
- Token-Speed: ~20-25 tok/s auf CPU
Stufe 2: Qwen3 8B lokal (kostenlos)
- RAM: ~5GB, wird bei Bedarf geladen
- Aufgaben: Standard-Tasks, Content-Erstellung, WordPress-Pflege
- Trigger: Mittlere KomplexitΓ€t, Stufe 1 reicht nicht
- Token-Speed: ~10-14 tok/s auf CPU
Stufe 3: Qwen3 14B lokal (kostenlos)
- RAM: ~9GB, wird bei Bedarf geladen
- Aufgaben: Komplexe Analyse, Coding, mehrstufige Planung
- Trigger: Hohe KomplexitΓ€t, Coding-Tasks, Stufe 2 scheitert
- Token-Speed: ~5-7 tok/s auf CPU
Stufe 4: RunPod 70B pay-per-use (~$0.04/Task)
- Kein permanenter Server, wird on-demand gestartet
- Aufgaben: Wenn lokale Modelle 3x scheitern, sehr komplexe Tasks
- Datenschutz-Vorteil: Daten bleiben bei RunPod, nicht bei Anthropic
- Trigger: 3x Fehler auf Stufe 3 ODER zeitkritisch + Stufe 3 zu langsam
- API: RunPod Serverless via N8N HTTP-Request
Stufe 5: Claude Haiku API (~$0.05/Task)
- Trigger: Zeitkritisch, sofort verfΓΌgbar nΓΆtig, RunPod zu langsam
- Aufgaben: Schnelle Entscheidungen, einfache QualitΓ€tschecks
Stufe 6: Claude Sonnet API (~$0.20/Task)
- Trigger: Schwierige mehrschichtige Probleme, Stufe 5 reicht nicht
- Aufgaben: Komplexe Analyse, schwieriges Debugging
Stufe 7: Claude Opus API (~$1.00/Task)
- IMMER mit Telegram-Freigabe von Chapaty
- Trigger: HΓ€rteste Tasks, wenn alles andere scheitert
- Chapaty bekommt Telegram: "Opus-Eskalation nΓΆtig fΓΌr [Task]. Kosten: ~$1. Freigeben?"
Routing-Logik
- Einfach + nicht zeitkritisch β Stufe 1
- Standard β Stufe 2
- Komplex β Stufe 3
- 3x Fehler lokal β Stufe 4
- Zeitkritisch + lokal scheitert β Stufe 5
- Sensible Daten + Eskalation β Stufe 4 (Daten lokal)
- Stufe 7 immer mit Chapaty-Freigabe
---
RAM-Slot-System
Feste RAM-Zuteilung (32GB gesamt):
- Slot Chat: 2GB β Qwen3 1.7B, IMMER geladen (OLLAMA_KEEP_ALIVE=-1)
- Slot Worker: 10GB β Qwen3 8B oder 14B, bei Bedarf
- Slot System: 8GB β Docker Stack (Perfex, Nginx, Openclaw)
- Buffer: 10GB β Schutz vor RAM-Γberlauf, Reserve
Regeln:
- Nie Chat-Slot fΓΌr Worker-Tasks opfern
- Max 1x Stufe 3 (14B) ODER 2x Stufe 2 (8B) gleichzeitig
- Bei RAM > 85%: Neue Tasks in Queue, kein sofortiger Start
- Resource-Manager prΓΌft RAM vor jedem Task-Start
---
Scheduling & PrioritΓ€ten
Tageszeiten:
- 08:00-22:00: Chat-Agent permanent, Worker auf Anfrage
- 22:00-06:00: GroΓe Batch-Jobs, Video-Produktion, schwere Tasks
- 02:00-04:00: Ruhigstes Fenster fΓΌr Deployments (laut Analyse)
PrioritΓ€ten:
- P1: Chapaty-direkt (sofort)
- P2: Zeitkritisch (< 5 Min)
- P3: Normal (queue)
- P4: Batch/Nacht (02:00-06:00)
API-Kosten:
- Token-Guard in N8N: Tages-Budget $5, Alert bei $3
- WΓΆchentlicher Kosten-Report via Telegram (montags)
- Alle Claude-API-Calls laufen via N8N direkt, NIE durch Openclaw
---
Architektur-Prinzipien (NIEMALS verletzen)
- Nie direkt live arbeiten β immer Staging zuerst
- Immer Backup vor Deployment (Backup-Lock: kein Deploy ohne Backup < 30 Min)
- Keine destruktiven DB-Operationen ohne explizite Freigabe
- Chapaty-Gate fΓΌr: Live-Deploy, DB-Γnderungen, API-Kosten > $1
- Alle Aktionen als Kommentar mit Timestamp in Perfex loggen
- Token-Guard: N8N managed API-Calls, nie Openclaw direkt
- NEVER_OVERWRITE: Statistiken, Orders, Kommentare, Formular-EintrΓ€ge
- Subdomains haben Lifecycle: max 2 aktive pro Projekt, tmp-* nach 24h gelΓΆscht
Deployment-Flow
- Staging erstellen (Clone)
- Entwickeln + Tests
- Chapaty gibt Staging frei (visuell)
- Automatisch: Conflict-Check β Deploy β Post-Live-Checks
- Post-Live: HTTP 200, PHP-Errors, Ladezeit, Staging-URLs, Formulare, Screenshots
- Bei Fehler: sofortiger automatischer Rollback
Deployment-Umgebungen
- /live/ β nie direkt anfassen
- /staging/ β Arbeitsumgebung (Clone von live)
- /dev-area/ β Blanko-Instanzen fΓΌr neue Module
---
Schablonen-System
Schablonen liegen im Perfex Wiki unter /schablonen/ Jede Schablone enthΓ€lt: Pflichtfragen, Aufgaben-Template, Feedback-Default, QualitΓ€tsgates
Geplante Schablonen:
- coding-wordpress.md
- coding-plugin-app.md
- coding-perfex.md
- content-marketing.md
- content-quellenfokussiert.md
- boersenanalyse.md
- buchhaltung-gmbh.md
- info-abfrage-perfex.md
N8N lΓ€dt Schablone mechanisch β nicht das Sprachmodell entscheidet.
---
Context on Demand (lokale Modelle)
- Qwen liest NIE den Chat-Verlauf β nur den aktuellen Perfex-Task
- N8N baut Prompt aus Task-Feldern zusammen
- Strukturelle Knappheit durch Perfex-Felder statt hartem Token-Limit
- Kontext-Hierarchie:
IMMER: Rollen-Definition (50 Token, gecacht) + Task-Inhalt (100-500 Token) NUR WENN NΓTIG: Schablone, vorheriger Schritt, Fehlermeldung bei Retry NIE: Chat-Verlauf, andere Tasks, Kommentare anderer Agenten
---
Perfex als Command-Center
- Agenten als Mitarbeiter mit Rollen und Rechten
- Tasks als Tickets mit AbhΓ€ngigkeiten (AβB vs. A parallel B)
- Jede Agent-Aktion als Kommentar mit Timestamp in Perfex
- Kein separates Log-System β alles in Perfex sichtbar
- Perfex Wiki als Schablonen-Lager
---
Openclaw Companion Plugin (WordPress + Perfex)
Muss noch gebaut werden (Phase 3):
- Standalone PHP β lΓ€uft auch wenn WordPress down ist
- Token-gesicherte API, kein Login nΓΆtig
- Endpoints: clone, backup, deploy, rollback, status, emergency-clone
- Chapaty-Gate hardcoded fΓΌr Deploy und Rollback
- Conflict-Detection vor jedem Deploy
- NEVER_OVERWRITE Liste hardcoded
---
Knowledge Base Wiki
Geplant unter /root/openclaw-wiki/ (Git-Repo):
- /code-snippets/ β wiederverwendbare Code-Bausteine
- /projekt-wissen/ β inhaltliches Wissen pro Projekt
- /studien-instanzen/ β Studien-Framework Configs
RAG-Mechanismus: N8N sucht relevante Abschnitte, gibt nur diese an Qwen. Snippet-Lernschleife: Nach erfolgreichem Deploy automatisch extrahieren.
---
Media-Layer
- Bilder: Google AI Studio Free Tier (500/Tag kostenlos)
- Stockmaterial Whitelist: Canva + Pixabay API + Pexels API + Coverr
- Musik: Lokale kuratierte DB (kein Lizenzrisiko)
- Video-Schnitt: Canva + FFmpeg lokal fΓΌr Shorts
- AI-Video: Pixverse V6 via Segmind API ($0.22/Clip) β Image-to-Video
- Canva: primΓ€res Creative-Tool, API + Playwright Browser-Auto
- Voice Input: Whisper lokal (kostenlos)
- Voice Output: Coqui TTS lokal Standard, ElevenLabs API auf Anfrage
---
Social Media & Traffic
Plattformen (vollautomatisch):
- YouTube: Data API, Multi-Language Audio Tracks, Thumbnails pro Sprache
- Instagram/Facebook: Meta Graph API
- TikTok: Content Posting API (nach App-Genehmigung)
- Pinterest: besonders fΓΌr hochfrequenz.tech
- Threads: vollstΓ€ndige API
- LinkedIn: fΓΌr B2B (Tierheime, gfkb.org)
Multi-Platform Publishing: Upload-Post.com N8N-Node
SEO/GEO:
- IndexNow auf allen Websites (sofortige Indexierung)
- Schema Markup: FAQ, Article, HowTo automatisch
- GEO: Content strukturiert fΓΌr KI-Zitierungen
Mehrsprachigkeit:
- Master: Deutsch
- Automatisch: EN + ES via Qwen3 lokal
- Fachbegriff-Verifizierung via Wikipedia-API
- SpΓ€ter: nahezu alle Sprachen
---
Kommunikation & Leads
- Telegram: ΓΆffentliche KanΓ€le pro Projekt, Agent postet automatisch
- WhatsApp Business API: Inbound Support-Bot, kostenlos bis 1.000/Monat
- Email: Perfex + Brevo SMTP-Relay (300/Tag kostenlos)
- Lead-Capture: Wahl zwischen WhatsApp / Telegram / Email
- Support-Schablonen: Whitelist was Agent sagen darf
---
Buchhaltung (LLC Paraguay)
- IMAP Email-Reader fΓΌr Buchhaltungs-Inbox
- OCR fΓΌr Rechnungen (Qwen3 + PDF-Parser)
- Digistore24 API: Einnahmen tΓ€glich
- Perfex als Buchhaltungs-System
- "Zahlung eingegangen" β Chapaty meldet via Telegram β Agent bucht
- Monatlicher Finanz-Report + LLC-Export CSV
---
Studien-Framework (Perfex-Modul: StudyManager)
Generisches Framework β nicht nur Schlafstudie:
- Neue Studie: YAML-Config β Agent generiert β Chapaty gibt frei β lΓ€uft
- Parameter: Produkt-Trigger, Fragen-Typ, Abfrage-Frequenz, Kanal, Interventionen
- Trigger: Digistore24-Kauf β automatisches Onboarding
- Erhebung: tΓ€glich via WhatsApp/Telegram, Buttons + Freitext + Voice
- Datenverarbeitung: Whisper + Qwen3 + Perfex
- DSGVO: TN-ID-System, lokale Datenhaltung, keine VerknΓΌpfung mit Kaufdaten
- Reports: monatlich automatisch als PDF an Teilnehmer
- Cross-Studie-Analyse mΓΆglich (einheitliches Datenmodell)
---
B2B-Akquise (Agrar + Investments)
- Max 2-3 personalisierte Nachrichten/Tag pro Kanal
- Agent recherchiert Person/Unternehmen zuerst, dann schreibt er
- Jede Nachricht: Chapaty-Freigabe via Telegram
- LinkedIn: Investment-Partner, Importeure
- WhatsApp: B2B-Agrar-EinkΓ€ufer
- Perfex trackt jeden Kontakt als Lead
- Lernschleife: Antwortrate β Schablonen verbessern
---
Container-Export-Broker Paraguay
Perfex-Modul: ContainerManager (analog StudyManager)
- Lieferanten-DB: lokale Produzenten Paraguay
- KΓ€ufer-DB: Importeure EU/DE/BR
- Container-FΓΌllstand live, Alert bei 80%
- Logistik-Koordination via WhatsApp automatisch
- Zoll-Dokumenten-Checkliste pro Ware
- Margin-Berechnung und Rechnungsstellung automatisch
---
Bauplan β Phasen
Phase 1 β Fundament (3-4h) β AKTUELL
- [x] Server aufrΓ€umen (7.7GB befreit)
- [x] Claude Code installieren
- [x] CLAUDE.md erstellen
- [ ] Verwaistes Volume entfernen: docker volume rm litellm-y3u6_litellm-db-data
- [ ] fail2ban installieren
- [ ] Docker Log-Rotation konfigurieren
- [ ] Modell tauschen: alle alten Modelle β qwen3:1.7b + qwen3:8b + qwen3:14b
- [ ] OLLAMA_KEEP_ALIVE=-1 fΓΌr qwen3:1.7b setzen
- [ ] Warmstart-Test: Lenny antwortet < 30 Sek auf Deutsch
Phase 2 β N8N + Perfex Grundstruktur (8-10h)
- [ ] N8N installieren (Docker)
- [ ] Telegram-Webhook in N8N
- [ ] Classifier-Workflow (Info-Abfrage vs Task vs Smalltalk)
- [ ] Token-Guard Node (Tages-Budget $5)
- [ ] Perfex API-Anbindung
- [ ] Agenten als Mitarbeiter in Perfex anlegen
- [ ] Perfex Wiki einrichten: /schablonen/
- [ ] Erste Schablone: Info-Abfrage
- [ ] Zweite Schablone: Coding WordPress
Phase 3 β WordPress Companion Plugin (12-15h)
- [ ] Plugin-Grundstruktur (standalone.php)
- [ ] Token-Auth (kein Login nΓΆtig)
- [ ] Backup-Endpoint
- [ ] Clone-Endpoint (Staging auf Subdomain)
- [ ] Deploy-Endpoint mit Conflict-Detection
- [ ] Rollback-Endpoint
- [ ] Post-Live-Checks (HTTP, PHP, Formulare, Screenshots)
- [ ] Rollback-Watchdog in N8N
- [ ] Erstes Perfex-Modul als Blaupause (Install/Deinstall/Debug)
- [ ] End-to-End Test auf gfkb.org
Phase 4 β Wiki + RAG (5-6h)
- [ ] Git-Repo: /root/openclaw-wiki/
- [ ] Ordnerstruktur: /code-snippets/ + /projekt-wissen/
- [ ] N8N Such-Node
- [ ] Erste Snippets eintragen
- [ ] Snippet-Extraktion nach Deploy automatisieren
- [ ] PDF-Ingestion Pipeline (OCR fΓΌr Lakhovsky-Werke)
Phase 5 β Content + Media (10-12h)
- [ ] Whisper lokal installieren
- [ ] Google AI Studio API (500 Bilder/Tag kostenlos)
- [ ] Pixabay + Pexels API
- [ ] Canva API Grundzugang
- [ ] ElevenLabs API + Brand-Voice einrichten
- [ ] FFmpeg prΓΌfen/installieren
- [ ] Ersten Hochfrequenz Video-Workflow bauen
- [ ] Mehrsprachigkeit: Qwen3 ΓΌbersetzt, ElevenLabs vertont
- [ ] YouTube Multi-Language Audio Track Upload
- [ ] Shorts automatisch schneiden
Phase 6 β Marketing + Distribution (8-10h)
- [ ] Upload-Post.com N8N-Node
- [ ] Meta Graph API (Instagram/Facebook)
- [ ] YouTube Data API
- [ ] Pinterest API
- [ ] TikTok App-Antrag (lΓ€uft parallel, 1-4 Wochen)
- [ ] IndexNow auf allen Websites
- [ ] SEO: Meta-Tags, Schema Markup automatisch
- [ ] Presseportale-Workflow (8-12 Portale)
- [ ] Threads + LinkedIn API
Phase 7 β Kommunikation + Leads (6-8h)
- [ ] WhatsApp Business API (Meta-Verifizierung)
- [ ] Webhook β N8N β Qwen3
- [ ] Support-Schablonen + Whitelist
- [ ] Telegram ΓΆffentliche KanΓ€le pro Projekt
- [ ] Brevo SMTP-Relay einrichten
- [ ] Queue-Management 300/Tag
- [ ] Subscriber-Segmentierung in Perfex
Phase 8 β Buchhaltung (8-10h)
- [ ] IMAP Email-Reader
- [ ] Rechnungs-OCR (Qwen3 + PDF-Parser)
- [ ] Digistore24 API
- [ ] Perfex Buchhaltungs-Integration
- [ ] Monatlicher Finanz-Report
- [ ] LLC-Export CSV
Phase 9 β Analyse + Learning (5-6h)
- [ ] Google Analytics API
- [ ] YouTube Analytics API
- [ ] Meta Insights API
- [ ] GEO-Monitoring (ChatGPT/Perplexity/Claude ErwΓ€hnungen)
- [ ] WΓΆchentlicher Telegram-Report
- [ ] Lernschleifen (Content-Performance, Pixverse-Prompts)
Phase 10 β StudyManager Perfex-Modul (10-12h)
- [ ] Modul-Grundstruktur (Install/Deinstall/Debug)
- [ ] Datenmodell: Studies, Participants, Responses
- [ ] Digistore Webhook β Onboarding
- [ ] Abfrage-Scheduler (N8N)
- [ ] Antwort-Verarbeitung (Buttons/Text/Voice)
- [ ] Interventions-Engine (regelbasiert)
- [ ] Monatlicher PDF-Report (Canva)
- [ ] DSGVO-Anonymisierung (TN-ID-System)
- [ ] Cross-Studie-Analyse
- [ ] Zweite Studien-Instanz als Clone-Test
---
Kommunikation mit Chapaty
- Chapaty arbeitet via Android App (claude.ai) und Terminal
- Freigaben kommen via Telegram oder direkt im Chat
- Immer kurze Statusmeldung nach jedem abgeschlossenen Schritt
- Bei Unklarheiten: FRAGEN bevor handeln
- Chapaty ist in Paraguay (Zeitzone: Amerika/Asuncion)