Viaviva Agent System — Entwicklungskontext für Claude Code

Wer bin ich

Ich (Claude Code) bin der Senior-Entwickler und Systemadmin der das Viaviva Agent System auf diesem Hostinger-Server aufbaut. Chapaty ist der Auftraggeber und strategische Kopf. Ich setze um, Chapaty gibt frei.

---

Server

Hostinger KVM8: 8 vCPU AMD EPYC, 32GB RAM, 400GB NVMe
Ubuntu 24, Docker, kein GPU
Hostname: srv1356047

Laufende Container (Stand April 2026)

openclaw-sh3f-openclaw-1 (Port 59268) — Haupt-Agent "Lenny"
perfex-web-1 (Port 8081) — CRM, Command-Center
perfex-db-1 (Port 3306) — Perfex Datenbank MySQL
ollama-pmhq-ollama-1 (Port 32770) — lokales AI-Modell
nginx-proxy-manager (Port 80/443) — Reverse Proxy

Wichtige Dateipfade

Openclaw Config: /docker/openclaw-sh3f/data/.openclaw/openclaw.json
Openclaw Compose: /docker/openclaw-sh3f/docker-compose.yml
Perfex App: /docker/perfex/app/
Perfex DB: /docker/perfex/db/
Ollama Compose: /docker/ollama-pmhq/
Wiki (geplant): /root/openclaw-wiki/

Openclaw / Lenny — Konfiguration

Ollama URL intern: http://ollama-pmhq-ollama-1:11434/v1
Telegram Bot: @Penelope_bestbuddybot
Erlaubte Telegram-User-ID: 838021596
Control UI: https://ultimo.hochfrequenz.tech
Agents: Lenny (Dispatcher), Howard (Builder), Sheldon (Architekt),

Amy (QA), Raj (Ops), ZackPixel (Media), Bernadette (Security)

Aktuell geladene Ollama-Modelle (MÜSSEN getauscht werden)

qwen2.5-coder:7b — Primärmodell (falsch! Coding-Modell, kein Instruction-Modell)
qwen2.5:14b — Sheldon
llama3.1:8b — Amy, Raj, ZackPixel, Bernadette
llama3.1:8b-16k — Heartbeat, Subagents
llama3.2:3b — Fallback

Ziel-Modelle (Phase 1 — sofort umsetzen)

qwen3:1.7b — Chat-Agent, permanent geladen, OLLAMA_KEEP_ALIVE=-1
qwen3:8b — Worker Standard, bei Bedarf laden
qwen3:14b — Worker Komplex, bei Bedarf laden

GRUND: qwen2.5-coder ist für IDE-Autocomplete, nicht für Agenten. Beweis: Lenny halluziniert, mischt Sprachen (Chinesisch/Japanisch im Deutschen Text)

---

Gesamtziel

Aufbau einer vollständigen digitalen Agentur-Infrastruktur mit folgenden 8 Abteilungen:

IT & Infrastruktur (WordPress, Perfex, Plugins, Deployment)
Content-Produktion (Videos, Artikel, Mehrsprachig DE/EN/ES)
Marketing & Distribution (Multi-Platform, SEO, GEO)
Lead-Pflege & Kommunikation (WhatsApp, Telegram, Email)
Buchhaltung & Finanzen (Digistore24, Rechnungen, LLC)
Analyse & Learning (Analytics, Lernschleifen, Wiki)
Wissensmanagement (RAG-Wiki, Snippets, PDF-Ingestion)
Studien-Framework (Kunden-Tracking, Reports, DSGVO)

Projekte

hochfrequenz.tech (Gesundheitstechnologie, Digistore24-Affiliate)
gfkb.org (Krisenvorsorge-Nonprofit, Partner: Robert)
viaviva.team (Hauptmarke)
Tierheim-SaaS (in Entwicklung, Zielgruppe ~550 deutsche Tierheime)
Agrar-Export Paraguay (Mango, Mbokajá, Fruchtpulver)
Immobilien Paraguay (in Planung)
Container-Export-Broker Paraguay (Consolidator-Modell)

---

Eskalations-Pyramide (7 Stufen)

Stufe 1: Qwen3 1.7B lokal (kostenlos)

RAM: ~1-2GB, PERMANENT im RAM (OLLAMA_KEEP_ALIVE=-1)
Aufgaben: Chat, Klassifizierung, kurze Antworten, Telegram-Interface
Trigger: Alle eingehenden Nachrichten, einfache Abfragen
Token-Speed: ~20-25 tok/s auf CPU

Stufe 2: Qwen3 8B lokal (kostenlos)

RAM: ~5GB, wird bei Bedarf geladen
Aufgaben: Standard-Tasks, Content-Erstellung, WordPress-Pflege
Trigger: Mittlere Komplexität, Stufe 1 reicht nicht
Token-Speed: ~10-14 tok/s auf CPU

Stufe 3: Qwen3 14B lokal (kostenlos)

RAM: ~9GB, wird bei Bedarf geladen
Aufgaben: Komplexe Analyse, Coding, mehrstufige Planung
Trigger: Hohe Komplexität, Coding-Tasks, Stufe 2 scheitert
Token-Speed: ~5-7 tok/s auf CPU

Stufe 4: RunPod 70B pay-per-use (~$0.04/Task)

Kein permanenter Server, wird on-demand gestartet
Aufgaben: Wenn lokale Modelle 3x scheitern, sehr komplexe Tasks
Datenschutz-Vorteil: Daten bleiben bei RunPod, nicht bei Anthropic
Trigger: 3x Fehler auf Stufe 3 ODER zeitkritisch + Stufe 3 zu langsam
API: RunPod Serverless via N8N HTTP-Request

Stufe 5: Claude Haiku API (~$0.05/Task)

Trigger: Zeitkritisch, sofort verfügbar nötig, RunPod zu langsam
Aufgaben: Schnelle Entscheidungen, einfache Qualitätschecks

Stufe 6: Claude Sonnet API (~$0.20/Task)

Trigger: Schwierige mehrschichtige Probleme, Stufe 5 reicht nicht
Aufgaben: Komplexe Analyse, schwieriges Debugging

Stufe 7: Claude Opus API (~$1.00/Task)

IMMER mit Telegram-Freigabe von Chapaty
Trigger: Härteste Tasks, wenn alles andere scheitert
Chapaty bekommt Telegram: "Opus-Eskalation nötig für [Task]. Kosten: ~$1. Freigeben?"

Routing-Logik

Einfach + nicht zeitkritisch → Stufe 1
Standard → Stufe 2
Komplex → Stufe 3
3x Fehler lokal → Stufe 4
Zeitkritisch + lokal scheitert → Stufe 5
Sensible Daten + Eskalation → Stufe 4 (Daten lokal)
Stufe 7 immer mit Chapaty-Freigabe

---

RAM-Slot-System

Feste RAM-Zuteilung (32GB gesamt):

Slot Chat: 2GB → Qwen3 1.7B, IMMER geladen (OLLAMA_KEEP_ALIVE=-1)
Slot Worker: 10GB → Qwen3 8B oder 14B, bei Bedarf
Slot System: 8GB → Docker Stack (Perfex, Nginx, Openclaw)
Buffer: 10GB → Schutz vor RAM-Überlauf, Reserve

Regeln:

Nie Chat-Slot für Worker-Tasks opfern
Max 1x Stufe 3 (14B) ODER 2x Stufe 2 (8B) gleichzeitig
Bei RAM > 85%: Neue Tasks in Queue, kein sofortiger Start
Resource-Manager prüft RAM vor jedem Task-Start

---

Scheduling & Prioritäten

Tageszeiten:

08:00-22:00: Chat-Agent permanent, Worker auf Anfrage
22:00-06:00: Große Batch-Jobs, Video-Produktion, schwere Tasks
02:00-04:00: Ruhigstes Fenster für Deployments (laut Analyse)

Prioritäten:

P1: Chapaty-direkt (sofort)
P2: Zeitkritisch (< 5 Min)
P3: Normal (queue)
P4: Batch/Nacht (02:00-06:00)

API-Kosten:

Token-Guard in N8N: Tages-Budget $5, Alert bei $3
Wöchentlicher Kosten-Report via Telegram (montags)
Alle Claude-API-Calls laufen via N8N direkt, NIE durch Openclaw

---

Architektur-Prinzipien (NIEMALS verletzen)

Nie direkt live arbeiten — immer Staging zuerst
Immer Backup vor Deployment (Backup-Lock: kein Deploy ohne Backup < 30 Min)
Keine destruktiven DB-Operationen ohne explizite Freigabe
Chapaty-Gate für: Live-Deploy, DB-Änderungen, API-Kosten > $1
Alle Aktionen als Kommentar mit Timestamp in Perfex loggen
Token-Guard: N8N managed API-Calls, nie Openclaw direkt
NEVER_OVERWRITE: Statistiken, Orders, Kommentare, Formular-Einträge
Subdomains haben Lifecycle: max 2 aktive pro Projekt, tmp-* nach 24h gelöscht

Deployment-Flow

Staging erstellen (Clone)
Entwickeln + Tests
Chapaty gibt Staging frei (visuell)
Automatisch: Conflict-Check → Deploy → Post-Live-Checks
Post-Live: HTTP 200, PHP-Errors, Ladezeit, Staging-URLs, Formulare, Screenshots
Bei Fehler: sofortiger automatischer Rollback

Deployment-Umgebungen

/live/ → nie direkt anfassen
/staging/ → Arbeitsumgebung (Clone von live)
/dev-area/ → Blanko-Instanzen für neue Module

---

Schablonen-System

Schablonen liegen im Perfex Wiki unter /schablonen/ Jede Schablone enthält: Pflichtfragen, Aufgaben-Template, Feedback-Default, Qualitätsgates

Geplante Schablonen:

coding-wordpress.md
coding-plugin-app.md
coding-perfex.md
content-marketing.md
content-quellenfokussiert.md
boersenanalyse.md
buchhaltung-gmbh.md
info-abfrage-perfex.md

N8N lädt Schablone mechanisch — nicht das Sprachmodell entscheidet.

---

Context on Demand (lokale Modelle)

Qwen liest NIE den Chat-Verlauf — nur den aktuellen Perfex-Task
N8N baut Prompt aus Task-Feldern zusammen
Strukturelle Knappheit durch Perfex-Felder statt hartem Token-Limit
Kontext-Hierarchie:

IMMER: Rollen-Definition (50 Token, gecacht) + Task-Inhalt (100-500 Token) NUR WENN NÖTIG: Schablone, vorheriger Schritt, Fehlermeldung bei Retry NIE: Chat-Verlauf, andere Tasks, Kommentare anderer Agenten

---

Perfex als Command-Center

Agenten als Mitarbeiter mit Rollen und Rechten
Tasks als Tickets mit Abhängigkeiten (A→B vs. A parallel B)
Jede Agent-Aktion als Kommentar mit Timestamp in Perfex
Kein separates Log-System — alles in Perfex sichtbar
Perfex Wiki als Schablonen-Lager

---

Openclaw Companion Plugin (WordPress + Perfex)

Muss noch gebaut werden (Phase 3):

Standalone PHP — läuft auch wenn WordPress down ist
Token-gesicherte API, kein Login nötig
Endpoints: clone, backup, deploy, rollback, status, emergency-clone
Chapaty-Gate hardcoded für Deploy und Rollback
Conflict-Detection vor jedem Deploy
NEVER_OVERWRITE Liste hardcoded

---

Knowledge Base Wiki

Geplant unter /root/openclaw-wiki/ (Git-Repo):

/code-snippets/ — wiederverwendbare Code-Bausteine
/projekt-wissen/ — inhaltliches Wissen pro Projekt
/studien-instanzen/ — Studien-Framework Configs

RAG-Mechanismus: N8N sucht relevante Abschnitte, gibt nur diese an Qwen. Snippet-Lernschleife: Nach erfolgreichem Deploy automatisch extrahieren.

---

Media-Layer

Bilder: Google AI Studio Free Tier (500/Tag kostenlos)
Stockmaterial Whitelist: Canva + Pixabay API + Pexels API + Coverr
Musik: Lokale kuratierte DB (kein Lizenzrisiko)
Video-Schnitt: Canva + FFmpeg lokal für Shorts
AI-Video: Pixverse V6 via Segmind API ($0.22/Clip) — Image-to-Video
Canva: primäres Creative-Tool, API + Playwright Browser-Auto
Voice Input: Whisper lokal (kostenlos)
Voice Output: Coqui TTS lokal Standard, ElevenLabs API auf Anfrage

---

Social Media & Traffic

Plattformen (vollautomatisch):

YouTube: Data API, Multi-Language Audio Tracks, Thumbnails pro Sprache
Instagram/Facebook: Meta Graph API
TikTok: Content Posting API (nach App-Genehmigung)
Pinterest: besonders für hochfrequenz.tech
Threads: vollständige API
LinkedIn: für B2B (Tierheime, gfkb.org)

Multi-Platform Publishing: Upload-Post.com N8N-Node

SEO/GEO:

IndexNow auf allen Websites (sofortige Indexierung)
Schema Markup: FAQ, Article, HowTo automatisch
GEO: Content strukturiert für KI-Zitierungen

Mehrsprachigkeit:

Master: Deutsch
Automatisch: EN + ES via Qwen3 lokal
Fachbegriff-Verifizierung via Wikipedia-API
Später: nahezu alle Sprachen

---

Kommunikation & Leads

Telegram: öffentliche Kanäle pro Projekt, Agent postet automatisch
WhatsApp Business API: Inbound Support-Bot, kostenlos bis 1.000/Monat
Email: Perfex + Brevo SMTP-Relay (300/Tag kostenlos)
Lead-Capture: Wahl zwischen WhatsApp / Telegram / Email
Support-Schablonen: Whitelist was Agent sagen darf

---

Buchhaltung (LLC Paraguay)

IMAP Email-Reader für Buchhaltungs-Inbox
OCR für Rechnungen (Qwen3 + PDF-Parser)
Digistore24 API: Einnahmen täglich
Perfex als Buchhaltungs-System
"Zahlung eingegangen" → Chapaty meldet via Telegram → Agent bucht
Monatlicher Finanz-Report + LLC-Export CSV

---

Studien-Framework (Perfex-Modul: StudyManager)

Generisches Framework — nicht nur Schlafstudie:

Neue Studie: YAML-Config → Agent generiert → Chapaty gibt frei → läuft
Parameter: Produkt-Trigger, Fragen-Typ, Abfrage-Frequenz, Kanal, Interventionen
Trigger: Digistore24-Kauf → automatisches Onboarding
Erhebung: täglich via WhatsApp/Telegram, Buttons + Freitext + Voice
Datenverarbeitung: Whisper + Qwen3 + Perfex
DSGVO: TN-ID-System, lokale Datenhaltung, keine Verknüpfung mit Kaufdaten
Reports: monatlich automatisch als PDF an Teilnehmer
Cross-Studie-Analyse möglich (einheitliches Datenmodell)

---

B2B-Akquise (Agrar + Investments)

Max 2-3 personalisierte Nachrichten/Tag pro Kanal
Agent recherchiert Person/Unternehmen zuerst, dann schreibt er
Jede Nachricht: Chapaty-Freigabe via Telegram
LinkedIn: Investment-Partner, Importeure
WhatsApp: B2B-Agrar-Einkäufer
Perfex trackt jeden Kontakt als Lead
Lernschleife: Antwortrate → Schablonen verbessern

---

Container-Export-Broker Paraguay

Perfex-Modul: ContainerManager (analog StudyManager)

Lieferanten-DB: lokale Produzenten Paraguay
Käufer-DB: Importeure EU/DE/BR
Container-Füllstand live, Alert bei 80%
Logistik-Koordination via WhatsApp automatisch
Zoll-Dokumenten-Checkliste pro Ware
Margin-Berechnung und Rechnungsstellung automatisch

---

Bauplan — Phasen

Phase 1 — Fundament (3-4h) ← AKTUELL

[x] Server aufräumen (7.7GB befreit)
[x] Claude Code installieren
[x] CLAUDE.md erstellen
[ ] Verwaistes Volume entfernen: docker volume rm litellm-y3u6_litellm-db-data
[ ] fail2ban installieren
[ ] Docker Log-Rotation konfigurieren
[ ] Modell tauschen: alle alten Modelle → qwen3:1.7b + qwen3:8b + qwen3:14b
[ ] OLLAMA_KEEP_ALIVE=-1 für qwen3:1.7b setzen
[ ] Warmstart-Test: Lenny antwortet < 30 Sek auf Deutsch

Phase 2 — N8N + Perfex Grundstruktur (8-10h)

[ ] N8N installieren (Docker)
[ ] Telegram-Webhook in N8N
[ ] Classifier-Workflow (Info-Abfrage vs Task vs Smalltalk)
[ ] Token-Guard Node (Tages-Budget $5)
[ ] Perfex API-Anbindung
[ ] Agenten als Mitarbeiter in Perfex anlegen
[ ] Perfex Wiki einrichten: /schablonen/
[ ] Erste Schablone: Info-Abfrage
[ ] Zweite Schablone: Coding WordPress

Phase 3 — WordPress Companion Plugin (12-15h)

[ ] Plugin-Grundstruktur (standalone.php)
[ ] Token-Auth (kein Login nötig)
[ ] Backup-Endpoint
[ ] Clone-Endpoint (Staging auf Subdomain)
[ ] Deploy-Endpoint mit Conflict-Detection
[ ] Rollback-Endpoint
[ ] Post-Live-Checks (HTTP, PHP, Formulare, Screenshots)
[ ] Rollback-Watchdog in N8N
[ ] Erstes Perfex-Modul als Blaupause (Install/Deinstall/Debug)
[ ] End-to-End Test auf gfkb.org

Phase 4 — Wiki + RAG (5-6h)

[ ] Git-Repo: /root/openclaw-wiki/
[ ] Ordnerstruktur: /code-snippets/ + /projekt-wissen/
[ ] N8N Such-Node
[ ] Erste Snippets eintragen
[ ] Snippet-Extraktion nach Deploy automatisieren
[ ] PDF-Ingestion Pipeline (OCR für Lakhovsky-Werke)

Phase 5 — Content + Media (10-12h)

[ ] Whisper lokal installieren
[ ] Google AI Studio API (500 Bilder/Tag kostenlos)
[ ] Pixabay + Pexels API
[ ] Canva API Grundzugang
[ ] ElevenLabs API + Brand-Voice einrichten
[ ] FFmpeg prüfen/installieren
[ ] Ersten Hochfrequenz Video-Workflow bauen
[ ] Mehrsprachigkeit: Qwen3 übersetzt, ElevenLabs vertont
[ ] YouTube Multi-Language Audio Track Upload
[ ] Shorts automatisch schneiden

Phase 6 — Marketing + Distribution (8-10h)

[ ] Upload-Post.com N8N-Node
[ ] Meta Graph API (Instagram/Facebook)
[ ] YouTube Data API
[ ] Pinterest API
[ ] TikTok App-Antrag (läuft parallel, 1-4 Wochen)
[ ] IndexNow auf allen Websites
[ ] SEO: Meta-Tags, Schema Markup automatisch
[ ] Presseportale-Workflow (8-12 Portale)
[ ] Threads + LinkedIn API

Phase 7 — Kommunikation + Leads (6-8h)

[ ] WhatsApp Business API (Meta-Verifizierung)
[ ] Webhook → N8N → Qwen3
[ ] Support-Schablonen + Whitelist
[ ] Telegram öffentliche Kanäle pro Projekt
[ ] Brevo SMTP-Relay einrichten
[ ] Queue-Management 300/Tag
[ ] Subscriber-Segmentierung in Perfex

Phase 8 — Buchhaltung (8-10h)

[ ] IMAP Email-Reader
[ ] Rechnungs-OCR (Qwen3 + PDF-Parser)
[ ] Digistore24 API
[ ] Perfex Buchhaltungs-Integration
[ ] Monatlicher Finanz-Report
[ ] LLC-Export CSV

Phase 9 — Analyse + Learning (5-6h)

[ ] Google Analytics API
[ ] YouTube Analytics API
[ ] Meta Insights API
[ ] GEO-Monitoring (ChatGPT/Perplexity/Claude Erwähnungen)
[ ] Wöchentlicher Telegram-Report
[ ] Lernschleifen (Content-Performance, Pixverse-Prompts)

Phase 10 — StudyManager Perfex-Modul (10-12h)

[ ] Modul-Grundstruktur (Install/Deinstall/Debug)
[ ] Datenmodell: Studies, Participants, Responses
[ ] Digistore Webhook → Onboarding
[ ] Abfrage-Scheduler (N8N)
[ ] Antwort-Verarbeitung (Buttons/Text/Voice)
[ ] Interventions-Engine (regelbasiert)
[ ] Monatlicher PDF-Report (Canva)
[ ] DSGVO-Anonymisierung (TN-ID-System)
[ ] Cross-Studie-Analyse
[ ] Zweite Studien-Instanz als Clone-Test

---

Kommunikation mit Chapaty

Chapaty arbeitet via Android App (claude.ai) und Terminal
Freigaben kommen via Telegram oder direkt im Chat
Immer kurze Statusmeldung nach jedem abgeschlossenen Schritt
Bei Unklarheiten: FRAGEN bevor handeln
Chapaty ist in Paraguay (Zeitzone: Amerika/Asuncion)