AI Agents · Custom-Builds

AI Agents, die
echte Arbeit übernehmen.
Nicht nur Chat.

Skalator baut Custom-Agents auf Basis von Claude und GPT — für Sachbearbeitung, Wissens-RAG, Vertriebs-Recherche und Mail-Triage. Mit Tool-Aufrufen, Memory und Guard-Rails. Pragmatisch, messbar, in 3–8 Wochen live. Kein Demo-Theater, sondern produktive Agents im echten Workflow.

Agent-Scoping vereinbaren Use-Cases ansehen

Claude & GPT EU-Hosting möglich Pilot in 3–8 Wochen

agent-orchestrator.skalator 4 Agents · live

Operator

orchestriert · eskaliert

Sales-Recherche

Apollo + Web

thinking

› Analysiere Account "Müller GmbH" — Signale gefunden.

Mail-Triage

Postfach

idle

› 14 Mails klassifiziert · 3 Entwürfe abgelegt.

Wissens-RAG

Confluence

thinking

› Suche in "Onboarding-Doku" — 4 Quellen gefunden.

Lead-Scoring

CRM Signale

idle

› Score 87 für "Bauer KG" mit 3 Begründungen.

Warum Custom-Agents heute Sinn machen

Vier Dinge, die "AI-Agent"-Anbieter selten ehrlich aussprechen.

"AI-Agents" sind 2026 das neue Schlagwort. Die meisten Tools im Markt sind aber Chatbots mit Marketing-Make-up. Wer echte Arbeit übernehmen lassen will, braucht Custom-Builds — mit Tool-Aufrufen, Gedächtnis und Guard-Rails. Vier Wahrheiten, die wir vor jedem Projekt sagen.

Ein ChatGPT-Wrapper reicht nicht

Die meisten "AI-Agent"-Tools im Markt sind Chatbots mit etwas Prompt-Engineering drumherum. Echte Arbeit übernehmen sie nicht — sie sind eine bessere Suchleiste. Ein produktiver Agent braucht Tool-Aufrufe, Gedächtnis, Quellen-Verifikation und Übergabepunkte an Menschen.

Agent = LLM + Code + Tools + Memory

Ein Agent ist nicht "die KI" — es ist ein laufendes System aus Sprachmodell, Code-Logik, externen Tools (APIs, Datenbanken, Web), persistentem Gedächtnis und Guard-Rails. Wir bauen das System, nicht nur den Prompt. Das ist der Unterschied zwischen Demo und Produktivbetrieb.

Use-Case-getrieben, nicht Demo-Spielzeug

Wir bauen keine Agents, weil "AI-Agents" gerade Buzzword sind. Wir bauen Agents für klar abgegrenzte Aufgaben mit messbarem Output: 200 Mails pro Tag triagieren, 50 Leads pro Woche recherchieren, eingehende Rechnungen klassifizieren. Wenn der Use-Case nicht messbar ist, wird der Agent nicht messbar besser als der Status Quo.

Integriert in echte Workflows

Ein Agent, der nur im eigenen Chat-Fenster lebt, ist ein Spielzeug. Echte Wirkung entsteht erst, wenn der Agent in eure Systeme greift — CRM, Postfach, Wiki, Slack/Teams, Ticketsystem. Wir bauen die Integrationen mit, sodass der Agent dort arbeitet, wo eure Leute heute arbeiten.

Welche dieser vier Wahrheiten erkennt ihr aus eurem letzten KI-Versuch wieder?

Ehrliches Erstgespräch buchen

Mitarbeiter aus Software

Agenten, die echte Arbeit übernehmen statt nur zu antworten

Ein Chatbot beantwortet Fragen, ein Agent erledigt Aufgaben. Wir bauen euch KI-Agenten, die recherchieren, Daten pflegen, Anfragen vorbereiten und Schritte selbstständig ausführen, eingebunden in eure Tools und mit klaren Freigaben dort, wo ein Mensch das letzte Wort behalten soll.

Eigenen Agenten bauen lassen

Welche Agents wir bauen

Sechs Custom-Agents, die in echten Mittelstands-Workflows arbeiten.

Sechs Agent-Typen, die wir wiederholt bauen — jedes Mal angepasst an euer Tooling, eure Daten und euren Prozess. Was wir nicht bauen: "Universal-Agents", die alles können. Spezialisierte Agents gewinnen — heute und auf absehbare Zeit.

Apollo + Web + LinkedIn

Sales-Recherche-Agent

Bekommt eine Liste Ziel-Accounts, recherchiert pro Account: Branche, aktuelle News, Tech-Stack, Signale, passender Ansprechpartner. Liefert pro Lead einen Recherche-Brief plus erste Personalisierungs-Hooks. Sales schreibt — Mensch bleibt im Lead.

Tools

ApolloLinkedInWebsucheCRM

Postfach + CRM-Kontext

Mail-Triage- & Antwort-Vorschlag-Agent

Liest eingehende Mails, klassifiziert (Anfrage, Reklamation, Spam, Termin, intern), schlägt eine Antwort vor und legt sie als Entwurf ab. Mensch prüft und sendet. In Wochen 1–4 immer Schattenbetrieb — erst danach automatisches Ablegen von Routine-Antworten.

Tools

IMAP/GraphHubSpotPipedrive

Interne Doku + Wikis + alte Tickets

Wissens-RAG-Agent

Eure Handbücher, Onboarding-Doku, alte Support-Tickets und Verträge werden vektorisiert. Mitarbeiter:innen stellen Fragen in natürlicher Sprache, der Agent antwortet mit Quellverweis. Keine erfundenen Inhalte — nur Antworten mit nachvollziehbarer Quelle.

Tools

ConfluenceNotionSharePoint

Signale aus CRM + Web

Lead-Scoring-Agent

Liest neue Leads, kombiniert Firmen-Signale (Größe, Branche, Tech-Stack), Verhaltens-Signale (Website-Aktivität, Mail-Reaktionen) und CRM-Historie. Vergibt ein Score mit Begründung. Sales sieht sofort, wo Engagement Sinn macht — und wo nicht.

Tools

HubSpotApolloWebdaten

Themen → Brief + Roh-Entwurf

Content-Recherche- & Entwurfs-Agent

Bekommt ein Content-Thema, recherchiert Wettbewerb, sammelt Quellen, schreibt einen ersten Entwurf in eurem Wording. Redaktion bleibt menschlich — der Agent liefert die Vorarbeit. Output: Brief, Roh-Entwurf, Quellenliste, SEO-Stichworte.

Tools

WebAhrefsCMS

Dokumente → strukturierte Felder

Sachbearbeitungs-Agent

Eingehende PDF-Rechnungen, Verträge, Angebote, Formulare werden klassifiziert. Relevante Felder (Betrag, Datum, Vertragsparteien, IBAN) werden extrahiert, validiert und an Folgesysteme übergeben. Bei niedriger Sicherheit landet der Vorgang im Review-Queue.

Tools

OCRDATEVERP

Welcher dieser sechs Agents würde bei euch sofort Arbeit übernehmen?

Agent-Konzept anfragen

Architektur

Wie ein Skalator-Agent gebaut ist.

Ein produktiver Agent ist mehr als ein Prompt. Vier Layer arbeiten zusammen — und in genau dieser Reihenfolge entscheidet sich, ob aus dem Agent ein Werkzeug oder ein teures Demo-Spielzeug wird.

Guard-Rails

Konfidenz-Schwellen, Quellenpflicht, Eskalation an Menschen, Logging.

Memory & RAG

Persistentes Gedächtnis, Vektorbasis eurer Doku, Quellen mit Verweis.

Tool-Layer

CRM, Postfach, Wiki, Web, OCR, ERP — der Agent ruft echte Systeme auf.

LLM-Layer

Claude oder GPT — pro Use-Case gewählt. Optional lokales Modell.

Wichtig: Das LLM ist nur eine Komponente — keine Magie. Die Qualität eines Agents entsteht oben drüber: in den Tools, im Memory und in den Guard-Rails. Wer nur den Prompt optimiert, baut ein Spielzeug.

Habt ihr einen Use-Case, bei dem Tools, Memory und Guard-Rails wirklich zusammenspielen müssen?

Architektur-Beratung anfragen

Skalators Leistung

Vom Scoping zum produktiven Agent.

Wir bauen Agents als Software-Projekte — mit Spezifikation, Test-Beispielen, Schattenbetrieb und ehrlicher Messung. Kein "Workshop und dann mal sehen". Wenn der Agent in der Pilotphase keinen Wert liefert, sagen wir das — statt ihn ins Produktivsystem zu schieben.

Use-Case-Schärfung

Wir nehmen den Use-Case ernst — was ist der konkrete Auftrag, was ist das messbare Ergebnis, was sind die Stolpersteine. Daraus entsteht eine Spezifikation, die jeder im Team versteht.

Bau mit echten Beispielen

Wir bauen den Agent gegen echte Beispiele aus eurem Alltag — nicht gegen synthetische Demo-Daten. Modellwahl, Tool-Aufrufe, RAG-Setup, Guard-Rails. Wöchentliche Demo statt Big-Bang am Ende.

Schattenbetrieb mit Messung

Der Agent läuft mit, ohne final zu entscheiden. Wir messen Qualität, Geschwindigkeit, Eskalationsrate. Erst wenn die Zahlen passen, wechselt er in den Produktivbetrieb. Wenn nicht, wird ehrlich nachgebessert oder gestoppt.

Produktivbetrieb & Begleitung

Im Produktivbetrieb sind Logging, Monitoring und ein klarer Eskalationspfad Standard. Optional bleiben wir als Sparringspartner — Modelle werden besser, Use-Cases wachsen, Tools verändern sich.

Im Leistungsumfang

Use-Case-Schärfung mit klarem Erfolgskriterium
Modell- und Tool-Auswahl pro Agent (Claude, GPT, lokal)
Bau des Agents inkl. Tool-Aufrufe und Memory
RAG-Setup für Wissens-Use-Cases
Integration in CRM, Postfach, Wiki, Slack/Teams
Guard-Rails: Konfidenz-Schwellen, Quellen, Eskalation
Pilotphase im Schattenbetrieb mit Qualitätsmessung
Cost-Logging pro 1000 Vorgänge — transparent
Schulung der Mitarbeiter:innen für den Live-Betrieb
Optional: Sparringspartner für Weiterentwicklung

Erster Agent live in 3–8 Wochen

Bereit für eine echte Pilotphase mit Schattenbetrieb statt Demo-Theater?

Pilot-Setup anfragen

Zusammenarbeit

So arbeiten wir zusammen.

Drei Modelle, je nach Bedarf — vom einmaligen Scoping bis zur laufenden Begleitung als Agent-Sparringspartner. Kein Pauschalpreis von der Stange. Nach einem kurzen Erstgespräch bekommt ihr ein konkretes, unverbindliches Angebot.

Agent-Scoping

Einmaliges Projekt

Use-Case-Schärfung & Spezifikation
Datenzugriff prüfen
Modell- & Tool-Empfehlung
Aufwands- & Kostenschätzung

Häufig gewählt

Custom-Agent Build

Projektbasis

Scoping inklusive
Bau eines produktiven Agents
Integration in eure Systeme
Guard-Rails & Schattenbetrieb
Schulung & Übergabe

Agent-Sparringspartner

Monatliche Begleitung

Weiterentwicklung & neue Use-Cases
Modell- & Tool-Updates
Monitoring & Qualitätsmessung
Direkter Draht zu Skalator

Welches Modell zu euch passt, klären wir im Erstgespräch — inklusive transparenter, unverbindlicher Aufwandsschätzung.

Unverbindliches Angebot anfragen

FAQ

Häufige Fragen zu AI-Agents

Was ist ein AI-Agent — und was unterscheidet ihn von ChatGPT?

ChatGPT (oder Claude.ai) ist ein Chat-Interface: Mensch tippt, Modell antwortet, Ende. Ein AI-Agent ist ein laufendes System: Es bekommt einen Auftrag, plant Schritte, ruft Tools auf (Web-Suche, API, Datenbank, E-Mail), liest Ergebnisse, entscheidet weiter, schreibt Zwischenstände in ein Gedächtnis und liefert am Ende ein konkretes Ergebnis ab — z. B. eine recherchierte Lead-Liste, einen Antwort-Entwurf oder ein ausgefülltes Formular. Das Modell ist nur eine Komponente. Drumherum liegen Code, Tools, Memory und Guard-Rails. Genau das bauen wir.

Welches LLM verwendet ihr — Claude oder GPT?

Beides — pro Agent passend gewählt. Anthropic Claude (Sonnet, Opus) für lange Kontexte, robuste Tool-Aufrufe, vorsichtige Antworten und kritische Sachbearbeitung. OpenAI GPT (4.1, GPT-5) für schnelle, breit verfügbare Use-Cases und Function-Calling. Wo es passt, auch lokale Modelle (Llama, Mistral, Qwen) via vLLM oder Ollama für sensible Daten. Modellwahl ist ein technisches Detail, kein Glaubensbekenntnis — wir wählen pro Use-Case nach Qualität, Kosten und Datenschutz.

Was ist mit Datenschutz, DSGVO und sensiblen Daten?

Realistisch betrachtet: Drei Optionen. a) EU-Hosting mit Auftragsverarbeitung — Anthropic mit EU-Endpoint, Azure OpenAI in EU-Regionen, dazu AVV und technisch-organisatorische Maßnahmen. b) Self-Hosted Open-Source-Modelle für Daten, die das Haus nicht verlassen dürfen. c) Hybrid: sensible Felder werden lokal anonymisiert, nur Platzhalter gehen ans LLM. Pseudonymisierung, Logging, Rollen-Trennung und Löschkonzept sind Teil jedes Agent-Setups. Welche Option passt, klären wir vor Implementierung — nicht hinterher.

Was kostet so ein Agent im laufenden Betrieb?

Die ehrliche Antwort: Kommt aufs Volumen und Modell an, aber die Betriebskosten sind oft kleiner als gedacht. Ein Mail-Triage-Agent für ein mittleres Postfach kostet pro Monat im API-Verbrauch typischerweise im niedrigen zwei- bis dreistelligen Bereich. Sales-Recherche-Agents kosten pro recherchiertem Account ein paar Cent bis wenige Euro — abhängig davon, wie tief recherchiert wird und welche Quellen genutzt werden. Wir liefern vor dem Bau eine konkrete Kostenschätzung pro 1000 Vorgänge und bauen Cost-Logging direkt ein, damit ihr es jederzeit nachvollziehen könnt.

Wie lange dauert es, einen Agent zu bauen?

Ein erster produktiver Agent — also einer, der echte Arbeit übernimmt und nicht nur ein Demo ist — braucht typischerweise 3 bis 8 Wochen. Davon sind die ersten 1–2 Wochen Use-Case-Schärfung und Datenzugriff, danach 2–4 Wochen Bau und Test mit echten Beispielen, dann eine Pilotphase im Schattenbetrieb (Agent läuft mit, Mensch entscheidet final), und am Ende der Wechsel in den Produktivbetrieb mit klar definierter Rolle. Schneller geht oft, aber nicht immer sauber. Wir sagen vorher ehrlich, was realistisch ist.

Was ist mit Halluzinationen und Fehlern?

Halluzinationen sind nicht weg — auch 2026 nicht. Sprachmodelle erfinden manchmal Inhalte, die plausibel klingen, aber falsch sind. Genau deshalb bauen wir Agents mit Guard-Rails: a) Tool-Use statt freie Erfindung — der Agent liest aus echten Quellen, statt zu raten. b) Zitate und Quellverweise sind Pflichtfelder für RAG-Antworten. c) Konfidenz-Schwellen: bei niedriger Sicherheit übergibt der Agent an Menschen. d) Schattenbetrieb in den ersten Wochen — der Agent schlägt vor, Mensch entscheidet. Erst wenn die Qualitätsmessung passt, geht er in den Vollbetrieb. Wer behauptet, sein AI-Agent halluziniert nicht, lügt oder hat keine Vorgänge gemessen.

Wie läuft die Zusammenarbeit mit Skalator?

Erstgespräch (30 Min, kostenlos): Wir verstehen den Use-Case, die Datenlage und das gewünschte Ergebnis. Danach gibt es ein konkretes, unverbindliches Angebot. Dann: Use-Case-Schärfung mit klarem Erfolgskriterium, Bau eines ersten Agents mit echten Beispielen, Pilotphase im Schattenbetrieb, Übergang in den Produktivbetrieb. Optional bleiben wir als Sparringspartner an Bord — Modelle ändern sich, Use-Cases erweitern sich, Tools werden besser. Keine 12-Monats-Mindestlaufzeit. Wenn wir keinen Wert liefern, sollt ihr aussteigen können.

Nächster Schritt

Lasst uns 30 Minuten auf einen konkreten Use-Case schauen — wir sagen ehrlich, ob sich dafür ein Custom-Agent lohnt oder ob ein einfacheres Werkzeug schneller zum Ziel führt.

Kostenloses Agent-Erstgespräch buchen

AI Agents, dieechte Arbeit übernehmen. Nicht nur Chat.

Vier Dinge, die "AI-Agent"-Anbieter selten ehrlich aussprechen.

Ein ChatGPT-Wrapper reicht nicht

Agent = LLM + Code + Tools + Memory

Use-Case-getrieben, nicht Demo-Spielzeug

Integriert in echte Workflows

Agenten, die echte Arbeit übernehmen statt nur zu antworten

Sechs Custom-Agents, die in echten Mittelstands-Workflows arbeiten.

Sales-Recherche-Agent

Mail-Triage- & Antwort-Vorschlag-Agent

Wissens-RAG-Agent

Lead-Scoring-Agent

Content-Recherche- & Entwurfs-Agent

Sachbearbeitungs-Agent

Wie ein Skalator-Agent gebaut ist.

Guard-Rails

Memory & RAG

Tool-Layer

LLM-Layer

Vom Scoping zum produktiven Agent.

Use-Case-Schärfung

Bau mit echten Beispielen

Schattenbetrieb mit Messung

Produktivbetrieb & Begleitung

Im Leistungsumfang

So arbeiten wir zusammen.

Agent-Scoping

Custom-Agent Build

Agent-Sparringspartner

Häufige Fragen zu AI-Agents

AI Agents, die
echte Arbeit übernehmen.
Nicht nur Chat.