Tech & Trends „Welches KI-Tool soll ich nutzen?“ – die häufigste Frage im Mittelstand. Und fast immer die falsche.

„Welches KI-Tool soll ich nutzen?“ – die häufigste Frage im Mittelstand. Und fast immer die falsche.

Jede Woche führe ich Gespräche mit Geschäftsführern, Teamleitern und Unternehmern, die KI endlich ernsthaft angehen wollen. Fast alle stellen dieselbe Frage: „Welches KI-Tool soll ich eigentlich nutzen?“

Und fast alle meinen damit dasselbe: Soll ich ChatGPT bezahlen? Oder lieber Claude? Ist Gemini eigentlich auch gut?

Das ist die falsche Frage. Nicht weil sie dumm ist, sondern weil sie ein Missverständnis verbirgt, das die meisten KMU teuer zu stehen kommt. Sie optimieren für das Tool, während der echte Unterschied woanders liegt.

Drei Dinge, die fast niemand auseinanderhält

Wer KI produktiv einsetzen will, muss drei Dinge getrennt denken: Modell, App und Harness.

Das Modell ist das KI-Gehirn: Claude Opus, GPT-5 Thinking, Gemini Pro. Es bestimmt, wie intelligent das System ist, wie gut es schreibt, rechnet, analysiert. Das ist das, worüber die Benchmarks streiten und die Tech-Journalisten berichten.

Die App ist das Produkt, das du anfasst. Die Website, die mobile App, das Chatfenster. claude.ai, chatgpt.com, das Gemini-Icon auf deinem Homescreen.

Der Harness ist das Unsichtbare dazwischen, und das Entscheidende. Er definiert, welche Werkzeuge das Modell benutzen darf, welche Daten es sehen kann, welche Aufgaben es selbstständig erledigen darf. Ein Harness verbindet ein Sprachmodell mit deiner Welt: deinen Dateien, deinem Browser, deinen Systemen, deinen Prozessen.

Das Modell ist die Hardware. Der Harness ist das Betriebssystem.

Und die meisten KMU kaufen Grafikkarten, aber installieren kein OS.

Was das in der Praxis bedeutet

Dasselbe Modell verhält sich vollkommen unterschiedlich, je nachdem wo und wie es eingesetzt wird. Nehmen wir Claude Opus 4.6, aktuell das stärkste Modell von Anthropic.

Claude im Chatfenster von claude.ai: Du tippst, es antwortet. Ein sehr kluger Gesprächspartner. Gut für Textentwürfe, Recherchefragen, Brainstorming.

Claude in Claude Cowork: Du beschreibst ein Ergebnis, das Tool öffnet deinen Browser, liest deine Dateien, baut dir ein Dokument zusammen, exportiert es und schickt dir eine Zusammenfassung. Du schaust zu oder machst etwas anderes.

Claude in Claude Code: Du gibst einen Auftrag, die KI arbeitet selbstständig bis zu mehreren Stunden, testet ihre eigenen Ergebnisse, korrigiert Fehler und übergibt dir ein fertiges Produkt.

Gleiches Modell. Komplett andere Erfahrung. Der Unterschied ist der Harness.

Das gilt auch für die anderen Systeme. GPT-5 Thinking mit aktivierter Websuche, Code-Ausführung und einem gut konfigurierten System-Prompt ist ein anderes Werkzeug als GPT-5 im Gratis-Chatfenster. NotebookLM von Google ist kein Chatbot, sondern ein Wissensarchiv, das du befragen kannst, das Podcasts generiert, Zusammenfassungen baut und Quellen verknüpft.

Wer nicht zwischen Modell, App und Harness unterscheidet, kauft sich einen Sportwagen und fährt nur im zweiten Gang.

Die Frage, die du stattdessen stellen solltest

Nicht: „Welches Tool ist das Beste?“

Sondern: „Welche Aufgabe kostet mein Team täglich die meiste Zeit, und was bräuchte eine KI, um genau diese Aufgabe zu übernehmen?“

Das ist der Einstiegspunkt, der wirklich funktioniert. Nicht die Tool-Evaluation. Nicht die KI-Strategie auf 40 Seiten. Nicht das Pilotprojekt ohne Prozessanbindung.

Ein Beispiel: Eine Marketingabteilung eines mittelständischen B2B-Unternehmens, die jeden Monat dieselbe Aufgabe neu von Hand erledigt hat. Wettbewerber beobachten, Neuigkeiten zusammenfassen, daraus Social-Media-Posts und einen Newsletter-Absatz bauen. Drei bis vier Stunden Arbeit, jeden Monat. Die Lösung war kein neues Tool. Es war ein Harness: ein konfiguriertes System, das relevante Quellen automatisch überwacht, Zusammenfassungen generiert und daraus direkt verwendbare Entwürfe für verschiedene Kanäle baut, die ein Mitarbeiter noch einmal durchschaut und freigibt. Die Zeitersparnis: über 80 Prozent. Das Modell dahinter ist Claude. Der Harness: eine Kombination aus Make und einem strukturierten Prompt-System. Gesamtaufwand für den Aufbau: ein halber Tag.

Das ist kein Einzelfall. Es ist das Muster hinter jedem KI-Projekt, das im KMU-Alltag wirklich Wirkung entfaltet.

Was die erfolgreichen 20 Prozent anders machen

Aktuelle Zahlen zeigen ein klares Bild. Laut einer Studie von IW Köln weisen 76 Prozent der KI-nutzenden KMU eine positive Nettoumsatzrendite auf, gegenüber 46 Prozent bei KMU, die KI nicht nutzen. Gleichzeitig haben laut bidt.digital bisher erst 9 Prozent der deutschen Mittelständler KI vollständig implementiert. Eine repräsentative Befragung der Hochschule Karlsruhe von 517 Unternehmen zeigt: 83 Prozent haben keine KI-Strategie. Die Lücke zwischen diesen Zahlen ist nicht durch fehlendes Interesse erklärbar. Sie ist durch falsche Einstiegspunkte erklärbar.

Die 20 Prozent, die schnell echte Ergebnisse sehen, machen drei Dinge anders:

Sie starten mit einem konkreten Zeitfresser, nicht mit einer Strategie. Sie identifizieren eine Aufgabe mit hohem Volumen, klarem Output und überschaubarem Risiko. Support-Triage. Angebotsvorbereitung. Dokumentenauswertung. Terminfindung.

Sie wählen den Harness passend zur Aufgabe, nicht das Modell mit den besten Benchmarks. Für eine einfache E-Mail-Klassifikation braucht niemand das leistungsstärkste Modell. Für komplexe Auswertungen aus Dutzenden PDFs schon.

Und sie evaluieren mit Domänenwissen, nicht mit Tech-Affinität. Wer 15 Jahre Erfahrung in der Qualitätssicherung hat, erkennt sofort, wenn eine KI-Zusammenfassung an der falschen Stelle unscharf ist. Genau diese Menschen sind die besten KI-Nutzer. Nicht die Jüngsten im Team, nicht die Digitalaffinen, sondern die Erfahrensten.

Was das für dein KMU bedeutet

Die gute Nachricht: Du brauchst wahrscheinlich kein neues Tool. Du brauchst einen besseren Harness für ein Tool, das du möglicherweise schon hast.

Fang mit einer einzigen Aufgabe an. Wähle eine, die täglich oder wöchentlich vorkommt, einen klar definierten Output hat und bei der ein Fehler kontrollierbar ist. Konfiguriere den Harness für genau diese Aufgabe. Miss die Zeit vorher und nachher. Dann entscheide, ob du weitermachst.

Wer so vorgeht, spart sich die endlose Tool-Evaluation, die Strategieprojekte ohne Umsetzung und die Enttäuschung nach dem ersten Chatbot, der nicht funktioniert hat.

Und wer das dreimal gemacht hat, versteht instinktiv, was Modell, App und Harness bedeuten, und warum die Frage „Welches KI-Tool soll ich nutzen?“ die falsche war.

Jens Polomski ist Gründer von snipKI, einem der führenden KI-Enablement-Unternehmen für den Mittelstand, LinkedIn Top Voice, Host des newminds.ai Podcasts und Autor des wöchentlichen KI-Newsletters mit über 45.000 Abonnenten.

Das könnte dich auch interessieren