Was kann Sprach-KI im Handwerk wirklich?
„Sprach-KI im Handwerk" — das hört sich 2026 spannend an, aber was steckt wirklich dahinter? Die letzten zwei Jahre haben im deutschsprachigen Markt eine Welle neuer Anbieter hervorgebracht, die mit KI-Versprechen den Handwerksalltag vereinfachen wollen. Doch kaum ein Begriff wird so inflationär verwendet — und so wenig präzise definiert — wie „Sprach-KI".
Dieser Artikel ist eine ehrliche Marktübersicht: Welche Kategorien von Sprach-KI gibt es wirklich? Was können sie, was können sie nicht? Und welcher Anbieter passt zu welchem Use Case?
Wir sind selbst Anbieter einer spezialisierten Lösung (Angebotsmeister) — aber in diesem Artikel erklären wir den gesamten Markt, weil die Kategorisierung noch niemand sauber gemacht hat. Wenn du als Handwerksbetrieb verstehen willst, was du mit Sprach-KI realistisch machen kannst, findest du hier die erste Einordnung.
Die drei Kategorien von Sprach-KI im Handwerk
Der Markt hat sich 2025/2026 in drei klar unterscheidbare Kategorien aufgeteilt, die unterschiedliche Probleme lösen und völlig unterschiedliche Zielgruppen adressieren. Ohne diese Unterscheidung redet man aneinander vorbei.
| Kategorie | Was macht sie? | Beispiel-Anbieter | Preis (grob) |
|---|---|---|---|
| Voice-to-Docs | Sprache → Baudokumentation, Aufmass, Mängel, Fotoprotokolle | Benetics, ToolTime | 49–120 € / User / Monat |
| Voice-Phone-AI | KI-Telefonassistent nimmt Kundenanrufe entgegen | Meisterwerk, VoiceGPT Handwerk | 149–450 € / Monat |
| Voice-to-Quote | Sprache → strukturiertes Angebot (Positionen, Preise, PDF) | Angebotsmeister, wenige kleine Wettbewerber | 39–89 € / User / Monat |
Diese drei Kategorien konkurrieren nicht miteinander — sie ergänzen sich. Ein moderner Handwerksbetrieb kann durchaus alle drei gleichzeitig einsetzen: Voice-Phone-AI für die Kundenhotline, Voice-to-Docs für die Baustellendokumentation, Voice-to-Quote für die Angebotserstellung.
Kategorie 1: Voice-to-Docs (Sprache → Baudokumentation)
Das älteste Segment, klar definiert: Der Handwerker spricht auf der Baustelle in sein Smartphone und das Gesprochene landet als strukturierte Dokumentation im System — meist als Baustellentagebuch, Mängelbericht oder Aufmass.
Was Voice-to-Docs kann
- Baustellentagebuch mit Spracheingabe: „8:30 Uhr, Fliesenleger Müller ist da, hat mit dem Verlegen im Bad angefangen" wird automatisch als Tagebuch-Eintrag gespeichert
- Mängelprotokolle: „Im ersten Stock rechts vom Treppenhaus, Wand zwischen Küche und Wohnzimmer, 5 cm langer Riss auf Höhe der Steckdose" wird mit Foto in die Mängelliste übernommen
- Aufmass vor Ort: „Länge 4,20, Breite 3,10, Höhe 2,60" wird als Flächenberechnung ausgegeben
- Fotoprotokolle: Foto + Sprachkommentar zur Qualitätssicherung
Welche Anbieter spielen hier?
Benetics (Österreich) — Der Marktführer im deutschsprachigen Raum für digitale Baudokumentation. Sehr stark im B2B-Sektor, oft bei größeren Betrieben und Generalunternehmern im Einsatz. Die Sprachfunktion ist eine von vielen Features — das Produkt kann auch Rapporte, Arbeitszeiten, Pläne und mehr.
ToolTime (Deutschland) — Vergleichbarer Funktionsumfang mit Fokus auf kleine bis mittlere Handwerksbetriebe. Etwas modernere App, etwas teurer. Voice-Features sind eher eine Ergänzung als das Kernfeature.
NEVARIS (Nemetschek) — Enterprise-Lösung für Generalunternehmer und große Bauunternehmen. Voice ist Randfeature.
Was Voice-to-Docs nicht kann
- Keine Angebote erstellen — Dokumentation ist kein Angebot. Wenn du „5 qm Wände streichen" diktierst, wird das als Text gespeichert, nicht als Angebotsposition mit Preis.
- Keine komplexen Positionen strukturieren — „Wände in Q3-Qualität spachteln, 2x weiß streichen, Türzargen lackieren" wird als Fließtext aufgenommen, nicht als 3 separate Positionen mit Einzelpreisen.
- Kein Kundenportal — Die Dokumentation bleibt intern.
Für wen lohnt sich Voice-to-Docs?
Ideal für: Generalunternehmer, mittlere bis große Handwerksbetriebe (10+ Mitarbeiter), Betriebe mit regelmäßiger Baustellendokumentation für Gewährleistung oder Gerichtsfälle, Firmen mit festen Projektstrukturen.
Weniger geeignet für: Ein-Mann-Betriebe, kleine Handwerker, die hauptsächlich Angebote schreiben wollen, Betriebe ohne festes Dokumentationsritual.
Kategorie 2: Voice-Phone-AI (KI-Telefonassistent)
Die jüngste Kategorie, erst 2024/2025 richtig auf den Markt gekommen. Die Idee: Statt dass der Chef oder der Meister zwischen zwei Baustellen das Telefon abnimmt, spricht ein KI-Assistent mit dem anrufenden Kunden — nimmt das Anliegen auf, terminiert Termine, liefert Grundinformationen oder schickt Anfragen als E-Mail weiter.
Was Voice-Phone-AI kann
- Anrufe entgegennehmen rund um die Uhr, auch außerhalb der Geschäftszeiten
- Kundenanliegen strukturieren („Heizung ausgefallen, kein Warmwasser, Dringlichkeit hoch")
- Termine vereinbaren mit automatischem Kalender-Abgleich
- Rückrufanfragen dokumentieren mit Priorität und Kategorie
- Basisfragen beantworten („Öffnungszeiten", „Adresse", „machen Sie auch Notdienst")
Welche Anbieter spielen hier?
Meisterwerk (Deutschland) — Pionier in Deutschland für KI-Telefonassistenten im Handwerk. Starke Integration mit bestehenden Handwerker-Tools, deutschsprachige Sprachmodelle, Fokus auf Anruf-Qualifizierung und Termin-Vereinbarung.
VoiceGPT Handwerk / Dialog.team / Verschiedene Startups — 2025/2026 sind mehrere kleine Anbieter auf den Markt gekommen, oft mit internationalen Plattformen (z. B. ElevenLabs, Vapi.ai) als technischer Grundlage. Qualität schwankt erheblich.
Was Voice-Phone-AI nicht kann
- Kein Angebot schreiben — Ein Telefonassistent nimmt Anfragen auf, erstellt aber keine Angebote mit Positionen und Preisen
- Keine Bauberatung ersetzen — Wenn ein Kunde „was kostet eine Badsanierung" fragt, wird die KI allgemein antworten, nicht dein persönliches Angebot machen
- Keine komplexen Aufträge managen — Für einfache Termine und Anfragen gut, für komplexe Verhandlungen weiterhin auf menschliches Gespräch angewiesen
Für wen lohnt sich Voice-Phone-AI?
Ideal für: Handwerksbetriebe mit hohem Anrufaufkommen (Notdienst, SHK, Elektro), Betriebe die viele Anfragen außerhalb der Geschäftszeiten erhalten, mittelgroße Betriebe (5–30 Mitarbeiter) ohne eigene Sekretariatskraft.
Weniger geeignet für: Ein-Mann-Betriebe mit persönlicher Kundenbindung, kleine Maler- oder Bodenlegerbetriebe mit vorhersehbarem Anrufvolumen, Betriebe die ihren Kunden keine KI als Erstkontakt zumuten wollen.
Kategorie 3: Voice-to-Quote (Sprache → strukturiertes Angebot)
Die jüngste, am stärksten spezialisierte Kategorie — und die, in der wir selbst spielen. Die Idee: Der Handwerker steht auf der Baustelle, spricht den Auftrag ein, und die KI erstellt automatisch ein strukturiertes Angebot mit Positionen, Mengen, Fachbegriffen und (bei guter Lösung) auch Preisempfehlungen.
Was Voice-to-Quote kann
- Gesprochenes in Angebots-Positionen umwandeln: „Drei Zimmer streichen, Wände und Decken, Raufaser ist vorhanden, Türen bleiben wie sie sind" → 8–12 strukturierte Positionen im Angebot
- Professionelle Leistungsbeschreibungen: Aus „Wand abschleifen und streichen" wird automatisch „Wandflächen sorgfältig anschleifen, Untergrund von losen Teilen befreien und mit Dispersionsfarbe Klasse 2 zweifach streichen"
- Mengenangaben realistisch schätzen: „drei Zimmer" → Flächenberechnung auf Basis typischer Raumgrößen
- Preisempfehlungen: Bei intelligenten Lösungen mit Lernfähigkeit werden frühere Auftragspreise als Vorschlag eingeblendet
- Direkter PDF-Export: Aus Sprache wird in wenigen Minuten ein versendbares Angebots-PDF
Welche Anbieter spielen hier?
Angebotsmeister (unser Produkt) — Spezialisiert auf Voice-to-Quote für Handwerker, mit KI-Preisempfehlungen aus deiner eigenen Historie, Kundenportal mit Annahme und Rückfragen, WhatsApp-Versand, Projektmanagement und Abnahmeprotokoll. Per-Gewerk optimierte KI-Prompts für Maler, SHK, Elektro, Tischler, Trockenbau, Bodenleger.
Craftboxx / Plancraft (mit Voice-Erweiterungen) — Etablierte Handwerkersoftwares, die 2025 Voice-Features als Add-on eingeführt haben. Voice ist nicht das Kernfeature, sondern eines unter vielen — entsprechend unterschiedlich in Tiefe und Qualität.
Einzelne kleine Startups — Es gibt eine Handvoll kleiner Wettbewerber, die sich auf einen spezifischen Use Case konzentrieren (z. B. nur Maler, nur SHK). Die meisten sind 2025 gestartet und haben sehr geringe Nutzerzahlen.
Was Voice-to-Quote nicht kann
- Kein Ersatz für Fachwissen: Die KI weiß nicht, ob du als Geselle oder Meister kalkulierst, ob die Wände wirklich gerade sind oder nicht. Du musst die Positionen immer überprüfen und bei Bedarf anpassen.
- Keine Baugenehmigung, kein Statik-Check: Voice-to-Quote ist eine Kalkulations-Hilfe, keine Beratung.
- Nicht für komplexe Ausschreibungen: Für öffentliche Ausschreibungen mit Hunderten von Positionen nach Leistungsverzeichnis ist Voice nicht das richtige Tool — da greifst du auf klassische AVA-Software zurück.
Für wen lohnt sich Voice-to-Quote?
Ideal für: Ein-Mann-Betriebe und kleine Handwerksbetriebe (1–10 Mitarbeiter), Betriebe die viele kleine bis mittlere Aufträge schreiben, Handwerker die lieber auf der Baustelle arbeiten als im Büro am Laptop sitzen, Betriebe mit Mobilgerät-zentrischem Arbeitsalltag.
Weniger geeignet für: Generalunternehmer mit hunderten von LV-Positionen, Betriebe die ausschließlich Rahmenverträge abarbeiten, Firmen ohne Smartphone-Nutzung.
Welche Sprach-KI passt zu welchem Betrieb?
Ein paar Profile, die sich in unserer Praxis herauskristallisiert haben:
Profil 1: Der Ein-Mann-Maler mit 120 Aufträgen pro Jahr
Problem: Nach dem Feierabend noch 2 Stunden Angebote schreiben im Büro Lösung: Voice-to-Quote. Voice-Phone-AI ist überdimensioniert, Voice-to-Docs löst das Problem nicht.
Profil 2: Der SHK-Betrieb mit 8 Mitarbeitern und 30 Anrufen pro Tag
Problem: Sekretariat ist überlastet, Anfragen außerhalb der Bürozeiten gehen verloren Lösung: Voice-Phone-AI als Erstkontakt + Voice-to-Quote für die Angebotsbearbeitung
Profil 3: Der Bauleiter im Generalunternehmen mit 5 parallelen Baustellen
Problem: Baustellentagebuch, Mängel, Fortschrittsdokumentation für alle 5 Projekte parallel Lösung: Voice-to-Docs ist klar das Mittel der Wahl
Profil 4: Der mittelständische Handwerksbetrieb mit 20 Mitarbeitern
Problem: Alles gleichzeitig — Angebote, Dokumentation, Kundenanfragen Lösung: Kombination. Voice-to-Quote für den Chef und Meister (schnelle Angebote), Voice-to-Docs für die Bauleiter, ggf. Voice-Phone-AI für das Sekretariat
Preise im Vergleich 2026
Ein kurzer Marktüberblick, weil Transparenz in dem Segment noch nicht üblich ist:
| Kategorie | Einstiegspreis | Mittelsegment | Premium |
|---|---|---|---|
| Voice-to-Docs | 49 € / User / Monat | 79–99 € | 120–200 € + Setup |
| Voice-Phone-AI | 149 € / Monat | 250–350 € | 450–900 € + Setup |
| Voice-to-Quote | 39 € / User / Monat | 49–89 € | 99–149 € |
Voice-to-Quote ist preislich am günstigsten, weil der Use Case schmaler ist (eine Kernfunktion) und die Anbieter tendenziell kleinere Startups mit direktem Kundenkontakt sind. Voice-Phone-AI ist am teuersten, weil die Laufzeitkosten (Telefon-Terminierung, KI-Infrastruktur pro Anruf) höher sind.
Worauf du bei der Auswahl achten solltest
1. Deutsche Sprachmodelle vs. Übersetzung. Manche Anbieter nutzen englische Basis-Modelle mit deutscher Oberfläche — das führt zu Missverständnissen bei Fachbegriffen. Gute Lösungen haben deutsches Sprachmodell und deutsche Fachvokabulare.
2. Offline-Fähigkeit. Auf vielen Baustellen ist kein Internet. Funktioniert die App ohne Verbindung, oder musst du jedes Wort live streamen?
3. Datenschutz und DSGVO. Sprachdaten sind personenbezogen. Wo werden sie gespeichert? Wie lange? Nutzt der Anbieter OpenAI oder hosted er selbst?
4. Integration in vorhandene Tools. Wenn du schon Lexware, DATEV oder ein Handwerker-ERP hast, prüfe die Anbindungen. Sonst landest du in Datensilos.
5. Lernfähigkeit. Ein gutes Voice-to-Quote-Tool lernt aus deinen vergangenen Angeboten und schlägt dir Preise vor. Ein schlechtes generiert jedes Mal leere Positionen.
6. Kostenlose Testphase. Jeder seriöse Anbieter im Markt hat eine Testphase. Wer keine anbietet oder sofort 12-Monats-Verträge will, ist suspekt.
Die Wahrheit über KI-Versprechen im Handwerk 2026
Sprach-KI wird 2026 oft mit Marketing-Versprechen verkauft, die der Realität nicht standhalten:
„Die KI schreibt Angebote völlig automatisch, ohne dass du noch hinschauen musst." → Falsch. Jede seriöse Lösung erzeugt einen Vorschlag, den du prüfen und anpassen musst. Wer das Gegenteil verspricht, lügt oder ist verantwortungslos.
„Die KI kann Kundenverhandlungen übernehmen." → Auf absehbare Zeit nein. Komplexe Preisgespräche, Einwandbehandlung und Vertrauensaufbau sind weiterhin menschliche Aufgaben.
„Unsere KI versteht jeden Dialekt perfekt." → Teilweise richtig, teilweise Marketing. Süddeutsche Dialekte und starker österreichischer oder schweizerischer Einschlag stellen viele Sprachmodelle noch vor Herausforderungen. Teste das vor Kaufentscheidung.
„Mit unserer KI brauchst du kein Fachwissen mehr." → Absolut falsch. KI ist ein Hilfsmittel für Fachkräfte, kein Ersatz für sie. Wer kein Fachwissen hat, kann auch mit KI-Unterstützung keine guten Angebote schreiben.
Unser ehrliches Fazit
Sprach-KI im Handwerk ist 2026 kein Hype mehr, sondern gelebte Praxis — aber nur in bestimmten, gut definierten Use Cases. Die Kategorien sind unterschiedlich reif:
- Voice-to-Docs ist das reifste Segment. Anbieter etabliert, Technologie funktioniert, Business Cases klar.
- Voice-Phone-AI ist in der Breakout-Phase. Funktioniert gut, wird 2026/2027 stark wachsen, hat aber noch Akzeptanzfragen bei Endkunden.
- Voice-to-Quote ist das am meisten unterschätzte Segment — weil es der älteste und zugleich direkteste Produktivitätsgewinn für den einzelnen Handwerker ist. Wer 2 Stunden pro Tag Angebote schreibt, spart mit Voice-to-Quote 60–80 % dieser Zeit.
Wer 2026 überlegt, in Sprach-KI zu investieren, sollte zuerst den eigenen Pain Point definieren und dann die passende Kategorie wählen — nicht umgekehrt. Die drei Kategorien sind nicht austauschbar. Ein Voice-to-Docs-Tool wird dir kein Angebot schreiben, und ein Voice-to-Quote-Tool wird dein Telefon nicht entlasten.
Wenn dein größter Zeitfresser die Angebotserstellung ist — und das trifft auf etwa 70 % aller Ein-Mann- und Kleinbetriebe im Handwerk zu —, dann ist Voice-to-Quote der richtige Einstieg. Das ist der Use Case, für den Angebotsmeister gebaut ist.
FAQ: Häufige Fragen zu Sprach-KI im Handwerk
Funktioniert Sprach-KI auch ohne Internetverbindung?
Unterschiedlich je nach Anbieter. Die meisten Lösungen brauchen eine aktive Verbindung, weil die KI-Verarbeitung in der Cloud läuft. Einige Voice-to-Quote-Tools (inklusive Angebotsmeister) erlauben Aufnahme offline und verarbeiten erst beim nächsten Netz-Kontakt. Für Voice-Phone-AI geht das prinzipbedingt nicht.
Sind Sprach-Daten meiner Kunden sicher?
Bei seriösen deutschen Anbietern: Ja, DSGVO-konform. Die Daten werden in EU-Rechenzentren verarbeitet, nicht dauerhaft gespeichert, und mit Auftragsverarbeitungsverträgen (AVV) rechtlich abgesichert. Bei internationalen Anbietern ohne deutsche Niederlassung solltest du genau prüfen — viele nutzen OpenAI oder Google-Dienste mit US-Datenverarbeitung.
Welcher Dialekt wird am besten verstanden?
Hochdeutsch funktioniert überall zuverlässig. Bayerisch, Schwäbisch, Fränkisch, Kölsch und Berlinerisch werden von modernen Modellen meist gut erkannt. Schweizerdeutsch ist noch die größte Herausforderung — wer aus der Schweiz ist, sollte einen Test durchführen bevor er sich festlegt. Österreichisches Deutsch liegt zwischen Hochdeutsch und Schweizerdeutsch in der Erkennungsgenauigkeit.
Was kostet Voice-to-Quote-Software 2026?
Die Preisspanne liegt zwischen 39 € und 149 € pro Nutzer und Monat, je nach Umfang. Angebotsmeister startet bei 39 €/Monat im Geselle-Tarif mit 200 AI-Angeboten inklusive. Der Markt ist preislich noch in Bewegung — 2026 werden die meisten Anbieter zwischen 40 und 90 € liegen.
Kann Sprach-KI Handwerker ersetzen?
Nein. Sprach-KI ist ein Produktivitätswerkzeug, kein Ersatz für Fachwissen, Handwerkskunst oder Kundenbeziehung. Die Zeit, die du durch Sprach-KI sparst, wird idealerweise in mehr Baustellen, bessere Qualität oder kürzere Bearbeitungszeiten reinvestiert — nicht in „weniger arbeiten mit weniger Wissen".
Welche Kategorie ist 2026 am schnellsten wachsend?
Voice-to-Quote wächst 2026 am schnellsten, weil der Business Case für kleine und mittlere Betriebe direkt nachvollziehbar ist: „2 Stunden am Tag weniger Büroarbeit = 10 Stunden pro Woche = ein Werktag mehr für bezahlte Arbeit". Voice-Phone-AI wächst zweitstärkster, Voice-to-Docs bleibt stabil mit etablierten Playern.