AI on Demand powered by OpenAI

Whisper Large V3 von OpenAI: das weltweit meistgenutzte Open-Source-Modell für automatische Spracherkennung, trainiert auf über 5 Millionen Stunden Audiomaterial. Rund 100 Sprachen, robust bei Akzenten und Fachsprache — betrieben von stepping stone auf Schweizer Infrastruktur.

Whisper Large V3 von OpenAI ist das weltweit am häufigsten eingesetzte Modell für automatische Spracherkennung. Es transkribiert gesprochene Sprache in Text — zuverlässig, in rund 100 Sprachen und mit Unterstützung für Zeitstempel auf Wort- und Satzebene. Zusätzlich übersetzt Whisper gesprochene Sprache direkt ins Englische.

Das Modell wurde auf über 5 Millionen Stunden Audiomaterial trainiert und ist besonders robust gegenüber Hintergrundgeräuschen, Akzenten und Fachsprache. stepping stone betreibt Whisper Large V3 vollständig auf Schweizer Infrastruktur — Ihre Audiodaten bleiben in der Schweiz.

Unternehmen und Organisationen, die Audioinhalte in Text umwandeln wollen — ohne Daten an US-Cloud-Dienste zu übergeben. Besonders geeignet für mehrsprachige Umgebungen und überall dort, wo präzise Transkription in grossem Umfang gefragt ist.

Typische Einsatzbereiche: Transkription von Meetings, Interviews und Kundengesprächen, Untertitelung von Videos und Mediendateien, automatische Übersetzung gesprochener Inhalte ins Englische, Barrierefreiheit durch Sprache-zu-Text in Anwendungen und Plattformen.

Open Source (Apache 2.0). Schweizer Rechenzentren. Keine Daten bei US-Anbietern.

Das weltweit meistgenutzte ASR-Modell — erprobt in tausenden Produktionsumgebungen. Rund 100 Sprachen, robust bei Hintergrundgeräuschen und Akzenten. Zeitstempel auf Wort- und Satzebene für präzise Zuordnung. Persönliche Beratung und Betrieb durch stepping stone aus Bern.

Leistungsumfang

Spracherkennung auf Abruf

Zugriff auf Whisper Large V3 für Transkription und Übersetzung von Audiodateien. Rund 100 Sprachen mit automatischer Spracherkennung und optionalen Zeitstempeln auf Wort- oder Satzebene.

GPU-Leistung nach Bedarf

Skalierbare Rechenleistung für einzelne Aufnahmen oder grosse Audioarchive. Von der Einzeltranskription bis zur Massenverarbeitung — Sie zahlen nach Verbrauch.

Betreuter Betrieb

Bereitstellung, Monitoring, Wartung und Support auf Schweizer Infrastruktur mit persönlicher Beratung. stepping stone kümmert sich um den Betrieb, damit Sie sich auf den Nutzen konzentrieren können.

Einsatzgebiete

Transkription

Whisper Large V3 ist der Industriestandard für automatische Spracherkennung — erprobt in tausenden Produktionsumgebungen weltweit.

Teams nutzen es für die Transkription von Meetings, Interviews, Kundengesprächen und Telefonaten. Mit Zeitstempeln auf Wort- und Satzebene lassen sich Inhalte präzise referenzieren und in nachgelagerte Prozesse einspeisen.

Untertitelung & Übersetzung

Über rund 100 Sprachen hinweg transkribiert Whisper zuverlässig — auch bei Hintergrundgeräuschen, Akzenten und Fachsprache.

Medienproduzenten und Plattformbetreiber nutzen es für Untertitelung, automatische Übersetzung gesprochener Inhalte ins Englische und barrierefreie Sprache-zu-Text-Lösungen. Alles auf Schweizer Infrastruktur, ohne Daten an US-Dienste abzugeben.

Preise

ModellMTok
whisper-large-v30.0020
Alle Preise in CHF/MTok exkl. Mehrwertsteuer.