KI-News fuer den Mittelstand

Neue KI für Spracherkennung: Effizienter und genauer als bisher

Eine neue, frei verfügbare KI zur Umwandlung von Sprache in Text übertrifft bisherige Standards bei Genauigkeit und Effizienz.

Eine neue Software zur automatischen Umwandlung von gesprochener Sprache in Text stellt eine wichtige Entwicklung für Unternehmen dar. Dieses KI-Modell ist „Open Source“, also frei verfügbar und anpassbar, was Lizenzkosten spart. Es übertrifft das bekannte Modell „Whisper Large v3“ in der Genauigkeit: Die Fehlerrate bei der Worterkennung liegt bei nur 6,65 % im Vergleich zu 7,44 %. Gleichzeitig benötigt es deutlich weniger Rechenleistung, da es mit 245 Millionen Parametern wesentlich schlanker ist als das Vergleichsmodell mit 1,5 Milliarden. Diese Effizienz senkt die Anforderungen an die IT-Infrastruktur und damit die Betriebskosten für solche KI-Anwendungen erheblich.
Was bedeutet das konkret für Ihren Betrieb?

Diese Technologie wird zugänglicher und wirtschaftlicher. Sie können Prozesse wie die Protokollierung von Besprechungen, die Transkription von Kundengesprächen oder die Erstellung von Untertiteln für Videos kostengünstig automatisieren. Durch den geringeren Ressourcenbedarf lässt sich die Software auch auf eigener, weniger leistungsstarker Hardware oder günstiger in der Cloud betreiben, was sie gerade für kleine und mittlere Unternehmen attraktiv macht.

💡 Handlungsempfehlung: Prüfen Sie, in welchen Unternehmensbereichen die automatische Transkription von Audio- oder Videodaten wiederkehrende manuelle Aufgaben ersetzen kann.

Künstliche IntelligenzOpen SourceSpracherkennungDigitalisierungKMU

Quellen: community.openai.com, giskard.ai, huggingface.co