Autarke Sprachsteuerung im Einsatz in der Industrie

Hallo Maschine

In vielen Haushalten hat der Einsatz von Sprachassistenten wie Alexa von Amazon - neben Apple's Siri der wohl bekannteste Vertreter der Keyword-Spotting-Lösungen (kurz KWS) - den Alltag revolutioniert. Aber auch in der Industrie und der Medizintechnik gewinnen KWS an Bedeutung. Durch die Erfassung und Nutzung von Sprache lassen sich schon heute Prozesse beschleunigen sowie effizienter gestaltet und es können sogar Leben gerettet werden - einfach in dem man mit der Maschine spricht.
Bild: ©mimi/stock.adobe.com

Die KWS wird mit einem sogenannten Wake-Word, wie Alexa! oder Hey Siri, aktiviert und übermittelt anschließend den Wunsch des Bedienenden an einen entfernten Server. Dieser analysiert den Sprachbefehl und sendet das Auswertungsergebnis an das Gerät zurück. Auf diesem Weg wird ein Musikwunsch erfüllt, ein Film auf die Playlist gesetzt oder das Weihnachtsgeschenk für die Liebste bestellt.

Diese Vorgehensweise bietet auch für die Industrie einige Vorteile, hebt Viacheslav Gromov, Geschäftsführer vom KI-Anbieter Aitad hervor: „Wenn der Mitarbeitende die Maschine in der Produktion mit seiner Stimme steuert, dann bedeutet das mehr Flexibilität. Er kann die Geräte aus der Ferne bedienen und muss keine Knöpfe mehr drücken oder auf dem Bildschirm der Maschine seine Eingabe eintippen. Zudem vermeidet man Keime und Bakterien, ein wichtiger Aspekt in der Medizin. Darüber hinaus kann ein Zuruf des Befehls Stopp schneller ausgeführt werden, als erst zur Maschine zu rennen und sie dort abzuschalten.“

Spracherkennung in der Praxis

Die Übertragung von Sprachsignalen an entfernte Server birgt Latenzzeiten, die in sicherheitsrelevanten Umgebungen nicht akzeptabel sind. Ebenso spielen das Manipulations- und Ausfallrisiko einer Netzwerkverbindung eine Rolle. Deshalb erfordert der Einsatz von Spracherkennung in sicherheitskritischen Umgebungen Lösungen, die lokal und in Echtzeit arbeiten. Innovative Sprachsteuerungsmodelle mit Embedded-KI erkennen nicht nur einzelne Wakewords, sondern bis zu 30 vordefinierte Begriffe, was komplexe Befehle ermöglicht. Ein Schlüsselwort aktiviert das System. Anschließend können komplexe Kombinationen dieser vordefinierten Wortgruppe gesprochen und von der KI ausgewertet werden, die zusammen mit den Mikrofonen auf dem gleichen kleinen Board sitzt (Embedded-KI-Systemkomponente).

Beispiele für solche Sprachbefehle mit Roboter als Wakeword sind:

„Roboter, starte Programm A auf Maschine 3“

„Roboter, Förderband 6 anhalten“

„Roboter, Motor 4 in Maschine 3, erhöhe die Drehzahl um 40 Prozent“

„Roboter, Rollstuhl, jetzt links abbiegen“

„Roboter, Notaus“

„Entscheidend ist hier ein maximales Sicherheitslevel, das durch die lokale Verarbeitung der Sprachdaten – ohne Cloud oder Server – gewährleistet wird. Da die Befehle in Echtzeit direkt im Chip ausgewertet werden, reagiert die Maschine außerdem schneller.“ erklärt Gromov weiter.

Frei konfigurierbar, echtzeitfähig und robust

Unternehmen können ihre Sprachsteuerung individuell konfigurieren, angefangen von den Wakewords bis hin zur Wortgruppe. Dies ermöglicht maßgeschneiderte Systeme, die auch in mehreren Sprachen verfügbar sind. Bei Bedarf sind synthetisch erzeugte Sicherheitsabfragen integrierbar.

Die Einsatzmöglichkeiten für Sprachsteuerungen sind breit gefächert:

  • Im Operationssaal kann der Chirurg das Hochfrequenzskalpell per Sprachbefehl starten, justieren und wieder abschalten.
  • Berührungsloses Steuern von Maschinen und Geräten in Produktion und Krankenhäusern.
  • Notaus per Sprachbefehl erspart im Ernstfall den Spurt zum Notaus-Schalter.
  • Menschen mit Assistenzbedarf können beispielsweise den Rollstuhl per Sprache steuern.

Anpassungsfähig in rauen Umgebungen

Innovative autarke Embedded-KI-Sprachsteuerungslösungen arbeiten nicht nur vollständig lokal und in Echtzeit, sondern bewähren sich auch in rauen Umgebungen. Die KI wird nicht nur mit den zu erkennenden Worten, sondern auch mit Störgeräuschen trainiert, um eine zuverlässige Spracherkennung sicherzustellen, selbst wenn es in der Umgebung laut ist. Die Integration eines zusätzlichen Mikrofons ermöglicht es, den Standort des Sprechers zu erkennen und störende Nebengeräusche zu eliminieren (Beamforming).

„Diese neue wegweisende Sprachsteuerung wird die Zukunft in Industrie und Medizin nachhaltig verändern und bestimmen,“ ist sich Gromov sicher. „Wir haben selbst eine Lösung entwickelt, die Unternehmen in die Lage versetzt, schon heute ihre Produkte mit dieser Technologie auszustatten und damit eine Vorreiterrolle in Wirtschaft und Business einzunehmen. Diese zeichnet sich durch eine hohe Robustheit gegen Störgeräusche aus und wird individuell auf die Kundenanforderungen zugeschnitten. Da wir auf eine Vorentwicklung zurückgreifen, können wir unsere lokale Sprachsteuerung mit circa 30 zu erkennenden Worten kostengünstig anbieten.“

Der deutscher Embedded-KI-Anbieter Aitad befasst sich mit der Entwicklung, Testung und Serienfertigung von KI-Elektroniksystemen, insbesondere in Verbindung mit maschinellem Lernen im Industriekontext (v.a. Systemkomponenten). Als Entwicklungspartner übernimmt das Unternehmen den kompletten Prozess vom Datensammeln über die Entwicklung bis hin zur Lieferung der Systemkomponenten. Anstatt einer fertigen KI-Lösung wird für jeden Kunden ein individuelles System entwickelt. Hierfür prüft das Unternehmen im ersten Schritt wie Kundenprodukte vom KI-Einsatz profitieren, stellt die Vorteile und Möglichkeiten vor, entwickelt das System auf allen Ebenen, baut dank einer Prototyping-EMS-Strecke in-house einen Prototyp des neuen Systems auf Basis gesammelter Daten und steht bei der Serienanfertigung und Systempflege stets zur Seite. Dabei agiert Aitad als interdisziplinärer Full-Stack-Anbieter mit Bereichen Data Science, Maschinenbau sowie Embedded-Hard- und Software. Dadurch sind Anpassungen des Produkts möglich, ohne das Kompetenzen und nur wenige Ressourcen von Kundenseite notwendig sind. Der Fokus liegt dabei auf zukunftsbringenden, disruptiven, innovativen Anpassungen mit größtmöglichem Impact auf Strukturen und Produktstrategien. Die Spezialgebiete von Aitad sind Preventive/Predictive Maintenance, User Interaction und funktionale Innovationen. Zudem wird in- und extern an zahlreichen algorithmischen und halbleitertechnischen Grundlagen der KI-Technologie geforscht. 2023 erhielt Aitad den embedded award in der Kategorie KI, den Top100-Innovationspreis für mittelständische Unternehmen und wurde als KI-Champion Baden-Württemberg ausgezeichnet.

Das könnte Sie auch Interessieren

Weitere Beiträge

Bild: ©mimi/stock.adobe.com
Bild: ©mimi/stock.adobe.com
Hallo Maschine

Hallo Maschine

In vielen Haushalten hat der Einsatz von Sprachassistenten wie Alexa von Amazon – neben Apple’s Siri der wohl bekannteste Vertreter der Keyword-Spotting-Lösungen (kurz KWS) – den Alltag revolutioniert. Aber auch in der Industrie und der Medizintechnik gewinnen KWS an Bedeutung. Durch die Erfassung und Nutzung von Sprache lassen sich schon heute Prozesse beschleunigen sowie effizienter gestaltet und es können sogar Leben gerettet werden – einfach in dem man mit der Maschine spricht.

mehr lesen
Bild: Bucher Automation AG
Bild: Bucher Automation AG
Schnellere SPS-Entwicklung mit virtuellen Steuerungen

Schnellere SPS-Entwicklung mit virtuellen Steuerungen

Der Einsatz virtueller Steuerungen zur Applikationsentwicklung im Maschinen- und Anlagenbau bietet merkliche Vorteile. So ist eine Entwicklungsumgebung, die Steuerung, Kommunikation, I/Os und Motion-Control-Achsen in Software abbildet, nicht mehr abhängig von der Verfügbarkeit der Hardware. Stattdessen kann die virtuelle Steuerung einfach auf einem PC am Schreibtisch programmiert, getestet und sogar in Betrieb genommen werden.

mehr lesen