Mein Gesprächspartner – das Smartphone

        DeepMind WaveNet    

Mit WaveNet sehen Siri & Co. bald blass aus

Wir sind in einer Zeit angekommen in der man, egal zu welchem Zeitpunkt, jemanden zum Reden hat, sollte man das Bedürfnis dazu haben. Ein kurzer Anruf genügt und schon hat man einen guten Freund am anderen Ende der Leitung, der dir mit Rat und Tat zur Seite steht. Falls man in der heutigen Zeit mal niemanden erreichen sollte, was schon sehr unwahrscheinlich ist, gibt es immer noch das Internet und Google. Doch das ist längst nicht mehr die einzige Variante. Schon seit einigen Jahren reden wir mit unseren Smartphones beziehungsweise den installierten Assistenten, doch durch die mechanische Aussprache, die teils falschen Antworten und das generelle Gefühl was übermittelt wird (nämlich, dass man sich mit einem Computer unterhält) lässt die Nutzung zu wünschen übrig.

Hier kommt der neue Durchbruch von Googles Abteilung für künstliche Intelligenz ins Spiel. DeepMind heißt die Tochterfirma, die neu entwickelte Sprachausgabe hört auf den Namen WaveNet. Mit dieser Technologie ist es den Sprachassistenten möglich wesentlich menschenähnlicher zu klingen, als ihre Vorgänger.

Das ist darauf zurückzuführen, dass herkömmliche Programme, wie Apples Siri oder Microsofts Cortana, eingesprochene Wörter beziehungsweise Wortgruppen bauklotzartig zu einem Satz zusammensetzt. Dies wird als Text-to-Speech-Verfahren bezeichnet.

WaveNet hingegen erzeugt die Sprache aus einzelnen Audiosignalen. Doch hier ist noch lange nicht Schluss. Das Programm lernt auch dazu und verwertet die Erfahrungen für eine Prognose der nächsten Sprachausgabe. Das Programm wird also im Laufe der Zeit intelligenter. Da bei WaveNet nicht nur Worte aneinandergehängt werden, sondern versucht wird, die menschliche Sprache perfekt zu mimen (daran zu merken, dass es teilweise sogar Atemgeräusche und kleine Schmatzer einbaut), wird wesentlich mehr Rechenleistung beansprucht – das Ergebnis ist es laut Google allerdings wert.

Darüber hinaus ist WaveNet in der Lage verschiedene Sprechweisen anzunehmen, was aus dem Lernprozess des Programmes resultiert. Aus diesem Grund gilt auch, dass WaveNet ein besseres Sprachergebnis produziert, wenn es mit vielen verschiedenen Leuten geredet hat und somit von vielen Quellen lernen konnte.

Wie gut der Sprachassistent wirklich ist wurde von DeepMind ebenfalls getestet und es stellte sich heraus, dass die Neuheit die älteren Produkte klar in den Schatten stellt. Bei dem Versuch mussten Probanden die Sprechqualität bestimmter Sätze beurteilen. Die menschliche Sprache selbst wurde mit einer 4,55 benotet. WaveNet schaffte es auf unglaubliche 4,21 Punkte, was die herkömmlichen Methoden mit 3,86 und 3,67 Punkten wohl eher alt aussehen lässt.

Noch ist die Sprachausgabe noch nicht in die Hände der Öffentlichkeit gelangt, solltest du ein paar Bespieltexte hören wollen, findest du diese und ein paar erklärende Grafiken auf dem Blog von DeepMind.

Ob dies der erste Schritt in die Richtung einer Herrschaft der Maschinen ist oder ob wir bald mit unserem Handy über Gott und die Welt philosophieren können, lässt sich nicht sagen. Wir freuen uns jedenfalls auf kompetentere Sprachassistenten und hoffen, dass sie irgendwann ein Level erreichen, auf dem es Sinn macht, sie täglich zu benutzen.

 


 

„Ich habe dich nicht verstanden.“

Bis WaveNet auf dem Markt ist könnten dir diese kostenlosen Apps als Alternative zu Siri helfen – oder du nutzt das Siri Handbuch:
 


Siri Handbuch – für iPhone, iPad, Apple TV, Apple Watch und Mac

€ 9,95 auf Amazon

 

Jeannie von Pannous
Jeannie/Genie von Pannous GmbH
Kostenloser Download

Download im Google Play Store

Download auf Amazon

 

Voice Answer Free von Sparkling Apps BV
Voice Answer Free von Sparkling Apps BV
Kostenloser Download

Download im Google Play Store

Download auf Amazon

 

Fotos: MEHAU KULYK / Getty Images; Google DeepMind Press; Amazon

Keine Kommentare

Dein Kommentar dazu Abbrechen

Deine E-mail Adresse wird nicht veröffentlicht.