Wie Kinect mich in Siris Arme trieb – Sprachsteuerung Like Star Trek

Der Trend ist unverkennbar. Nach dem die Industrie es seit Jahren versucht, war es letzten Endes eine Videospielkonsole, die die Sprachsteuerung für mich unverzichtbar machte. Kinect ist ein fabelhaftes Stück Technik und aus meinem Wohnzimmer nicht mehr wegzudenken. Trotzdem war ihr wohl größter Erfolg mich in die Arme der Konkurrenz zu werfen. Warum dem so ist, schreibe ich hier.

Sprachsteuerung ist nicht neu. Sie gibt es bereits seid Mitte der 60er Jahre. Zumindest theoretisch. Und nein ich meine damit nicht Papas Befehlston gegenüber Mama, sondern das Steuern von Computern mit der Stimme. Wer hat´s erfunden? Nein, nicht die Schweizer. Star Trek hat´s erfunden! Besser gesagt das Produktionsteam rund um Since-Fiction-Guru Gene Roddenbery. Viele heute schon selbstverständliche Alltagsgegenstände finden ihren Uhrsprung tatsächlich in Star Trek. Die Serie inspirierte viele Menschen, erhielt jedoch nur am Stammtisch die gebührende Beachtung. Heute stehen die Entwickler offen hinter ihrer Inspirationsquelle und verweisen sogar darauf. Die wohl bekannteste Erfindung, die auf einer Star Trek Technologie basiert ist die elektrische Schiebetür. Ob Einkaufszentrum, Bahnhof, oder Boutique, die Türen öffnen voll Automatisch. Aber auch das Handy und der Touchscreen (Der tatsächlich dann von Schweizern erfunden wurde) finden ihren Ursprung in Star Trek. Auch heute noch dient diese außergewöhnliche Serie als Inspirationsquelle für Erfinder. Von Virtual Reality bis zum Warp-Antrieb. Was mich persönlich aber immer am meisten beeindruckte war diese unsichtbare Macht im Hintergrund – Der Computer. Ein Wort, oder eine kurze Phrase reichte und wie von Zauberhand agierte die Technik selbstständig.

 

Was damals unvorstellbar klang ist heute ein alter Hut. Seit Jahren werden Freisprecheinrichtungen in Autos verbaut und in den Service Hotlines antworten schon lange keine Menschen mehr. Trotzdem hat die Technologie nie wirklich den Durchbruch in den Alltag geschafft. Zu ungenau war die Erkennung und zu komplex die Handhabung. Eben schnell selber eingeben war komfortabler. Zu albern das Gefühl ein Selbstgespräch zu führen. Der Markt für Spracherkennung trat auf der Stelle. Wieder einmal war es dann die Innovationsschmiede von Apple die Bewegung in den Markt brachte. Stichwort „Siri“. Der persönliche Assistent für die Hosentasche. Technologisch ausgereift und flexibel sollte sie sein. Und auch wenn das Programm ambitioniert und durchdacht war, gezündet hat es nie. Zumindest nicht bei mir. Der Grund war klar. Es lag nicht an den Funktionen, denn die waren zahlreich und auch nicht an der Umsetzung, denn die war gut. Es lag am Mehrwert. Es war schlicht schneller mal eben das Notification Center zu öffnen um zu sehen wie das Wetter wird, als Siri zu fragen. Ich habe Siri mehrere Chancen gegeben, aber es sollte einfach noch nicht so weit sein.

 

Kinect 2.0

Es dauerte bis Januar 2014 um mich von der Sprachsteuerung zu überzeugen – Ich kaufte mir eine Xbox One. Entgegen vieler Unkenrufe gefiel mir das OS der One sehr gut. Es lies sich schneller und flüssiger steuern als das des Vorgängers, sah modern aus und lies sich auch „mit“ Controller gut bedienen. Das Highlight war und ist jedoch Kinect. Auch wenn Microsoft es vor kurzem wieder schaffte Inkonsequenz in ihrer Markenstrategie zu beweisen und Kinect standardmäßig aus dem Paket nahm, ist es wohl eine der innovativsten Technologien auf dem Markt. Besonders auf die Sprachsteuerung bezogen.

Kinect

Das besondere an Kinect ist das Star Trek Feeling. Es lässt sich nur schwer beschreiben, wenn man es nicht kennt. Am besten geht es wenn man es unauffällig nennt. Es läuft einfach. Die Konsole redet nicht mit mir, sondern führt meine Befehle aus. Eine unsichtbare Macht im Hintergrund, die tut was ich ihr sage. Genau wie eine Tastenbedienung muss ich die Befehle kennen und richtig ausführen. Das gute jedoch daran ist, die natürliche Umsetzungsgeschwindigkeit. Für eine Sprachbedienung ist keine Visualisierung nötig, die mir verrät wo in der Navigation ich mich befinde, denn es wird keine benötigt. Systembedingt setzt die One Sprachbefehle direkt um, ohne Umwege, oder einer weiteren Bestätigung.

Die Sprachsteuerung von Kinect basiert eigentlich auf einem sehr einfachen Konzept, welches dreiteilig aufgebaut ist. Am Anfang steht dabei immer der Aufruf, dann die Aufgabe, dann das Ziel. Eigentlich ganz einfach, wenn auch nicht überall konsequent umgesetzt. Das Schaubild verdeutlicht das Konzept etwas besser. Es ist dieses simple Konstrukt der Befehle, welches das System einfach und schnell macht. Obwohl anfangs die Bedienung wenig intuitiv ist, entwickelt man schnell ein Gefühl für die Sprache und geht natürlich im Gebrauch damit um. So natürlich, dass man erst bemerkt wie einzigartig es ist, wenn man es mal nicht mehr hat. Zum Beispiel wenn man noch mal an der Xbox 360 sitzt. Selbst wenn Microsoft die Steuerung mit dem Controller weiter optimieren wird, an die Sprachsteuerung wird es nicht heranreichen können. Zumindest nicht was die Geschwindigkeit betrifft.

Kinect_Befehlstruktur

Die Befehlsstruktur der Kinect-Sprachsteuerung ist dreiteilig aufgebaut. Sie beginnt mit dem Aufruf, der die Spracherkennung aktiviert, dem Befehl, der bestimmt welche Funktion ausgeführt wird, und dem Ziel der Funktion. Es müssen zur Erkennung nicht immer alle drei Komponenten aufgerufen werden.

 

Ich will mehr davon!

Nach einiger Zeit jedoch merkt man auch die Limitierung, innerhalb und außerhalb des Systems. Immer wieder erwische ich mich dabei, wie ich meine technologische Umwelt mit Sprachphrasen beeinflussen will. Ein „Xbox Leiser“ zum Autoradio, ein „Xbox Licht Aus“ zur Deckenleuchte im Schlafzimmer. Immer gefolgt von einem leichten Gefühl der Ernüchterung. Ich will mehr, das war schnell klar. Auch innerhalb des Systems der Xbox One wünscht man sich schnell mehr Möglichkeiten. Warum keine Anbindung an Office? Termine andocken während man gerade Fernsieht. Schnell mal die neusten News anzeigen lassen bevor der Film anfängt. Zu wenig Intelligenz versteckt sich hinter Microsofts Sprachsteuerung. Schnell wünscht man sich, genau wie in Star Treck seine komplette Umwelt mit der Stimme steuern zu können. Es ist einfach zu komfortabel vor seinem Bedürfnis einfach ein „Xbox“ zu setzen.

 

Back To Siri

Es hat eine Weile gedauert bis ich dahinter kam, dass zumindest ein Teil meiner Wünsche schon längst in Erfüllung gegangen waren. Ich habe sie nur nie richtig zu nutzen gewusst. Apples intelligenter Assistent schlummerte bereits die ganze Zeit in meiner Hosentasche. Das Mittlerweile zu Kult gewordene und auch fast wieder vergessene Assistenzsystem Siri. Apples kleine Wunder-Lady bietet genau das was mir so sehr an Kinect fehlt. Sie ist intelligenter und flexibler als ihr Microsoft Pendant. Vom Grundkonzept her sind sich beide Systeme ähnlich. Wobei sich Siri jedoch nicht dogmatisch an fest definierten Phrasen orientiert, sondern sich durch ein Interpretationssystem dynamischer bei der Erkennung zeigt. Auch ist Siri vielseitiger, so reichen wenige Befehle um ganze Einstellungen zu ändern. Wo wir jedoch wieder beim Ausgangsproblem mit Siri wären. Zur Bedienung muss nämlich der Homebutton des iOS Gerätes gedrückt werden und wenn ich mein iPhone in der Hand habe bin ich mit den Fingern schneller. Es musste eben erst Kinect her, um mir aufzuzeigen, dass es eben auch andere Einsatzgebiete gibt. So lasse ich mir jetzt immer die letzten News auflisten, lasse mir meine Termine anzeigen oder im Auto die letzten Mails vorlesen. Ich diktiere kurze Nachrichten für meine Freundin oder lasse mich Erinnern. Siri funktioniert einfacher, breitflächiger und wirkt in der Bedienung weniger steif.

Siri

Nicht Perfekt

Aber auch Siri ist nicht perfekt. Trotz moderner Interpretationssoftware werden Befehle nicht immer richtig erkannt. Es ist dabei nicht so, dass die Worterkennung fehlerhaft ist, sondern die Interpretation. In dem Fall muss man die Phrase ändern, den Befehl umformulieren. Weis man auch hier die richtige Wortwahl, werden die meisten Befehle sauber erkannt und umgesetzt. Größtes Manko an Apples Sprachassistenten liegt jedoch nicht in der Erkennung, oder den Möglichkeiten, sondern am Bedienkonzept selbst. Denn so gut und intelligent Siri auch sein mag, sie versprüht kein Star Trek Feeling. Das klingt erst mal komisch, da Siri technologisch fortschrittlicher ist als die Kinect Erkennung, auf den zweiten Blick ist es jedoch klar. Siri läuft nicht autonom. Es ist ein rein passives System. Will ich mit Siri interagieren, muss ich sie erst durch einen Tastendruck am Device aktivieren. Damit entsteht ein funktioneller Wiederspruch. Um tastenfrei zu agieren, muss ich erst eine Taste drücken. Kinect hingegen ist ein aktives System. Es erkennt mich selbstständig, ist allzeit bereit und erlaubt mir trotz Limitierung gleich mehrere Geräte zu steuern. Es hapert eben an der Intelligenz und Vielseitigkeit des Xbox/Kinect Systems. Trotzdem muss Apple aufpassen. Derzeit arbeitet Microsoft offiziell an einem eigenen intelligenten Sprachassistenten, der auf den Projektnamen Cortana hört (Halo Kennern dürfte der Name nicht Unbekannt sein). Sollte Cortana den Weg auf die Xbox One finden, könnte es Siri sein die mich wiederum in Cortanas Arme treiben wird.

 

Sprachsteuerung ist die Zukunft

Versteht mich nicht falsch, das meiste gebe ich noch per Hand ein. Gerne lasse ich Kinect für mich den Weg durch das System der Xbox One gehen, doch die direkte Steuerung läuft dann meist über den Controller oder die One Remote. Es ist viel mehr das durchdachte Zusammenspiel vieler systemischer Komponenten die das System so attraktiv und nützlich macht. Eine Symbiose aus Sprachsteuerung und Tastensteuerung. Gleiches gilt für Siri und das iPhone. Sie sucht für mich die Informationen heraus, doch den Rest übernehmen wieder die Finger. Sprachsteuerung ist kein Ersatz – es ist eine Ergänzung. Eine Abkürzung zwischen zwei Punkten. Derzeit geht die Entwicklung in dem Bereich rasend schnell voran. Und wie immer war es ein Apple Produkt welches den Markt wachrüttelte und wie üblich waren es die Einschränkungen der Konkurrenz die mich zu Apples System brachten. Die Überraschung jedoch ist Microsoft diesmal gelungen (was Seltenheitswert hat), selbst wenn ihr Konzept noch weit von der Perfektion entfernt ist. Kinect 2.0 ist seit langer Zeit der erste wirkliche Schritt in eine spannende Zukunft. Eine Zukunft wo auch weiterhin die Innovationen von einem hauch von Star Trek getragen werden.

 

 (Bilder by Jörg Brinckheger  / pixelio.de)

2 thoughts on “Wie Kinect mich in Siris Arme trieb – Sprachsteuerung Like Star Trek

  1. Etzloets

    Ich bin da eher altmodisch veranlagt. Ich bevorzuge die Controllersteuerung, aber warum das so ist, kann ich nicht richtig erklären. Mit der Touchsteuerung zum Beispiel beim Nintendo DS, oder beim Smartphone hatte ich keine Eingewöhnungsschwierigkeiten. Auch wenn sich das unverständlich anhören mag, brauche ich irgendwie Kontakt zu dem Gerät, mit dem ich interagiere. Falls Kinect jemals einen richtigen Mehrwert abseits der ersparten Sekunden bietet, werde ich mich wohl damit arrangieren. Bis dahin bleibe ich aber beim guten alten Controller.

    • semiBJoker

      Wie geschrieben, lässt sich der Mehrwert für mich nicht durch nakte Fakten der Funktionen beschreiben. Für mich ist es eben der Hauch von Star Trek und der Komfort ein mächtiges Tool allein durch meine Stimme zu steuern. … Vielleicht ist es doch ein wenig wie Papas Befehlston der Mama gegenüber. Bei meiner Liebsten brauche ich das garnicht erst zu versuchen. ;)

Hinterlasse eine Antwort

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind markiert *

Du kannst folgende HTML-Tags benutzen: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>