Sprachsteuerung

  • Heyho Leute,

    ist es möglich mit AutoIt eine individuelle Sprachsteuerung zu erstellen?

    wenn ja, wie müsste ich das angehen?


    Grüße

    Martyn

  • Rein theoretisch ist das schon möglich aber für eine Sprachsteuerung benötigt man schon ziemlich hohe Mathematik und ich schliesse aus deiner Frage nach der Machbarkeit, dass du wahrscheinlich nicht die entsprechenden Kentnisse davon hast (siehe Wikipedia). Du kannst natürlich ein fertiges Programm nehmen und dieses dann in AutoIt verwenden, aber da habe ich gerade keines zur Hand. Findest du aber bestimmt mit Google. Dieses sollte dann schon mit AutoIt ansteuerbar sein.

    Gruss Shadowigor

  • Hm, also gibt es keine Möglichkeit, dass ich was aufnehme und vergleicht mit einem vorhanden File? Denn natürlich hab ich jetzt nicht das Knowhow mit mathematischen Berechnungen meine Stimme auszuwerten...

  • Also interessantes Thema, wenn du dich daran wagen möchtest auch gut, nur wollte ich mal in den Raum werfen, dass es (meiner Meinung nach zumindest) noch keine künstlichen intelligenzen gibt, die eine Sprachsteuerung richtig ermöglichen. Ich meine Siri oder diese Sprachsteuerung vom Android sind ja ungebrauchbar ... ich glaube die einzige Funktion die dort wirklich klappt ist das anrufen und das SMS schreiben und das meist nach 100 Versuchen oder mit 50 Fehlern pro Satz (im Bezug auf die SMS) ...

    Habe mal ein Video zu einem Test einer Uni gesehen bei den 2 Rechner voreinander gestellt worden sind mit Webcams, Mics etc. und das waren damals meines Wissens die beiden am weitesten ausgereiften künstlichen Intelligenzen, und diese hatten grad mal genug 'IQ' um gegenseitig eine ... naja nennen wir es SmallTalk Konversation zu halten ...

    Bin da skeptisch, und frage mich oft ob diese Forschung in diesem Bereich sinnvoll ist. Naja ich wünsche dir falls du damit anfängst viel Erfolg :)

    Grüße.

    Grüße Yaerox

    Grüne Hölle

  • Hi,
    individuelle Sprachsteuerung ist relativ einfach umzusetzen und auch die Erkennungsraten bewegen sich nach ausreichendem Training im ordentlichen Rahmen.
    Kommt ganz drauf an, was du damit machen willst, es gibt mittlerweile "Diktiergeräte" die annähernd fehlerfrei mitschreiben, was die (trainierte) Person spricht.

    Ich würde mal einzelne Wörter aufnehmen, ggf. 10x, und dann diese mit dem 11.Wort vergleichen (lass dir was einfallen). Hast du 3 Übereinstimmungen und 6x "wahrscheinlich" Treffer, dann passt das doch^^

    Zitat

    ...künstliche Intelligenzen...die eine Sprachsteuerung richtig ermöglichen. Ich meine Siri oder diese Sprachsteuerung vom Android sind ja ungebrauchbar ...

    Richtig, aber Siri und Android läuft auf irgendwelchen kleinen Kästchen, die zu 99,9% von Leuten bedient werden die dieses System nicht richtig nutzen (können).
    Frag mal Eukalyptus zum Thema Sound und Töne/Sprache, der kennt sich aus^^

  • Die Theorie der Spracherkennung an sich ist ja auch nicht das Problem. Da sind wir heute schon ziemlich weit. Das Problem ist alleine die implementierung. Wenn du Zeit und Lust hast ist es wahrscheinlich nicht so schwierig das umzusetzten, es ist halt nur verdammt aufwändig. Ich möchte ja gar nicht wissen was in so einem Diktiergerät so alles an Hardware und Software steckt ^^. Bei Siri und Co gebe ich euch recht. Das ist meiner Meinung nach nur ein schlechter Witz. Aber gleich so kompliziert muss es ja wohl nicht werden nehme ich mal an.

  • Na ja gut, für mich ist die Frage, wie schaffe ich es, dass ich meinem AutoIt-Programm, was ja noch nicht existiert ein Wort sage und eine MsgBox als Beispiel geht auf. Wie würde diese ganz einfache Szenario aussehen?

    Wenn man das hinbekommt, kann man daraus eine Menge machen ;)

  • So in der Art hab ich mir das vorgestellt, mit den Makros. Und wie mach ich das jetzt selber? ^^

    • Offizieller Beitrag

    Ich meine Siri oder diese Sprachsteuerung vom Android sind ja ungebrauchbar ... ich glaube die einzige Funktion die dort wirklich klappt ist das anrufen und das SMS schreiben und das meist nach 100 Versuchen oder mit 50 Fehlern pro Satz (im Bezug auf die SMS) ...


    Kann man nicht stehen lassen.

    Ich habe ein Android (Samsung Galaxy Plus) und schreibe SMS fast immer per Sprache - und dass fehlerfrei.
    Ebenso mache ich Eingaben im Notizblock häufig über die Spracheingabe - auch hier hervorragende Trefferquote.
    Zur Steuerung brauche ich keine Spracheingabe. Halte ich auch nicht zwingend für sinnvoll, da das den Vorgang gewaltig verlangsamt. ("Öffne Dokument dass ich ungefähr am 10.12. geschrieben habe, Titel weiß ich grad nicht...") :rofl: