Seite 1 von 1
Spracherkennung für Pure Basic
Verfasst: 19.11.2022 23:35
von jogo
Moin zusammen,
ich denke über ein Projekt für Jemanden nach, der mit den Händen etwas eingeschränkt ist.
Ziel ist, ein zugerufenes Wort in einer hinterlegten Liste zu suchen und (wenn vorhanden) die damit verknüpfte Information als Text auf dem Monitor anzeigt.
Für Windows wäre ja die PB.Ex Speech von RSBasic die passende Basis für dieses Vorhaben.
Gibt es so etwas auch für Linux, was ich mit PB zusammen verwenden und mit meinen bescheidenen Kenntnissen realisieren kann?
Re: Spracherkennung für Pure Basic
Verfasst: 21.11.2022 13:17
von juergenkulow
Wiki Speech recognition software for Linux
Wie viel kostet ein günstiger Windows Rechner?
Re: Spracherkennung für Pure Basic
Verfasst: 21.11.2022 18:26
von jogo
in dieser Richtung habe ich ja bereits geforscht, nur konnte ich damit nicht so richtig was anfangen bzw. verstehe die Doku nicht (sicherlich mangels Kenntnisse & Durchblick). Habe da auch keinen richtigen Ansatz gefunden, das mit PB einzusetzen, bzw. hat sich das für mich nicht erschlossen.
Ich dachte eher an so etwas, was für die Benutzung mit PureBasic geeignet ist, zB. die PB.Ex Speech für Windows von RSBasic.
Bis jetzt habe ich den Eindruck gewonnen, dass dieses Vorhaben wohl 1 bis 2 Nummern zu groß für mich ist. Deshalb wollt ich hier mal nachfragen - für den Fall dass ich was übersehen habe oder Jemand in diesem Gebiet bereits Erfahrungen hat.
Klar, ich könnte das mit Windows versuchen, einen gebrauchten Windows-PC könnte ich schon günstig auftreiben. Wäre dann Plan B // muß mich dann erstmal wieder in Windows einarbeiten und ich habe den Menschen vor 2 Jahren überzeugt, Linux zu nutzen ^^ - aber ok, ich schau mal. Ist bis jetzt ja nur Planung und Machbarkeits-Forschung

Re: Spracherkennung für Pure Basic
Verfasst: 23.11.2022 07:24
von DarkDragon
PCM Daten werden in ein recurrent neural network (RNN) gesteckt, der im output layer das alphabet abbildet. Wenn man dann von links nach rechts die argmaxe bei Änderung aufsammelt hat man den finalen String.
So ein RNN muss trainiert werden, dazu braucht man massig Daten. Eine Möglichkeit wäre
https://datasetsearch.research.google.com/
Als Framework um nicht zuviel selbst machen zu müssen würde ich PyTorch oder Tensorflow empfehlen.
Re: Spracherkennung für Pure Basic
Verfasst: 07.12.2022 13:55
von Benubi
Das ist schon immer ein interessantes Thema auch für mich gewesen.
Ich frag mich wie der Amiga "Say" Befehl das hinbekommen hat. Ich denke das waren nur 1-2 relativ kleine Dateien (der Befehl selbst und möglicherweise eine Library dazu) und es würde mich wundern wenn da RNN zum Einsatz kamen. Ist zwar nicht so ausgereift wie menschlich wirkende Stimmen heute, aber schon ziemlich cool und für meine Zwecke wäre das erstmal ausreichend gewesen.