Gesprochenes in Text umwandeln
- ts-soft
- Beiträge: 22292
- Registriert: 08.09.2004 00:57
- Computerausstattung: Mainboard: MSI 970A-G43
CPU: AMD FX-6300 Six-Core Processor
GraKa: GeForce GTX 750 Ti, 2 GB
Memory: 16 GB DDR3-1600 - Dual Channel - Wohnort: Berlin
Das mit einzelen waves für jeden Buchstaben, sowie ein paar Sonderlauten
funktioniert eigentlich recht gut. Hab da mal nen Source für Profan gehabt,
lief sehr gut.
funktioniert eigentlich recht gut. Hab da mal nen Source für Profan gehabt,
lief sehr gut.
PureBasic 5.73 LTS | SpiderBasic 2.30 | Windows 10 Pro (x64) | Linux Mint 20.1 (x64)
Nutella hat nur sehr wenig Vitamine. Deswegen muss man davon relativ viel essen.

Nutella hat nur sehr wenig Vitamine. Deswegen muss man davon relativ viel essen.

achjee .. was richtig gut funktioniert hört sich dann SO an..
pb aktuel 6.2 windoof aktuell und sowas von 10
Ich hab Tinnitus im Auge. Ich seh nur Pfeifen.
Ich hab Tinnitus im Auge. Ich seh nur Pfeifen.
- ts-soft
- Beiträge: 22292
- Registriert: 08.09.2004 00:57
- Computerausstattung: Mainboard: MSI 970A-G43
CPU: AMD FX-6300 Six-Core Processor
GraKa: GeForce GTX 750 Ti, 2 GB
Memory: 16 GB DDR3-1600 - Dual Channel - Wohnort: Berlin
Mit den Waves ist es zwar nicht ganz so gut, aber besser als die meisten
denken. Hab den Source leider nicht mehr
denken. Hab den Source leider nicht mehr

PureBasic 5.73 LTS | SpiderBasic 2.30 | Windows 10 Pro (x64) | Linux Mint 20.1 (x64)
Nutella hat nur sehr wenig Vitamine. Deswegen muss man davon relativ viel essen.

Nutella hat nur sehr wenig Vitamine. Deswegen muss man davon relativ viel essen.

Gut Jungs
Dann will ich euch mal mein Ziel verraten.
Ich möchte gern ein Programm machen, dem ich z.B. ein Wort in deutsch sage, dass es mir dann in Englisch wieder ausspricht.
Speech to Text -> Wörterbuch -> Text to Speech
Und wenn es ganz gut ist, erkennt es automatisch die Eingabe Sprache.
Und wenn es noch besser ist, übersetzt es vollständige Sätze in richtiger Grammatik
Kein Anfänger-Projekt, ich weiß, aber bin auch gern bereit, noch mal einen DoppelPost in Tipps, Tricks und Code bzw. Projekte, Ressources und Tools zu bringen.

Ich möchte gern ein Programm machen, dem ich z.B. ein Wort in deutsch sage, dass es mir dann in Englisch wieder ausspricht.
Speech to Text -> Wörterbuch -> Text to Speech
Und wenn es ganz gut ist, erkennt es automatisch die Eingabe Sprache.
Und wenn es noch besser ist, übersetzt es vollständige Sätze in richtiger Grammatik

Kein Anfänger-Projekt, ich weiß, aber bin auch gern bereit, noch mal einen DoppelPost in Tipps, Tricks und Code bzw. Projekte, Ressources und Tools zu bringen.

Kinder an die Macht http://scratch.mit.edu/
@Xaby
Tja .. ich denke Du wirst dran scheitern, wenn Du kein Geld
ausgeben willst. Wäre aber nett wenn Du mich überraschen
würdest.
Für brauchbare Resultate in der Spracherkennung brauchst
Du einen guten Spracherkenner. Wir hatten hier speechperl von
Phillips (supergute Ergebnisse bei superhohen Preisen, da kann
man genialerweise auch eigene Erkenngrammatiken schreiben
.. Phillips hat sich aber vom Markt verabschiedet) und was von
telisma
Die Erkennung bei komplexen Sätzen erfordert sehr viel
Aufwand (umsomehr als Du das ja selber schreiben willst)
und natürlich noch mehr Aufwand, wenn auch noch unter-
schiedliche EingabeSprachen berücksichtigt werden sollen.
Der Wörterbuchteil ist nicht erwähnenswert.
Die qualitativ hochwertige Ausgabe per TTS ist danach dann
auch eigentlich ein Klacks wenn Du Geld ausgeben kannst.
Tja .. ich denke Du wirst dran scheitern, wenn Du kein Geld
ausgeben willst. Wäre aber nett wenn Du mich überraschen
würdest.

Für brauchbare Resultate in der Spracherkennung brauchst
Du einen guten Spracherkenner. Wir hatten hier speechperl von
Phillips (supergute Ergebnisse bei superhohen Preisen, da kann
man genialerweise auch eigene Erkenngrammatiken schreiben
.. Phillips hat sich aber vom Markt verabschiedet) und was von
telisma
Die Erkennung bei komplexen Sätzen erfordert sehr viel
Aufwand (umsomehr als Du das ja selber schreiben willst)
und natürlich noch mehr Aufwand, wenn auch noch unter-
schiedliche EingabeSprachen berücksichtigt werden sollen.
Der Wörterbuchteil ist nicht erwähnenswert.
Die qualitativ hochwertige Ausgabe per TTS ist danach dann
auch eigentlich ein Klacks wenn Du Geld ausgeben kannst.
pb aktuel 6.2 windoof aktuell und sowas von 10
Ich hab Tinnitus im Auge. Ich seh nur Pfeifen.
Ich hab Tinnitus im Auge. Ich seh nur Pfeifen.
Vielleicht habt ihr Recht





Ich möchte auch gern in meinem Programm etwas drin haben, wo man dem Computer über die WebCam z.B. was geschriebenes zeigt und der liest das dann halt vor. Aber WebCam ist meist von der Qualität zu mies, deshalb halt IEEE 1394 oder TV-Karte. Oder ich machs mit eingescannten Bildern. Aber ich will eigentlich auch keine OCR-Software schreiben.
Ach ist das alles blöd. Die meisten Dinge gibt es schon, die ich gern verwenden möchte, aber wie komm ich daran.
Oder sollte ich doch nach Unterstützung für ein Gemeinschaftsprojekt in Pure suchen? ...
Mmmm, ich würd mich natürlich freuen, wenn ihr mich unterstützen könntet und wollt. Mein Programm ist auf jeden Fall so gestrikt, dass es durch einzelne Module erweitert werden kann, bzw. diese bei Verbesserung ausgetauscht werden können.
Tja, aber ist ja immer so.
Kennt jemand schon ein Pure-Programm, wo einer mal selbst ne Engine geschrieben hat für wenigstens Textausgabe?

Kinder an die Macht http://scratch.mit.edu/