Gesprochenes in Text umwandeln

MVXA · Beitrag von **MVXA** » 05.04.2006 18:09

@Mr.X
Warum immer gleich so angepisst? Das sollte nur ein scherz sein wie die
CreateProgramm() Funktion....

ts-soft · Beitrag von **ts-soft** » 05.04.2006 18:16

Das mit einzelen waves für jeden Buchstaben, sowie ein paar Sonderlauten
funktioniert eigentlich recht gut. Hab da mal nen Source für Profan gehabt,
lief sehr gut.

Beitrag von **bobobo** » 05.04.2006 19:17

achjee .. was richtig gut funktioniert hört sich dann SO an..

ts-soft · Beitrag von **ts-soft** » 05.04.2006 19:22

Mit den Waves ist es zwar nicht ganz so gut, aber besser als die meisten
denken. Hab den Source leider nicht mehr

MVXA · Beitrag von **MVXA** » 05.04.2006 19:55

DragonSpeech ist ziehmlich ordentlich. Leider ist der Preis dem entsprechend
hoch

...

Xaby · Beitrag von **Xaby** » 05.04.2006 22:00

Dann will ich euch mal mein Ziel verraten.

Ich möchte gern ein Programm machen, dem ich z.B. ein Wort in deutsch sage, dass es mir dann in Englisch wieder ausspricht.

Speech to Text -> Wörterbuch -> Text to Speech

Und wenn es ganz gut ist, erkennt es automatisch die Eingabe Sprache.
Und wenn es noch besser ist, übersetzt es vollständige Sätze in richtiger Grammatik

Kein Anfänger-Projekt, ich weiß, aber bin auch gern bereit, noch mal einen DoppelPost in Tipps, Tricks und Code bzw. Projekte, Ressources und Tools zu bringen.

Beitrag von **bobobo** » 06.04.2006 13:24

@Xaby
Tja .. ich denke Du wirst dran scheitern, wenn Du kein Geld
ausgeben willst. Wäre aber nett wenn Du mich überraschen
würdest.

Für brauchbare Resultate in der Spracherkennung brauchst
Du einen guten Spracherkenner. Wir hatten hier speechperl von
Phillips (supergute Ergebnisse bei superhohen Preisen, da kann
man genialerweise auch eigene Erkenngrammatiken schreiben
.. Phillips hat sich aber vom Markt verabschiedet) und was von
telisma

Die Erkennung bei komplexen Sätzen erfordert sehr viel
Aufwand (umsomehr als Du das ja selber schreiben willst)
und natürlich noch mehr Aufwand, wenn auch noch unter-
schiedliche EingabeSprachen berücksichtigt werden sollen.

Der Wörterbuchteil ist nicht erwähnenswert.

Die qualitativ hochwertige Ausgabe per TTS ist danach dann
auch eigentlich ein Klacks wenn Du Geld ausgeben kannst.

Xaby · Beitrag von **Xaby** » 07.04.2006 09:44

Vielleicht muss ich mein Programm ohne Text-Ein-und-Ausgabe erst fertig stellen und dann an Sony oder IBM verkaufen und die implementieren dann die Sprachsachen

Oder ich setz mich ran und schreib meine eigene Text-Ausgabe-Engine. Aber das kostet für mein eigentliches Projekt, bzw. Problem zu viel Zeit. Genauso die Videoanalyse.

Ich möchte auch gern in meinem Programm etwas drin haben, wo man dem Computer über die WebCam z.B. was geschriebenes zeigt und der liest das dann halt vor. Aber WebCam ist meist von der Qualität zu mies, deshalb halt IEEE 1394 oder TV-Karte. Oder ich machs mit eingescannten Bildern. Aber ich will eigentlich auch keine OCR-Software schreiben.

Ach ist das alles blöd. Die meisten Dinge gibt es schon, die ich gern verwenden möchte, aber wie komm ich daran.
Oder sollte ich doch nach Unterstützung für ein Gemeinschaftsprojekt in Pure suchen? ...
Mmmm, ich würd mich natürlich freuen, wenn ihr mich unterstützen könntet und wollt. Mein Programm ist auf jeden Fall so gestrikt, dass es durch einzelne Module erweitert werden kann, bzw. diese bei Verbesserung ausgetauscht werden können.

Tja, aber ist ja immer so.

Kennt jemand schon ein Pure-Programm, wo einer mal selbst ne Engine geschrieben hat für wenigstens Textausgabe?

Xaby · Beitrag von **Xaby** » 23.05.2006 15:24

Die Sache muss ja mal etwas vorangetrieben werden

winduff · Beitrag von **winduff** » 23.05.2006 15:33

naja mal meinen ketchup dazugeben:

Geniale (!) Idee aber wie bobobo sagt, nicht so einfach + teuer...

Selbst wenn alle vorraussetzungen erfüllt sind, ist das kein Ein-Mannprojekt...

Idee = Genial = Ein bisschen unrealistisch für 1-Mann = MakeProgram() ...

PureBoard

Gesprochenes in Text umwandeln

Gut Jungs

Vielleicht habt ihr Recht