Gesprochenes in Text umwandeln

Anfängerfragen zum Programmieren mit PureBasic.
Benutzeravatar
MVXA
Beiträge: 3823
Registriert: 11.09.2004 00:45
Wohnort: Bremen, Deutschland
Kontaktdaten:

Beitrag von MVXA »

@Mr.X
Warum immer gleich so angepisst? Das sollte nur ein scherz sein wie die
CreateProgramm() Funktion....
Bild
Benutzeravatar
ts-soft
Beiträge: 22292
Registriert: 08.09.2004 00:57
Computerausstattung: Mainboard: MSI 970A-G43
CPU: AMD FX-6300 Six-Core Processor
GraKa: GeForce GTX 750 Ti, 2 GB
Memory: 16 GB DDR3-1600 - Dual Channel
Wohnort: Berlin

Beitrag von ts-soft »

Das mit einzelen waves für jeden Buchstaben, sowie ein paar Sonderlauten
funktioniert eigentlich recht gut. Hab da mal nen Source für Profan gehabt,
lief sehr gut.
PureBasic 5.73 LTS | SpiderBasic 2.30 | Windows 10 Pro (x64) | Linux Mint 20.1 (x64)
Nutella hat nur sehr wenig Vitamine. Deswegen muss man davon relativ viel essen.
Bild
Benutzeravatar
bobobo
jaAdmin
Beiträge: 3873
Registriert: 13.09.2004 17:48
Kontaktdaten:

Beitrag von bobobo »

achjee .. was richtig gut funktioniert hört sich dann SO an..
‮pb aktuel 6.2 windoof aktuell und sowas von 10
Ich hab Tinnitus im Auge. Ich seh nur Pfeifen.
Benutzeravatar
ts-soft
Beiträge: 22292
Registriert: 08.09.2004 00:57
Computerausstattung: Mainboard: MSI 970A-G43
CPU: AMD FX-6300 Six-Core Processor
GraKa: GeForce GTX 750 Ti, 2 GB
Memory: 16 GB DDR3-1600 - Dual Channel
Wohnort: Berlin

Beitrag von ts-soft »

Mit den Waves ist es zwar nicht ganz so gut, aber besser als die meisten
denken. Hab den Source leider nicht mehr :(
PureBasic 5.73 LTS | SpiderBasic 2.30 | Windows 10 Pro (x64) | Linux Mint 20.1 (x64)
Nutella hat nur sehr wenig Vitamine. Deswegen muss man davon relativ viel essen.
Bild
Benutzeravatar
MVXA
Beiträge: 3823
Registriert: 11.09.2004 00:45
Wohnort: Bremen, Deutschland
Kontaktdaten:

Beitrag von MVXA »

DragonSpeech ist ziehmlich ordentlich. Leider ist der Preis dem entsprechend
hoch :(...
Bild
Benutzeravatar
Xaby
Beiträge: 2144
Registriert: 12.11.2005 11:29
Wohnort: Berlin + Zehdenick
Kontaktdaten:

Gut Jungs

Beitrag von Xaby »

Dann will ich euch mal mein Ziel verraten.

Ich möchte gern ein Programm machen, dem ich z.B. ein Wort in deutsch sage, dass es mir dann in Englisch wieder ausspricht.

Speech to Text -> Wörterbuch -> Text to Speech

Und wenn es ganz gut ist, erkennt es automatisch die Eingabe Sprache.
Und wenn es noch besser ist, übersetzt es vollständige Sätze in richtiger Grammatik :allright:

Kein Anfänger-Projekt, ich weiß, aber bin auch gern bereit, noch mal einen DoppelPost in Tipps, Tricks und Code bzw. Projekte, Ressources und Tools zu bringen.

:o
Kinder an die Macht http://scratch.mit.edu/
Benutzeravatar
bobobo
jaAdmin
Beiträge: 3873
Registriert: 13.09.2004 17:48
Kontaktdaten:

Beitrag von bobobo »

@Xaby
Tja .. ich denke Du wirst dran scheitern, wenn Du kein Geld
ausgeben willst. Wäre aber nett wenn Du mich überraschen
würdest. :)

Für brauchbare Resultate in der Spracherkennung brauchst
Du einen guten Spracherkenner. Wir hatten hier speechperl von
Phillips (supergute Ergebnisse bei superhohen Preisen, da kann
man genialerweise auch eigene Erkenngrammatiken schreiben
.. Phillips hat sich aber vom Markt verabschiedet) und was von
telisma

Die Erkennung bei komplexen Sätzen erfordert sehr viel
Aufwand (umsomehr als Du das ja selber schreiben willst)
und natürlich noch mehr Aufwand, wenn auch noch unter-
schiedliche EingabeSprachen berücksichtigt werden sollen.

Der Wörterbuchteil ist nicht erwähnenswert.

Die qualitativ hochwertige Ausgabe per TTS ist danach dann
auch eigentlich ein Klacks wenn Du Geld ausgeben kannst.
‮pb aktuel 6.2 windoof aktuell und sowas von 10
Ich hab Tinnitus im Auge. Ich seh nur Pfeifen.
Benutzeravatar
Xaby
Beiträge: 2144
Registriert: 12.11.2005 11:29
Wohnort: Berlin + Zehdenick
Kontaktdaten:

Vielleicht habt ihr Recht

Beitrag von Xaby »

:? Vielleicht muss ich mein Programm ohne Text-Ein-und-Ausgabe erst fertig stellen und dann an Sony oder IBM verkaufen und die implementieren dann die Sprachsachen :? :( :mrgreen:

:freak: Oder ich setz mich ran und schreib meine eigene Text-Ausgabe-Engine. Aber das kostet für mein eigentliches Projekt, bzw. Problem zu viel Zeit. Genauso die Videoanalyse.

Ich möchte auch gern in meinem Programm etwas drin haben, wo man dem Computer über die WebCam z.B. was geschriebenes zeigt und der liest das dann halt vor. Aber WebCam ist meist von der Qualität zu mies, deshalb halt IEEE 1394 oder TV-Karte. Oder ich machs mit eingescannten Bildern. Aber ich will eigentlich auch keine OCR-Software schreiben.

Ach ist das alles blöd. Die meisten Dinge gibt es schon, die ich gern verwenden möchte, aber wie komm ich daran.
Oder sollte ich doch nach Unterstützung für ein Gemeinschaftsprojekt in Pure suchen? ...
Mmmm, ich würd mich natürlich freuen, wenn ihr mich unterstützen könntet und wollt. Mein Programm ist auf jeden Fall so gestrikt, dass es durch einzelne Module erweitert werden kann, bzw. diese bei Verbesserung ausgetauscht werden können.

Tja, aber ist ja immer so.

Kennt jemand schon ein Pure-Programm, wo einer mal selbst ne Engine geschrieben hat für wenigstens Textausgabe? :?
Kinder an die Macht http://scratch.mit.edu/
Benutzeravatar
Xaby
Beiträge: 2144
Registriert: 12.11.2005 11:29
Wohnort: Berlin + Zehdenick
Kontaktdaten:

Beitrag von Xaby »

Die Sache muss ja mal etwas vorangetrieben werden :allright:
Kinder an die Macht http://scratch.mit.edu/
Benutzeravatar
winduff
Beiträge: 879
Registriert: 10.02.2006 21:05
Wohnort: Gießen
Kontaktdaten:

Beitrag von winduff »

naja mal meinen ketchup dazugeben:

Geniale (!) Idee aber wie bobobo sagt, nicht so einfach + teuer...

Selbst wenn alle vorraussetzungen erfüllt sind, ist das kein Ein-Mannprojekt...

Idee = Genial = Ein bisschen unrealistisch für 1-Mann = MakeProgram() ... :roll:
Bild
AND51 hat geschrieben:...und ich würde dein Programm aus Wut zwei mal installieren, um eines genüsslicher löschen zu können, als das andere...
Antworten