Gesprochenes in Text umwandeln
Gesprochenes in Text umwandeln
Gibt es eine Bibliothek wie die TTS-Bibliothek, die auch aus Stimmenaufnahme Text machen kann?
Also Stimmenanalyse, Worterkennung ... etc.
So wie DragonSpeech oder IBM ViaVoice ...
Danke für eure Hilfe
Also Stimmenanalyse, Worterkennung ... etc.
So wie DragonSpeech oder IBM ViaVoice ...
Danke für eure Hilfe
Zuletzt geändert von Xaby am 23.05.2006 15:24, insgesamt 1-mal geändert.
Kinder an die Macht http://scratch.mit.edu/
Da > http://www.purebasic.fr/english/viewtop ... hlight=tts
Kannst damit aber nur reden... DS ist verdammt teuer, ich denke das weißt
du auch. Und für die SAPI von MS wird das ganze zu kompliziert, da du
versuchen musst ActiveX unter PB zum laufen zu bekommen.
Kannst damit aber nur reden... DS ist verdammt teuer, ich denke das weißt
du auch. Und für die SAPI von MS wird das ganze zu kompliziert, da du
versuchen musst ActiveX unter PB zum laufen zu bekommen.
Was ich suche:
Für PureBasic gibt es doch die PureTTS Lib. mit der ich auf die Stimmen von SAPI 4 und SAPI 5 zugreifen kann.
Die funktioniert tadellos.
Ich würde gern ein Programm haben, mit dem ich mir selbst eine Stimme für die Sprachausgabe generieren kann. Das Programm selbst muss gar nicht in PureBasic geschrieben sein.
Einfach nur ein freies Programm, mit dem ich selbst eine SAPI-Installationsdatei für meine Stimme machen kann.
Und dann bei dem oben aufgeführten Programm im Debug-Modus Folker bzw. Xaby als Stimme auswählbar wird.
Damit ich die Lizensen an meiner Stimme habe
Und auch verschiedene Dialekte benutzen kann und andere Verzerrungseffekte.
Die funktioniert tadellos.
Code: Alles auswählen
; A very simple way of enumerate the installed voices.
If TTSInit(0,0,0) ; First we initialize the tts support.
voices.l = TTSEngCount() ; Get the highest voice index.
If voices > -1 ; If there are any voice installed...
Debug "There are "+Str(voices+1)+" voices installed in your system"
;Remember that voice index starts from 0
For i=0 To voices
name$=TTSEngName(i) ; Retrieve each voice name.
Debug "Voice index = "+Str(i)+" , Voice name = "+ name$
Next
TTSEnd() ; Finally we close the tts support.
EndIf
Else
Debug "Text-To-Speech support not found!"
EndIf
End

Einfach nur ein freies Programm, mit dem ich selbst eine SAPI-Installationsdatei für meine Stimme machen kann.
Und dann bei dem oben aufgeführten Programm im Debug-Modus Folker bzw. Xaby als Stimme auswählbar wird.
Damit ich die Lizensen an meiner Stimme habe

Und auch verschiedene Dialekte benutzen kann und andere Verzerrungseffekte.

Kinder an die Macht http://scratch.mit.edu/
was ähnliches
http://freetts.sourceforge.net/docs/index.php
Für ne Spielerei ist anständiges TTS zu teuer .. ne ordentliche
VoiceBibliothek macht man sich nicht mal eben so,
Siehe dazu z.B. mal http://en.wikipedia.org/wiki/TTS
http://freetts.sourceforge.net/docs/index.php
Für ne Spielerei ist anständiges TTS zu teuer .. ne ordentliche
VoiceBibliothek macht man sich nicht mal eben so,
Siehe dazu z.B. mal http://en.wikipedia.org/wiki/TTS
pb aktuel 6.2 windoof aktuell und sowas von 10
Ich hab Tinnitus im Auge. Ich seh nur Pfeifen.
Ich hab Tinnitus im Auge. Ich seh nur Pfeifen.
Zu teuer
Das höre ich jetzt schon wieder
Danke für den Link
Ich dachte daran, dass es ein Programm geben müsste, dem man einige Sätze diktiert und das daraus ein Sprachprofil erstellt.
Ähnlich wie STT funktioniert. Aber gut, die Programme kosten auch fast 300 Euro. Und vielleicht wäre ein Tonstudio nicht schlecht.
Aber ich wollte eigentlich nicht Silbe für Silbe als Wave speichern und dann ein eigens Programm schreiben, dass mir die Wörter in meine Silben zerlegt und die Wave-Daten zusammen fügt und sie dann abspielt.
Ich würd schon gern die ASPI-Unterstützung nutzen. Auch wegen der Kompatibilität und der einfachen Handhabung

Ich dachte daran, dass es ein Programm geben müsste, dem man einige Sätze diktiert und das daraus ein Sprachprofil erstellt.
Ähnlich wie STT funktioniert. Aber gut, die Programme kosten auch fast 300 Euro. Und vielleicht wäre ein Tonstudio nicht schlecht.
Aber ich wollte eigentlich nicht Silbe für Silbe als Wave speichern und dann ein eigens Programm schreiben, dass mir die Wörter in meine Silben zerlegt und die Wave-Daten zusammen fügt und sie dann abspielt.
Ich würd schon gern die ASPI-Unterstützung nutzen. Auch wegen der Kompatibilität und der einfachen Handhabung
Kinder an die Macht http://scratch.mit.edu/
Re: Zu teuer
Ooohhch, wieso nicht? Das ist doch garnicht so schwierig. Solche Projekte wurden vor 11-13 Jahren noch als Diplomarbeiten vergeben.Xaby hat geschrieben: Aber ich wollte eigentlich nicht Silbe für Silbe als Wave speichern und dann ein eigens Programm schreiben, dass mir die Wörter in meine Silben zerlegt und die Wave-Daten zusammen fügt und sie dann abspielt.

> Solche Projekte wurden vor 11-13 Jahren noch als Diplomarbeiten vergeben.
Damals war das ja auch noch n schönes Stück arbeit. Heute schreibt
man einfach
Damals war das ja auch noch n schönes Stück arbeit. Heute schreibt
man einfach
Code: Alles auswählen
Wort.s = GetSpeechFromMicro(#Eingang)
STT? Du meinst sicher TTS
auf was Du Dich da einlässt kannst Du ahnen, wenn Du mal
einen Blick auf http://www.festvox.org/cmu_arctic/ wirfst.
auf was Du Dich da einlässt kannst Du ahnen, wenn Du mal
einen Blick auf http://www.festvox.org/cmu_arctic/ wirfst.
pb aktuel 6.2 windoof aktuell und sowas von 10
Ich hab Tinnitus im Auge. Ich seh nur Pfeifen.
Ich hab Tinnitus im Auge. Ich seh nur Pfeifen.
Genau. Und das 'GetSpeechFromMicro(#Eingang)' ist einfach so da.MVXA hat geschrieben:> Solche Projekte wurden vor 11-13 Jahren noch als Diplomarbeiten vergeben.
Damals war das ja auch noch n schönes Stück arbeit. Heute schreibt
man einfachCode: Alles auswählen
Wort.s = GetSpeechFromMicro(#Eingang)
Oder meinst Du das Programmieren von Libraries ist keine Arbeit?. Nämlich genau dieses 'schöne Stück Arbeit' von damals kannst Du heute einfach als Library-Befehl nutzen.
Nee nee, STT ist schon das richtige
TTS ist ja geschriebener Text in Sprache
ich brauch's ja anders rum, um später dann meinen Text mit meiner Sprache wieder zu geben. Also zu mindest war das im Thema TTS gemeint.
Es gibt doch aber auch Programme wie IBM ViaVoice, die aus gesprochener Sprache Text machen können.
Also Memorie bzw. Diktierfunktionen haben.
Ich spreche etwas in ein Mikro und der Computer schreibt Text.
Oder ich sage dem Navi wo es lang geht und gebe keinen Text mehr ein.
Ein TTS-Programm gibt es ja schon für PureBasic. Ich würd gern wissen, ob es sowas auch für Sprache in Text ... also anders herrum geht.
Aber hier meine ich auch nicht die Synthese in SAPI 4 oder 5 wie im Thread TTS.
Tut mir ja auch leid, dass es alles etwas verwirrend ist
ich brauch's ja anders rum, um später dann meinen Text mit meiner Sprache wieder zu geben. Also zu mindest war das im Thema TTS gemeint.
Es gibt doch aber auch Programme wie IBM ViaVoice, die aus gesprochener Sprache Text machen können.
Also Memorie bzw. Diktierfunktionen haben.
Ich spreche etwas in ein Mikro und der Computer schreibt Text.
Oder ich sage dem Navi wo es lang geht und gebe keinen Text mehr ein.
Ein TTS-Programm gibt es ja schon für PureBasic. Ich würd gern wissen, ob es sowas auch für Sprache in Text ... also anders herrum geht.
Aber hier meine ich auch nicht die Synthese in SAPI 4 oder 5 wie im Thread TTS.
Tut mir ja auch leid, dass es alles etwas verwirrend ist

Kinder an die Macht http://scratch.mit.edu/