Gesprochenes in Text umwandeln

Xaby · Beitrag von **Xaby** » 05.04.2006 09:52

Gibt es eine Bibliothek wie die TTS-Bibliothek, die auch aus Stimmenaufnahme Text machen kann?

Also Stimmenanalyse, Worterkennung ... etc.

So wie DragonSpeech oder IBM ViaVoice ...

Danke für eure Hilfe

MVXA · Beitrag von **MVXA** » 05.04.2006 13:13

Da > http://www.purebasic.fr/english/viewtop ... hlight=tts
Kannst damit aber nur reden... DS ist verdammt teuer, ich denke das weißt
du auch. Und für die SAPI von MS wird das ganze zu kompliziert, da du
versuchen musst ActiveX unter PB zum laufen zu bekommen.

Xaby · Beitrag von **Xaby** » 05.04.2006 15:35

Für PureBasic gibt es doch die PureTTS Lib. mit der ich auf die Stimmen von SAPI 4 und SAPI 5 zugreifen kann.
Die funktioniert tadellos.

Code: Alles auswählen

; A very simple way of enumerate the installed voices.
If TTSInit(0,0,0) ; First we initialize the tts support.
  voices.l = TTSEngCount() ; Get the highest voice index.
  If voices > -1 ; If there are any voice installed...
    Debug "There are "+Str(voices+1)+" voices installed in your system"
    ;Remember that voice index starts from 0
    For i=0 To voices
      name$=TTSEngName(i) ; Retrieve each voice name.
      Debug "Voice index = "+Str(i)+" , Voice name = "+ name$
    Next
    TTSEnd() ; Finally we close the tts support.
  EndIf
Else
  Debug "Text-To-Speech support not found!"
EndIf
End

Ich würde gern ein Programm haben, mit dem ich mir selbst eine Stimme für die Sprachausgabe generieren kann. Das Programm selbst muss gar nicht in PureBasic geschrieben sein.

Einfach nur ein freies Programm, mit dem ich selbst eine SAPI-Installationsdatei für meine Stimme machen kann.

Und dann bei dem oben aufgeführten Programm im Debug-Modus Folker bzw. Xaby als Stimme auswählbar wird.

Damit ich die Lizensen an meiner Stimme habe

Und auch verschiedene Dialekte benutzen kann und andere Verzerrungseffekte.

Beitrag von **bobobo** » 05.04.2006 16:44

was ähnliches

http://freetts.sourceforge.net/docs/index.php

Für ne Spielerei ist anständiges TTS zu teuer .. ne ordentliche
VoiceBibliothek macht man sich nicht mal eben so,

Siehe dazu z.B. mal http://en.wikipedia.org/wiki/TTS

Xaby · Beitrag von **Xaby** » 05.04.2006 16:53

Das höre ich jetzt schon wieder

Danke für den Link

Ich dachte daran, dass es ein Programm geben müsste, dem man einige Sätze diktiert und das daraus ein Sprachprofil erstellt.

Ähnlich wie STT funktioniert. Aber gut, die Programme kosten auch fast 300 Euro. Und vielleicht wäre ein Tonstudio nicht schlecht.
Aber ich wollte eigentlich nicht Silbe für Silbe als Wave speichern und dann ein eigens Programm schreiben, dass mir die Wörter in meine Silben zerlegt und die Wave-Daten zusammen fügt und sie dann abspielt.

Ich würd schon gern die ASPI-Unterstützung nutzen. Auch wegen der Kompatibilität und der einfachen Handhabung

Mr.X · Beitrag von **Mr.X** » 05.04.2006 17:08

Xaby hat geschrieben: Aber ich wollte eigentlich nicht Silbe für Silbe als Wave speichern und dann ein eigens Programm schreiben, dass mir die Wörter in meine Silben zerlegt und die Wave-Daten zusammen fügt und sie dann abspielt.

Ooohhch, wieso nicht? Das ist doch garnicht so schwierig. Solche Projekte wurden vor 11-13 Jahren noch als Diplomarbeiten vergeben.

MVXA · Beitrag von **MVXA** » 05.04.2006 17:10

> Solche Projekte wurden vor 11-13 Jahren noch als Diplomarbeiten vergeben.
Damals war das ja auch noch n schönes Stück arbeit. Heute schreibt
man einfach

Code: Alles auswählen

Wort.s = GetSpeechFromMicro(#Eingang)

Beitrag von **bobobo** » 05.04.2006 17:11

STT? Du meinst sicher TTS

auf was Du Dich da einlässt kannst Du ahnen, wenn Du mal
einen Blick auf http://www.festvox.org/cmu_arctic/ wirfst.

Mr.X · Beitrag von **Mr.X** » 05.04.2006 17:18

MVXA hat geschrieben:> Solche Projekte wurden vor 11-13 Jahren noch als Diplomarbeiten vergeben.
Damals war das ja auch noch n schönes Stück arbeit. Heute schreibt
man einfach
Code: Alles auswählen
Wort.s = GetSpeechFromMicro(#Eingang)

Genau. Und das 'GetSpeechFromMicro(#Eingang)' ist einfach so da.
Oder meinst Du das Programmieren von Libraries ist keine Arbeit?. Nämlich genau dieses 'schöne Stück Arbeit' von damals kannst Du heute einfach als Library-Befehl nutzen.

Xaby · Beitrag von **Xaby** » 05.04.2006 17:19

TTS ist ja geschriebener Text in Sprache
ich brauch's ja anders rum, um später dann meinen Text mit meiner Sprache wieder zu geben. Also zu mindest war das im Thema TTS gemeint.

Es gibt doch aber auch Programme wie IBM ViaVoice, die aus gesprochener Sprache Text machen können.

Also Memorie bzw. Diktierfunktionen haben.

Ich spreche etwas in ein Mikro und der Computer schreibt Text.

Oder ich sage dem Navi wo es lang geht und gebe keinen Text mehr ein.

Ein TTS-Programm gibt es ja schon für PureBasic. Ich würd gern wissen, ob es sowas auch für Sprache in Text ... also anders herrum geht.

Aber hier meine ich auch nicht die Synthese in SAPI 4 oder 5 wie im Thread TTS.

Tut mir ja auch leid, dass es alles etwas verwirrend ist

PureBoard

Gesprochenes in Text umwandeln

Gesprochenes in Text umwandeln

Was ich suche:

Zu teuer

Re: Zu teuer

Nee nee, STT ist schon das richtige