Gesprochenes in Text umwandeln

Anfängerfragen zum Programmieren mit PureBasic.
Benutzeravatar
Xaby
Beiträge: 2144
Registriert: 12.11.2005 11:29
Wohnort: Berlin + Zehdenick
Kontaktdaten:

Gesprochenes in Text umwandeln

Beitrag von Xaby »

Gibt es eine Bibliothek wie die TTS-Bibliothek, die auch aus Stimmenaufnahme Text machen kann?

Also Stimmenanalyse, Worterkennung ... etc.

So wie DragonSpeech oder IBM ViaVoice ...

Danke für eure Hilfe
Zuletzt geändert von Xaby am 23.05.2006 15:24, insgesamt 1-mal geändert.
Kinder an die Macht http://scratch.mit.edu/
Benutzeravatar
MVXA
Beiträge: 3823
Registriert: 11.09.2004 00:45
Wohnort: Bremen, Deutschland
Kontaktdaten:

Beitrag von MVXA »

Da > http://www.purebasic.fr/english/viewtop ... hlight=tts
Kannst damit aber nur reden... DS ist verdammt teuer, ich denke das weißt
du auch. Und für die SAPI von MS wird das ganze zu kompliziert, da du
versuchen musst ActiveX unter PB zum laufen zu bekommen.
Bild
Benutzeravatar
Xaby
Beiträge: 2144
Registriert: 12.11.2005 11:29
Wohnort: Berlin + Zehdenick
Kontaktdaten:

Was ich suche:

Beitrag von Xaby »

Für PureBasic gibt es doch die PureTTS Lib. mit der ich auf die Stimmen von SAPI 4 und SAPI 5 zugreifen kann.
Die funktioniert tadellos.

Code: Alles auswählen

; A very simple way of enumerate the installed voices.
If TTSInit(0,0,0) ; First we initialize the tts support.
  voices.l = TTSEngCount() ; Get the highest voice index.
  If voices > -1 ; If there are any voice installed...
    Debug "There are "+Str(voices+1)+" voices installed in your system"
    ;Remember that voice index starts from 0
    For i=0 To voices
      name$=TTSEngName(i) ; Retrieve each voice name.
      Debug "Voice index = "+Str(i)+" , Voice name = "+ name$
    Next
    TTSEnd() ; Finally we close the tts support.
  EndIf
Else
  Debug "Text-To-Speech support not found!"
EndIf
End
Ich würde gern ein Programm haben, mit dem ich mir selbst eine Stimme für die Sprachausgabe generieren kann. Das Programm selbst muss gar nicht in PureBasic geschrieben sein. :?

Einfach nur ein freies Programm, mit dem ich selbst eine SAPI-Installationsdatei für meine Stimme machen kann.

Und dann bei dem oben aufgeführten Programm im Debug-Modus Folker bzw. Xaby als Stimme auswählbar wird.

Damit ich die Lizensen an meiner Stimme habe :mrgreen:

Und auch verschiedene Dialekte benutzen kann und andere Verzerrungseffekte. :allright:
Kinder an die Macht http://scratch.mit.edu/
Benutzeravatar
bobobo
jaAdmin
Beiträge: 3873
Registriert: 13.09.2004 17:48
Kontaktdaten:

Beitrag von bobobo »

was ähnliches

http://freetts.sourceforge.net/docs/index.php

Für ne Spielerei ist anständiges TTS zu teuer .. ne ordentliche
VoiceBibliothek macht man sich nicht mal eben so,

Siehe dazu z.B. mal http://en.wikipedia.org/wiki/TTS
‮pb aktuel 6.2 windoof aktuell und sowas von 10
Ich hab Tinnitus im Auge. Ich seh nur Pfeifen.
Benutzeravatar
Xaby
Beiträge: 2144
Registriert: 12.11.2005 11:29
Wohnort: Berlin + Zehdenick
Kontaktdaten:

Zu teuer

Beitrag von Xaby »

Das höre ich jetzt schon wieder :mrgreen: Danke für den Link

Ich dachte daran, dass es ein Programm geben müsste, dem man einige Sätze diktiert und das daraus ein Sprachprofil erstellt.

Ähnlich wie STT funktioniert. Aber gut, die Programme kosten auch fast 300 Euro. Und vielleicht wäre ein Tonstudio nicht schlecht.
Aber ich wollte eigentlich nicht Silbe für Silbe als Wave speichern und dann ein eigens Programm schreiben, dass mir die Wörter in meine Silben zerlegt und die Wave-Daten zusammen fügt und sie dann abspielt.

Ich würd schon gern die ASPI-Unterstützung nutzen. Auch wegen der Kompatibilität und der einfachen Handhabung
Kinder an die Macht http://scratch.mit.edu/
Benutzeravatar
Mr.X
Beiträge: 66
Registriert: 10.08.2005 22:46
Wohnort: im schönen OWL

Re: Zu teuer

Beitrag von Mr.X »

Xaby hat geschrieben: Aber ich wollte eigentlich nicht Silbe für Silbe als Wave speichern und dann ein eigens Programm schreiben, dass mir die Wörter in meine Silben zerlegt und die Wave-Daten zusammen fügt und sie dann abspielt.
Ooohhch, wieso nicht? Das ist doch garnicht so schwierig. Solche Projekte wurden vor 11-13 Jahren noch als Diplomarbeiten vergeben. :wink:
Benutzeravatar
MVXA
Beiträge: 3823
Registriert: 11.09.2004 00:45
Wohnort: Bremen, Deutschland
Kontaktdaten:

Beitrag von MVXA »

> Solche Projekte wurden vor 11-13 Jahren noch als Diplomarbeiten vergeben.
Damals war das ja auch noch n schönes Stück arbeit. Heute schreibt
man einfach

Code: Alles auswählen

Wort.s = GetSpeechFromMicro(#Eingang)
Bild
Benutzeravatar
bobobo
jaAdmin
Beiträge: 3873
Registriert: 13.09.2004 17:48
Kontaktdaten:

Beitrag von bobobo »

STT? Du meinst sicher TTS

auf was Du Dich da einlässt kannst Du ahnen, wenn Du mal
einen Blick auf http://www.festvox.org/cmu_arctic/ wirfst.
‮pb aktuel 6.2 windoof aktuell und sowas von 10
Ich hab Tinnitus im Auge. Ich seh nur Pfeifen.
Benutzeravatar
Mr.X
Beiträge: 66
Registriert: 10.08.2005 22:46
Wohnort: im schönen OWL

Beitrag von Mr.X »

MVXA hat geschrieben:> Solche Projekte wurden vor 11-13 Jahren noch als Diplomarbeiten vergeben.
Damals war das ja auch noch n schönes Stück arbeit. Heute schreibt
man einfach

Code: Alles auswählen

Wort.s = GetSpeechFromMicro(#Eingang)
Genau. Und das 'GetSpeechFromMicro(#Eingang)' ist einfach so da.
Oder meinst Du das Programmieren von Libraries ist keine Arbeit?. Nämlich genau dieses 'schöne Stück Arbeit' von damals kannst Du heute einfach als Library-Befehl nutzen.
Benutzeravatar
Xaby
Beiträge: 2144
Registriert: 12.11.2005 11:29
Wohnort: Berlin + Zehdenick
Kontaktdaten:

Nee nee, STT ist schon das richtige

Beitrag von Xaby »

TTS ist ja geschriebener Text in Sprache
ich brauch's ja anders rum, um später dann meinen Text mit meiner Sprache wieder zu geben. Also zu mindest war das im Thema TTS gemeint.

Es gibt doch aber auch Programme wie IBM ViaVoice, die aus gesprochener Sprache Text machen können.

Also Memorie bzw. Diktierfunktionen haben.

Ich spreche etwas in ein Mikro und der Computer schreibt Text.

Oder ich sage dem Navi wo es lang geht und gebe keinen Text mehr ein.

Ein TTS-Programm gibt es ja schon für PureBasic. Ich würd gern wissen, ob es sowas auch für Sprache in Text ... also anders herrum geht.

Aber hier meine ich auch nicht die Synthese in SAPI 4 oder 5 wie im Thread TTS.

Tut mir ja auch leid, dass es alles etwas verwirrend ist :freak:
Kinder an die Macht http://scratch.mit.edu/
Antworten