Schnelllesen via Spritz Technologie-welche Technik?

Für allgemeine Fragen zur Programmierung mit PureBasic.
Benutzeravatar
NicTheQuick
Ein Admin
Beiträge: 8837
Registriert: 29.08.2004 20:20
Computerausstattung: Ryzen 7 5800X, 64 GB DDR4-3200
Ubuntu 24.04.2 LTS
GeForce RTX 3080 Ti
Wohnort: Saarbrücken

Re: Schnelllesen via Spritz Technologie-welche Technik?

Beitrag von NicTheQuick »

Leider stürzt es nach einer gewissen Anzahl Wörtern ab oder friert ein. Warum, habe ich noch nicht heraus gefunden. Aber "Threadsafe" habe ich natürlich aktiviert.

Was noch fehlt sind aber auch Pausen nach Kommas und Punkten. Zudem scheint das Original "Spritz" nach längeren Wörtern auch etwas länger zu warten bis es zum nächsten umspringt. Womöglich geht das auch nach der Silbenanzahl. Aber das ist nur eine Vermutung.
Derren
Beiträge: 558
Registriert: 23.07.2011 02:08

Re: Schnelllesen via Spritz Technologie-welche Technik?

Beitrag von Derren »

Ich glaub die größte Herausforderung ist eine Wörterbuchintegration.
Einfache Regeln wie "Suffixe abtrennen" reichen nicht aus, bspw hab ich im Duden das Wort "Silbenstecherei" gefunden. Das sollte möglichst "Silben - stecherei" getrennt werden und nicht "Silbenstecher - ei", nur weil "Silbenstecher" 13 Buchstaben hab und somit noch im "Limit" liegt.

Und natürlich wäre es auch schön, wenn English unterstützt würde. Allerdings stellt sich auch die Frage ob man diese Funktion einfach so nachmachen darf. Wohl eher nicht.
Und das SDK ist für private Nutzung mit < 10.000 Nutzern auch kostenlos. Allerdings gibt es nur eine iOS, Android und "Web"-Version davon.
Signatur und so
c4s
Beiträge: 1235
Registriert: 19.09.2007 22:18

Re: Schnelllesen via Spritz Technologie-welche Technik?

Beitrag von c4s »

Derren hat geschrieben:Allerdings stellt sich auch die Frage ob man diese Funktion einfach so nachmachen darf. Wohl eher nicht.
Ich verstehe was du meinst, aber was soll daran bitte schön schützenswert sein? Dämliche Softwarepatente auf Ladenbalken, Doppelklick, Thumbnails, Messenger etc. sind schon ärgerlich genug. /:->
"Menschenskinder, das Niveau dieses Forums singt schon wieder!" — GronkhLP ||| "ich hogffe ihr könnt den fehle endecken" — Marvin133 ||| "Ideoten gibts ..." — computerfreak ||| "Jup, danke. Gruss" — funkheld
Benutzeravatar
CodeCommander
Beiträge: 213
Registriert: 02.03.2014 16:06

Beitrag von CodeCommander »

Mir kommt es so vor als ob ihr noch nie in der Grundschule wart. :D Ihr könnt doch Silben trennen oder? Falls ja wo liegt das Problem? Mit meinem Postfix war nur ein Beispiel aber man muss vorher schauen wie viele Silben ein Wort hat und am besten die Differenz nehmen und dann abzutrennen.
Beispiel: Programmiersprache >> Pro-gram-mier-spra-che
Ungünstig: Programmierspra- und che oder Pro- und grammiersprache
Lieber: Programmier- und sprache
Einfach eine WordList nehmen und via Map darauf zugreifen. Das wäre am einfachsten, dann kann man ganze Substantive trennen.

Ihr seid scheinbar keine Deutschlehrer sondern nur Programmierer. :D Aber ein Duden habt ihr zu Hause schon oder? ;)
Zuletzt geändert von CodeCommander am 18.01.2015 14:18, insgesamt 1-mal geändert.
~ DELETE ~
- chris -
Beiträge: 195
Registriert: 24.08.2005 19:52
Wohnort: Stadtallendorf

Re: Schnelllesen via Spritz Technologie-welche Technik?

Beitrag von - chris - »

-- Umlaute und ß werden irgendwie nur als Kästchen dargestellt

"Unicode Executable erstellen" abwählen dann funktioniert es auch mit ß und Umlauten.

Funktioniert DrawText nicht mit Umlauten?
PB v5.72 x86/x64
Windows 10 Pro 64bit
Derren
Beiträge: 558
Registriert: 23.07.2011 02:08

Re: Schnelllesen via Spritz Technologie-welche Technik?

Beitrag von Derren »

CodeCommander hat geschrieben:Mir kommt es so vor als ob ihr noch nie in der Grundschule wart. :D Ihr könnt doch Silben trennen oder?
Dann bring dein Wissen mal einem Computer bei. Sollte ja kein Problem sein, wenn du die Grundschule geschafft hast, dass du ein Programm schreibst, dass bei x-beliebigen Wörtern eine korrekte Silbentrennung vornimmt.
Signatur und so
Benutzeravatar
NicTheQuick
Ein Admin
Beiträge: 8837
Registriert: 29.08.2004 20:20
Computerausstattung: Ryzen 7 5800X, 64 GB DDR4-3200
Ubuntu 24.04.2 LTS
GeForce RTX 3080 Ti
Wohnort: Saarbrücken

Re: Schnelllesen via Spritz Technologie-welche Technik?

Beitrag von NicTheQuick »

CodeCommander hat geschrieben:Mir kommt es so vor als ob ihr noch nie in der Grundschule wart. :D Ihr könnt doch Silben trennen oder? Falls ja wo liegt das Problem?
Das Problem liegt darin eine öffentliche und geeignete Liste aller Wörter mit Trennung zu finden und in das Programm einzubauen. Ein Duden hilft hier keinem was, solange er nicht eine API anbietet, die man effizient ansprechen kann.
Derren hat geschrieben:Allerdings stellt sich auch die Frage ob man diese Funktion einfach so nachmachen darf. Wohl eher nicht.
Laut deutschem Wettbewerbsrecht darf man sehr wohl solche Dinge nachahmen. Man darf nur nicht den vorhandenen Code einfach so kopieren, sei es Binär oder als Quellcode. Nachahmen geht solange wie man nicht den anderen dabei marktwirtschaftlich beeinträchtigt oder selbst einen Nutzen daraus zieht, indem man den Namen des anderen nutzt. Dann kommt noch Markenschutzrecht und Geschmacksmusterrecht und ähnliches dazu. Also einfach die grafische Oberflächezu kopieren könnte schon illegal sein. Aber das kommt immer noch darauf an, was der Originalurheber überhaupt schützen lässt. Notfalls kann er das aber auch noch nachträglich nachholen.
Benutzeravatar
CodeCommander
Beiträge: 213
Registriert: 02.03.2014 16:06

Beitrag von CodeCommander »

Hier eine German-Wordlist: http://sourceforge.net/projects/germandict/files/
Damit könnt ihr wenigstens ganze Wörter trennen wie "Computermaus" wird zu "Computer" und "maus".
Es gibt im Internet viele verschiedene Wordlisten. Einfach mal GIDF. :D
Wenn man ein einziges Wort gerne trennen möchte gibt es natürlich viele Regeln die man beachten muss. Ich kann hier nicht alle Regeln auflisten. Ich habe aber auch nicht gesagt, dass es mit einer einzigen Regel umsetzbar ist.
Vielleicht gibt es sogar bei GIDF Wordlist mit Silbentrennung. Oder ihr müsst Regel für Regel aus Duden übernehmen und umsetzen.
Beispielregeln:
1. ch, ck, ph, rh, sh, th und sch dürfen nicht getrennt werden (lt. Regel 165)
2. st, pf werden getrennt (z.B. Fens-ter, flüs-tern, Wes-te, bes-tens, Diens-tag, ...)
2.1. Ausnahmen gibt es natürlich auch, wenn davor ganze Präfixe wie "an", "bei", "ver", "ge", "be" usw. gibt. Also was nicht geht: ans-tellen (sondern: an-stellen, bes-tellen (sondern: be-stellen)
Präfixe müssen abgefragt werden. Wenn keine vorhanden sind dann kann man "st" trennen.
3. "auen" wie "Bauen" wird "Bau-en" getrennt oder "auer" wie "Bauer" wird "Bau-er" getrennt oder "Dau-er", "kau-en", ...
4. Doppelte Buchstaben werden getrennt: Männer >> Män-ner, Trennung >> Tren-nung, Füllung >> Fül-lung

Ich hör jetzt auf. Nicht ich will so was umsetzen, sondern ihr. Es ist zwar bisschen aufwendig die einzelnen Regeln zu berücksichtigen, aber machbar.
Stellt euch einfach ein Tokenizer/Lexer oder Interpreter vor. Solche Tools brauchen auch Regeln. Wenn ihr Fragen habt kann ich euch gerne helfen aber ich schreib nicht eure Programme.
Zuletzt geändert von CodeCommander am 18.01.2015 14:21, insgesamt 1-mal geändert.
~ DELETE ~
Derren
Beiträge: 558
Registriert: 23.07.2011 02:08

Re: Schnelllesen via Spritz Technologie-welche Technik?

Beitrag von Derren »

Also gerade wenn man bedenkt, dass Wortteile nacheinander angezeigt sind einige dieser Regeln hier totaler Stuss.
Doppelte Buchstaben trennen? Meiner Meinung nach sollte der Wortstamm erhalten bleiben. Der ist halt "Mann" oder "Füll" ~er, ~ung. So werden neue Wörter gebildet (bis auf wenige Ausnahmen bei denen ein Teil rausfliegt), und wenn Wörter eben Stamm + Endung gebildet werden sollte man sie nicht "Stam,5 + Endung,5" trennen
Und "Mittwoch" wird bestimmt Mitt-woch getrennt und nicht mit Mit-twoch. Mitt-er-nacht, oder Mit-ter-nacht? Oder wie man in der Schule (nicht nur der Grundschule) beigebracht bekommt: Tren-nung-en (oder doch besser Trenn ~ung ~en) besser vermeiden :freak:

Und "Weste" kannst du ja gerne so trennen. Aber würdest du auch "Im Wes
-ten nichts neues
" schreiben?
"Trenne nie ST, denn es tut den beiden weh" scheint auch nicht mehr aktuell zu sein.

"ck" darf nicht getrennt werden. Wie lange es her, dass "ck" als k-k getrennt wurde? Lek-ker. 15 Jahre vielleicht? Naja die Herrschaften vom Duden scheinen ja dazu zu lernen, aber so ganz koscher ist mir das ganze nicht.
Signatur und so
Benutzeravatar
CodeCommander
Beiträge: 213
Registriert: 02.03.2014 16:06

Beitrag von CodeCommander »

Hallo Derren. ;)
Derren hat geschrieben:oder "Füll" ~er, ~ung
Füller wird so getrennt: Fül-ler (so stehts auch im Duden) und nicht Füll-er
Füllung ebenfalls: Fül-lung und nicht Füll-ung
Wenn du Füll-er trennst, dann hast du ein Sprachfehler oder deine Betonung beim Trennen der Silben hört sich komisch an. Du sagst doch nicht Füll und er, sondern Fül und ler. :lol:
Derren hat geschrieben:Und "Mittwoch" wird bestimmt Mitt-woch getrennt und nicht mit Mit-twoch.
Ausnahme, weil das ein zusammengesetztes Wort ist: Mitte und Woche >> Mittwoch
Deshalb Mitt-woch, siehe Duden
Mitternacht ebenfalls, siehe Herkunft.
Derren hat geschrieben:Und "Weste" kannst du ja gerne so trennen. Aber würdest du auch "Im Wes -ten nichts neues" schreiben?
Westen (der Westen) wird Wes-ten getrennt. Duden!!!
Derren hat geschrieben:"ck" darf nicht getrennt werden. Wie lange es her, dass "ck" als k-k getrennt wurde? Lek-ker. 15 Jahre vielleicht
Es geht hier um die neue Rechtschreibung. Und in der heutigen Zeit schreibt man "lecker" und es wird folgendermaßen getrennt: le-cker
Siehe Duden!
Derren hat geschrieben:sind einige dieser Regeln hier totaler Stuss.
Sagt wer? Du? Derjenige, der die Regeln nicht beherscht? Bis jetzt konnte ich all deine Gegenbehauptungen kontern.

Du scheinst große Deutschprobleme (oder du sprichst es falsch aus) bezüglich der Silbentrennung zu haben, sorry, aber ich hoffe, ich konnte all deine Fragen beantworten.
Wenn du weitere Fragen hast, dann lese bitte sorgfällig die Regelung in deinem Duden durch oder stell hier deine Frage.
Zuletzt geändert von CodeCommander am 18.01.2015 14:21, insgesamt 1-mal geändert.
~ DELETE ~
Antworten