Seite 2 von 3
Re: HTML Dateien durchsuchen mit PB
Verfasst: 16.11.2014 14:51
von Danilo
N_Gnom hat geschrieben:Wie könnte man das Rausfiltern?
< suchen und alles bis > ignorieren?
Dort findest Du einen Code von mir um Tags zu entfernen und den reinen Text zwischen Tags zu bekommen:
http://www.purebasic.fr/english/viewtopic.php?f=13&t=60208&start=23
Das könntest Du vielleicht als Anfang nehmen, um alles zwischen <body> und </body> zu extrahieren.
Re: HTML Dateien durchsuchen mit PB
Verfasst: 16.11.2014 14:52
von RehW
In einem anderen Beitrag hast Du geschrieben:
CodeCommander hat geschrieben:Liest du meine Nachricht überhaupt?
Die Frage kann ich zurückgeben, Deine Antwort bestätigt meine Aussage und andere sind auch schon von Dir genervt.
CodeCommander hat geschrieben:Soll ich für ihn sein ganzes Program schreiben?

Beispiel gibt es in der Hilfe und Vorlagen der regulären Ausdrücke gibt es bei Google. Was ist daran so schwer?

Ich nehme an, dass N_Gnom in der Lage ist, Google zu benutzen oder willst du behaupten, dass er dumm ist? Derren hat auch kein Beispiel angegeben, warum darf er antworten?

Ich habe ein Stichwort für die richtige Richtung gesagt und das sollte ausreichen. Falls nicht dann soll N_Gnom sich melden dann schreibe ich gerne für ihn ein Beispiel.
Ich habe nicht geschrieben das Du ein komplettes Programm schreiben sollst sondern ein Beispiel zeigen sollst, was auch für andere hilfreicher wäre. Ausserdem werde ich nicht behaupten das N_Gnom dumm ist!
Alle folgende Kommentare von Dir werde ich ignorieren, siehe mein obrigen Kommentar.
Re: HTML Dateien durchsuchen mit PB
Verfasst: 16.11.2014 15:04
von GronkhLP
Ich beobachte diese Zankerei schon länger und ich muss(te) öfters feststellen, man kann sagen was man will, egal wie barsch er mit seinen Beiträgen sein mag, aber Recht hat er, meistens jedenfalls.

Meine Empfehlung geht auch an RegEx.
Lieber CodeCommander, bitte sei nett zu den Menschen. Wenn du auf deine Wortwahl achtest, dann wirst du auch öfters ernst genommen. Respektvoller Umgang mit Menschen ist das A und O. Denk bitte dran.

Re: HTML Dateien durchsuchen mit PB
Verfasst: 16.11.2014 15:15
von ts-soft
RegEx mögen zwar der kürzeste Code sein, der eleganteste Code, aber mit Sicherheit nicht der Schnellste
Also, recht hat er auch nicht, muß Dir leider wiedersprechen.
Re: HTML Dateien durchsuchen mit PB
Verfasst: 16.11.2014 15:22
von Tommy
Re: HTML Dateien durchsuchen mit PB
Verfasst: 16.11.2014 15:31
von ts-soft
Gut aufgepaßt in der Schule, setzen.
Verfasst: 16.11.2014 15:36
von CodeCommander
~ DELETE ~
Re: HTML Dateien durchsuchen mit PB
Verfasst: 16.11.2014 15:47
von Derren
Und? Ist er etwa kein Anfänger? Wenn er schon mit den String-Befehlen nicht weiter kommt, warum wird einem dann hier XML und RegEx empfohlen???
Am schnellsten ist der direkte Speicherzugriff. Das ist aber das gleiche wie FindString. Jedes Zeichen wird durch-iteriert bis man zum gewünschten Ausdruck kommt. Wie FindString intern arbeitet weiß ich nicht, bin mir aber ziemlich sicher dass die eigentliche Vorgehensweise genau jene ist.
Da er nur nach einem einzelnen Zeichen suchen muss kann ich mir nicht vorstellen, dass FindString langsamer als XML oder RegEx sein soll.
Du kannst ja mal den Vergleichscode veröffentlichen
Außerdem ist die RegEx-Lib von PB eh nicht die beste. Ich glaube ein paar Funktionen sind dazu gekommen, aber Stargate hat nicht umsonst sein eigenes Include geschrieben...
Re: HTML Dateien durchsuchen mit PB
Verfasst: 16.11.2014 16:01
von ts-soft
Professionelle Programmierer werden immer eher auf RegEx zurückgreifen, weils einfacher ist als einen
optimierten Suchalgo zu schreiben, für die bestimmte Aufgabe. Aber der optimierte Suchalgo ist trotzdem
schneller, wenn er erstmal geschrieben ist.
Solange es sich sowieso nur um wenige ms handelt, ist es auch fast egal. Optimierte Suchalgorythmen
benötigen auch weniger Findstring, sondern "Pointern" sich durch das ganze, bis alle unnötigen Tags weg sind.
Okay, ich brauche keine Hilfe, jedenfalls nicht von Dir

, aber danke für das Angebot

Verfasst: 16.11.2014 16:18
von CodeCommander
~ DELETE ~