Seite 1 von 1
Sonderzeichen formatieren?
Verfasst: 25.06.2014 09:53
von es_91
Kann PureBasic HTMl-Sonderzeichen automatisch (in einem String) kodieren/dekodieren?
Re: Sonderzeichen formatieren?
Verfasst: 25.06.2014 09:56
von NicTheQuick
Nicht, dass ich wüsste. Aber heutzutage ist das doch auch gar nicht mehr nötig, wenn man im Documenttype UTF8 angibt.
Re: Sonderzeichen formatieren?
Verfasst: 25.06.2014 11:24
von es_91
Ich muss hier Daten aus einer Website auslesen, die beginnt wie folgt:
Code: Alles auswählen
<?xml version="1.0" encoding="UTF-8" ?><!DOCTYPE html PUBLIC "-//W3C//DTD XHTML Basic 1.1//EN"
"http://www.w3.org/TR/xhtml-basic/xhtml-basic11.dtd">
... und verwendet trotzdem diese HTML-Symbole.

Re: Sonderzeichen formatieren?
Verfasst: 25.06.2014 11:30
von Kiffi
@es_91: Das hier könnte helfen:
HTMLEncoder / HTMLDecoder
Grüße ... Kiffi
Re: Sonderzeichen formatieren?
Verfasst: 25.06.2014 11:46
von TroaX
Das Zeichensatzformat hilft leider auch nicht, wenn der Entwickler der Seite die Umlaute trotzdem als Entities in die Page castet. &UUML; steht für & = Entity, U = U, UML = Umlaut, ; = Entity-Ende. Das gleiche geht mit O und A. Das kommt oftmals vor, wenn eine Seite auf ein CMS/Serverskript aufbaut, das noch auf Grund der Abwärtskompatibilität die Sonderzeichen als Entities an den Browser weitergibt.
Entweder du nutzt den Link von Kiffi oder du schreibst einen eigenen Parser, der nach den Entities sucht und diese dann durch die Umlaute ersetzt. Aber es ist schon recht leicht, das ganze in die richtigen Texte umzuwandeln.
Gruß Troax
Re: Sonderzeichen formatieren?
Verfasst: 25.06.2014 11:54
von es_91
Oh ja, danke Dir.
TroaX hat geschrieben:Aber es ist schon recht leicht, das ganze in die richtigen Texte umzuwandeln.
Per Hand, oder wie? Einen Parser zu schreiben, dafür hab ich echt keine Zeit. ^^

Re: Sonderzeichen formatieren?
Verfasst: 25.06.2014 13:43
von TroaX
LOL ähm und hier?
http://www.purebasic.com/german/documen ... tring.html
Ich gebe zu, das Parser der etwas zu heftige Begriff dafür war. Aber mit der Funktion geht es wirklich einfach. Denn das Entity-Muster von HTML ist das einzige, das nach diesem Prinzip im HTML-Parser arbeitet und jedes Entity hat ne fixe Bedeutung. Du kannst also mit ReplaceString problemlos nach und nach die gewünschten Entities austauschen. Eine Kollision mit Entities für die Darstellung dieser ist ebenfalls ausgeschlossen, da die Entities für die Darstellung erneut in Entities umgewandelt werden.
Für Umlaute brauchste das ganze also nur 3 mal.
Gruß Troax
Re: Sonderzeichen formatieren?
Verfasst: 25.06.2014 15:41
von es_91
Ja, Du hast recht, ich nehme aber trotzdem lieber den code von luis, der ist vollständig.

Re: Sonderzeichen formatieren?
Verfasst: 25.06.2014 21:46
von TroaX
Hehe ok
