Re: Extrahieren des reinen Textes aus einer HTML-Seite.
Verfasst: 08.11.2023 14:43
Hallo Brigitte, ich nehme mal an, du hast eine Software (THEOS-BASIC) die Daten ausgibt (in Html) und dann möchtest du mit einer anderen Software die Daten einlesen und verarbeiten?
Das lässt sich mit JSON in Purebasic sehr gut lösen. Schau Dir dazu bitte folgende Vorgehensweise an:
Die in txt.s gespeicherten Daten kannst du dann in einer Datei speichern.
Die Daten sehen dann so aus:
Wenn Du dann die Daten mit Purebasic einlesen und bearbeiten willst, würde das so gehen:
Vielleicht hilft dir das weiter?
Das lässt sich mit JSON in Purebasic sehr gut lösen. Schau Dir dazu bitte folgende Vorgehensweise an:
Code: Alles auswählen
; 1. Daten erzeugen und als JSON speichern:
Structure _THEOS
Autor.s
Template.s
LastAuthor.s
NamederBank.s
EndStructure
Define Out._THEOS
Out\Autor = "Stefan"
Out\Template = "Normal"
Out\LastAuthor = "Stefan"
Out\NamederBank = "Sparkasse"
CreateJSON(0)
InsertJSONStructure(JSONValue(0), @Out, _THEOS)
txt.s = ComposeJSON(0, #PB_JSON_PrettyPrint)
FreeJSON(0)
Debug txt
Die Daten sehen dann so aus:
Code: Alles auswählen
{
"LastAuthor" : "Stefan",
"NamederBank": "Sparkasse",
"Autor" : "Stefan",
"Template" : "Normal"
}
Wenn Du dann die Daten mit Purebasic einlesen und bearbeiten willst, würde das so gehen:
Code: Alles auswählen
Define In._THEOS
; Daten in txt.s einlesen bspw. mit ReadFile()
txt.s = ~"{\"LastAuthor\": \"Stefan\", \"NamederBank\": \"Sparkasse\", \"Autor\": \"Stefan\", \"Template\": \"Normal\" }"
ParseJSON(0, txt)
ExtractJSONStructure(JSONValue(0), @In, _THEOS)
Debug In\NamederBank
In\NamederBank = "Deutsche Bank"