Seite 1 von 2

PDFs lesen?

Verfasst: 27.11.2024 12:32
von Then
Mal ne vielleicht blöde Frage, aber kann man mit PB irgendwie PDFs öffnen und lesen ?

Nach PDF kann man leider hier nicht suchen, weil mehr als 3 Buchstaben gefordert werden. :|

Gibts da ne noch unterstützte Lib oder sowas ?

Re: PDFs lesen?

Verfasst: 27.11.2024 12:42
von Kiffi
Then hat geschrieben: 27.11.2024 12:32Nach PDF kann man leider hier nicht suchen, weil mehr als 3 Buchstaben gefordert werden. :|
finde ich auch doof, denn als Programmierer sucht man häufig 3 Zeichen lange Extensionen.

Aber versuch mal das hier: https://www.google.com/search?q=pdf+sit ... r%2Fgerman

Re: PDFs lesen?

Verfasst: 27.11.2024 12:57
von dige
Was meinst du denn mit lesen? Möchtest du auf den Inhalt/Text mit PB zugreifen oder soll das PDF einfach nur visuell lesbar sein? Falls letzteres, könntest du einfach das WebGadget (Edge) dafür nehmen.

Re: PDFs lesen?

Verfasst: 27.11.2024 13:22
von Then
Ich meine schon den Text in PB als String einlesen... ohne Steuerzeichen etc.

Re: PDFs lesen?

Verfasst: 27.11.2024 13:48
von Kiffi
Then hat geschrieben: 27.11.2024 13:22 Ich meine schon den Text in PB als String einlesen... ohne Steuerzeichen etc.
würde ich persönlich mit einem Commandlinetool (z.b. pdftotext (https://www.xpdfreader.com/download.html)) realisieren, welches Du dann per RunProgram() aufrufen kannst.

Re: PDFs lesen?

Verfasst: 27.11.2024 14:05
von H.Brill
Da hat doch schon jemand was dazu gemacht. Ich Suche mal als PurePDF.............
Und schon was gefunden :
https://www.purebasic.fr/german/viewtop ... it=PurePDF

Könnte dir vielleicht weiterhelfen.

Re: PDFs lesen?

Verfasst: 27.11.2024 15:28
von Then
Sorry, damit kann man leider nur PDFs erstellen, aber nicht lesen. Oder habe ich da was übersehen ??

Re: PDFs lesen?

Verfasst: 28.11.2024 00:20
von Axolotl
Probier mal das. Nutzt pdftotext, wie Kiffi schon vorgeschlagen hat
https://www.purebasic.fr/english/viewto ... 38#p568838

Re: PDFs lesen?

Verfasst: 28.11.2024 15:27
von NicTheQuick
Text aus PDFs zu extrahieren ist eine Wissenschaft für sich. Nur wenn ein PDF auch barrierefrei und damit sauber getagt ist (was die wenigsten sind), kannst du Text ordentlich und in der richtigen Reihenfolge extrahieren. Denn PDFs waren nie dafür gedacht maschinenlesbar zu sein, sondern immer nur dafür etwas menschenlesbar oder zum Drucken darzustellen.

Ich würde deshalb auf externe Tools zugreifen, und da gibt es ein paar, die das halbwegs gut können. Da hilft dir am besten Google oder ChatGPT. Meine Erfahrung damit ist sehr eingerostet und lange her.

Re: PDFs lesen?

Verfasst: 28.11.2024 16:02
von Then
Vielen Dank für die Antworten. Wäre es denn möglich, das PDF im Hintergrund unsichtbar zu öffnen, STRG + A & STRG & C zu senden und dann zu schließen. Dann hätte ichs im Clipboard und da kann ich mit arbeiten