PDFs lesen?

Anfängerfragen zum Programmieren mit PureBasic.
Benutzeravatar
Then
Beiträge: 284
Registriert: 06.09.2004 13:26
Wohnort: Siegen

PDFs lesen?

Beitrag von Then »

Mal ne vielleicht blöde Frage, aber kann man mit PB irgendwie PDFs öffnen und lesen ?

Nach PDF kann man leider hier nicht suchen, weil mehr als 3 Buchstaben gefordert werden. :|

Gibts da ne noch unterstützte Lib oder sowas ?
PB 6.10LTs / Windows 11 64Bit (i9/32GB/ 1TB-SSD+4TB-HDD/3060GTX12GB) / 2x27" Multitouch

... ich mache dazu keine Aussage, weil ich mich damit selbst belasten könnte !
Benutzeravatar
Kiffi
Beiträge: 10714
Registriert: 08.09.2004 08:21
Wohnort: Amphibios 9

Re: PDFs lesen?

Beitrag von Kiffi »

Then hat geschrieben: 27.11.2024 12:32Nach PDF kann man leider hier nicht suchen, weil mehr als 3 Buchstaben gefordert werden. :|
finde ich auch doof, denn als Programmierer sucht man häufig 3 Zeichen lange Extensionen.

Aber versuch mal das hier: https://www.google.com/search?q=pdf+sit ... r%2Fgerman
a²+b²=mc²
Benutzeravatar
dige
Beiträge: 1239
Registriert: 08.09.2004 08:53

Re: PDFs lesen?

Beitrag von dige »

Was meinst du denn mit lesen? Möchtest du auf den Inhalt/Text mit PB zugreifen oder soll das PDF einfach nur visuell lesbar sein? Falls letzteres, könntest du einfach das WebGadget (Edge) dafür nehmen.
"Papa, ich laufe schneller - dann ist es nicht so weit."
Benutzeravatar
Then
Beiträge: 284
Registriert: 06.09.2004 13:26
Wohnort: Siegen

Re: PDFs lesen?

Beitrag von Then »

Ich meine schon den Text in PB als String einlesen... ohne Steuerzeichen etc.
PB 6.10LTs / Windows 11 64Bit (i9/32GB/ 1TB-SSD+4TB-HDD/3060GTX12GB) / 2x27" Multitouch

... ich mache dazu keine Aussage, weil ich mich damit selbst belasten könnte !
Benutzeravatar
Kiffi
Beiträge: 10714
Registriert: 08.09.2004 08:21
Wohnort: Amphibios 9

Re: PDFs lesen?

Beitrag von Kiffi »

Then hat geschrieben: 27.11.2024 13:22 Ich meine schon den Text in PB als String einlesen... ohne Steuerzeichen etc.
würde ich persönlich mit einem Commandlinetool (z.b. pdftotext (https://www.xpdfreader.com/download.html)) realisieren, welches Du dann per RunProgram() aufrufen kannst.
a²+b²=mc²
Benutzeravatar
H.Brill
Beiträge: 496
Registriert: 15.10.2004 17:42
Wohnort: 66557 Neunkirchen

Re: PDFs lesen?

Beitrag von H.Brill »

Da hat doch schon jemand was dazu gemacht. Ich Suche mal als PurePDF.............
Und schon was gefunden :
https://www.purebasic.fr/german/viewtop ... it=PurePDF

Könnte dir vielleicht weiterhelfen.
PB 6.10
Benutzeravatar
Then
Beiträge: 284
Registriert: 06.09.2004 13:26
Wohnort: Siegen

Re: PDFs lesen?

Beitrag von Then »

Sorry, damit kann man leider nur PDFs erstellen, aber nicht lesen. Oder habe ich da was übersehen ??
PB 6.10LTs / Windows 11 64Bit (i9/32GB/ 1TB-SSD+4TB-HDD/3060GTX12GB) / 2x27" Multitouch

... ich mache dazu keine Aussage, weil ich mich damit selbst belasten könnte !
Axolotl
Beiträge: 278
Registriert: 31.12.2008 16:34

Re: PDFs lesen?

Beitrag von Axolotl »

Probier mal das. Nutzt pdftotext, wie Kiffi schon vorgeschlagen hat
https://www.purebasic.fr/english/viewto ... 38#p568838
Using PureBasic latest stable version and current alpha/beta (x64) on Windows 11 Home
Benutzeravatar
NicTheQuick
Ein Admin
Beiträge: 8809
Registriert: 29.08.2004 20:20
Computerausstattung: Ryzen 7 5800X, 64 GB DDR4-3200
Ubuntu 24.04.2 LTS
GeForce RTX 3080 Ti
Wohnort: Saarbrücken

Re: PDFs lesen?

Beitrag von NicTheQuick »

Text aus PDFs zu extrahieren ist eine Wissenschaft für sich. Nur wenn ein PDF auch barrierefrei und damit sauber getagt ist (was die wenigsten sind), kannst du Text ordentlich und in der richtigen Reihenfolge extrahieren. Denn PDFs waren nie dafür gedacht maschinenlesbar zu sein, sondern immer nur dafür etwas menschenlesbar oder zum Drucken darzustellen.

Ich würde deshalb auf externe Tools zugreifen, und da gibt es ein paar, die das halbwegs gut können. Da hilft dir am besten Google oder ChatGPT. Meine Erfahrung damit ist sehr eingerostet und lange her.
Benutzeravatar
Then
Beiträge: 284
Registriert: 06.09.2004 13:26
Wohnort: Siegen

Re: PDFs lesen?

Beitrag von Then »

Vielen Dank für die Antworten. Wäre es denn möglich, das PDF im Hintergrund unsichtbar zu öffnen, STRG + A & STRG & C zu senden und dann zu schließen. Dann hätte ichs im Clipboard und da kann ich mit arbeiten
PB 6.10LTs / Windows 11 64Bit (i9/32GB/ 1TB-SSD+4TB-HDD/3060GTX12GB) / 2x27" Multitouch

... ich mache dazu keine Aussage, weil ich mich damit selbst belasten könnte !
Antworten