wie bereits angedeutet, du musst
Little John hat geschrieben:Einen HTML-Parser [...] schreiben ...
das läuft also drauf hinaus, dass du den Quellcode der Seite als reinen Text bekommst,
und dein Programm muss ihn Interpretieren, um Formatierung und Inhalt sinnvoll zu trennen.
click mal bei irgendeiner seite wie spiegel oder n24 auf Ansicht -> Seitenquelltext anzeigen, dann siehst du es.
Wie schwierig das ist, hängt vor Allem davon ab, ob du da ein super Talent für hast, oder dich durchbeißen musst.
wenn du keine besondere Begabung fürs Parser-Programmieren besitzt, ist es eine mächtige Herausforderung,
die du dir da stellst, besonders da du ja so ganz am Anfang stehst.
Als Totaleinsteiger würde ich dir wirklich ein Projekt mit heringeren Ansprüchen ans Herz legen,
denn bei "von Null auf HTML-Parser" ist die Lernkurve extrem steil und die "Erfolgsbelohnung" in großem Abstand.
... und bitte komme mal der Bitte der Kollegen nach und passe die Titel deiner Threads an, dafür gibts am ersten Posting nen [Edit]-Button.
Der Narr denkt er sei ein weiser Mann.
Der Weise weiß, dass er ein Narr ist.