Ich hab im Zuge eines Freizeitprojekts nun riesige Strings zu verarbeiten. Genaugenommen handelt es sich um Datein mit IMDB Daten. Beispielsweise die trivia.list von ftp://ftp.fu-berlin.de/pub/misc/movies/database/
oder für die aktuelle Anfrage besser geeignet: Die ratings.list
Es ist eine ewige Liste mit allen in der IMDB eingetragegen Filmen im Format:
0000000125 753 9.2 "The Simpsons" (1989) {Who Shot Mr. Burns?: Part 1 (#6.25)}
bzw. nur
0000002113 75 7.0 Avatar: Creating the World of Pandora (2010) (TV)
Durchsuche ich diese mit RegEx, dauert es schon merklich auf dem langsamen PC an dem ich gerade bin.
"RegEx von hand" also Findstring gehts schon schneller, aber ich frage mich was man noch alles tun kann.
Das Programm läuft dabei jeweils nur ein bis 2 mal mit der selben Liste, umfangreiche Umstrukturierung der Liste um nachher Vorteile zu haben lohnen sich also nicht.
Folgende Optimierungsfälle:
- Ich habe eine Serie und möchte die Bewertungen der Episoden.
Hier geht Filtern nach Serienname und im Ergebnis nach der Episoden suchen hinreichend schnell. - Ich suche die Bewertungen von verschiedenen Filmen, das dauert im Moment deutlich zu lang



