Hallo Leute,
ich habe folgendes Problem:
In einer TXT Datei sind 177000 URLS enthalten.
Je eine Pro Zeile. Nun muss / sollte folgendes Passieren:
1. Doppelte Einträge sollten entfernt werden.
2. Alle URLs sollte auf "Konformität" geprüft werden (also http://www.domain.tld)
Fehlende Angaben (z.B. http://domain.tld -> http://www.domain.tld)
3. Die URLs sollten gekürzt werden
Und zwar auf http://www.domain.tld also http://www.domain.tld/tolle/seite.php?gui=esksdfkshkf -> http://www.domain.tld/
Jetzt habe ich keinen blassen Schimmer wie ich anfangen soll
Für jeden Hinweis / Tipp wäre ich rechte dankbar.
Lars