nntp2http.com
Posting
Suche
Optionen
Hilfe & Kontakt

RegEx-Problem mit URL-Syntax

Von: Ben Butschko (excalibur1976@arcor.de) [Profil]
Datum: 20.10.2009 10:47
Message-ID: <4add790c$0$7615$9b4e6d93@newsspool1.arcor-online.net>
Newsgroup: de.comp.lang.php.misc
Moin,

ab dem 23.10.2009 führt die Denic neue Domain-Regeln ein. So können
künftig ein- und zweistellige Domains sowie reine Zifferndomains
registriert werden.

In diesem Zuge will ich entsprechend einen Regulären Ausruck zwecks
Überprüfung einer gültigen URL aufbauen. Hier habe ich leider meine
Probleme.

Der regex sieht bis jetzt wie folgt aus:

/^(http|https):\/\/([A-Z0-9+-äÄöÖüÜ]*(?:\.[A-Z0-9+-ä&Au
ml;öÖüÜ]*)+):?(\d+)?\/?/i

Also mein Problem ist IMO nur, das die TLD nicht mehr als 3 Zeichen
zulassen sollte.
Problem ist, so denke ich, das eine TLD nicht nur .com oder .de sein
kann, sondern auch .com.cn

Folgende URLs sollen beispielhaft korrekt sein (sind sie auch):

http://www.ex.de
http://www.e.de
http://ex.de
http://www.example.com.cn
http://www.exampleöäü.de
http://www.123.de

Folgende URLs sind beispielhaft *nicht* korrekt (das hier bildet leider
mein regex nicht ab):
http://www..de
http://www.example.com.cnnnnnnnnnnn
www.example.commmmmm


Wäre dankbar für Eure Hilfe

Netten Gruß
Ben



[ Auf dieses Posting antworten ]

Antworten