Regex für URIs nach RFC 3986
Datum: 17.06.2007 02:32
Message-ID: <83753$46748124$557c00d1$5028@news.inode.at>
Newsgroup: de.comp.standards de.comm.internet.misc
Hallo, Gruppe(n). Weil man immer wieder mal Code zum Erkennen einer URI nach RFC 3986 benötigt, ich aber auf die Schnelle keinen regulären Ausdruck für die dort spezifizierte Syntax finden konnte, habe ich mir Anhand der ABNF aus Appendex A selber einen gebastelt (wer will kann sich den hier (<http://ingomar.wesp.name/journal/rfc3986-uri-regex>) anschauen. Nun bin ich natürlich nicht ganz sicher, ob ich's nicht nicht an der einen oder anderen Stelle verpfuscht hab' (ich hab’ die Grammatik - besonders bei der Behandlung der diversen Notationen von IPv6-Adressen - ein wenig umgeformt) und würde gerne den Ausdruck gerne ausführlich testen. Deshalb meine Frage: Gibt’s irgendwo eine halbwegs umfangreiche Ansammlung gültiger und ungültiger generischer URIs (idealerweise auch mit vermurksten IPv6-Adressen), die man runterladen kann, um sie z.B. an egrep zu verfüttern? Alles Frische, Ingomar Wesp P.S.: Nein, ich hab’ an einem Samstag Abend wirklich nichts Besseres zu tun. P.P.S.: X-Post ohne fup2, weil ich nicht so recht weiß, wohin.[ Auf dieses Posting antworten ]
Antworten
- Stefan Ram (17.06.2007 02:35)
- Ingomar Wesp (17.06.2007 02:49)
