Re: UTF8: cgi ist staerker als ich
Von: Peter J. Holzer (hjp-usenet2@hjp.at) [Profil]
Datum: 02.11.2007 21:19
Message-ID: <slrnfin1ip.qme.hjp-usenet2@zeno.hjp.at>
Newsgroup: de.comp.lang.perl.cgi
Datum: 02.11.2007 21:19
Message-ID: <slrnfin1ip.qme.hjp-usenet2@zeno.hjp.at>
Newsgroup: de.comp.lang.perl.cgi
On 2007-11-02 07:28, Helmut Wollmersdorfer <helmut@wollmersdorfer.at> wrote: > Peter J. Holzer wrote: > >> Für mache Sachen aber brauche ich ein explizites Upgrade: > >> $x = "\x{D6}"; >> $x =~ m/\w/; > >> matcht nicht ($x ist ein Bytestring, und da ist \x{D6} kein >> Word-Charactet sondern irgendwas undefiniertes), > > War mir nicht bewusst. > Also noch ein Grund, \w nicht zu verwenden. Die Menge \w ist ja eine > durchaus veränderliche, je nach 'use utf8', 'no utf8', 'use locale', 'no > locale'. > > Deshalb sollte man sich angewöhnen, lieber UNICODE-Properties zu verwenden: > > my $ident_pattern = '\p{Letter}\p{Number}_'; Tatsächlich, das funktioniert auch bei Bytestrings. Das war wiederum mir nicht bewusst. hp -- _ | Peter J. Holzer | It took a genius to create [TeX], |_|_) | Sysadmin WSR | and it takes a genius to maintain it. | | | hjp@hjp.at | That's not engineering, that's art. __/ | http://www.hjp.at/ | -- David Kastrup in comp.text.tex[ Auf dieses Posting antworten ]
