nntp2http.com
Posting
Suche
Optionen
Hilfe & Kontakt

Re: UTF8: cgi ist staerker als ich

Von: Peter J. Holzer (hjp-usenet2@hjp.at) [Profil]
Datum: 02.11.2007 21:19
Message-ID: <slrnfin1ip.qme.hjp-usenet2@zeno.hjp.at>
Newsgroup: de.comp.lang.perl.cgi
On 2007-11-02 07:28, Helmut Wollmersdorfer <helmut@wollmersdorfer.at> wrote:
> Peter J. Holzer wrote:
>
>> Für mache Sachen aber brauche ich ein explizites Upgrade:
>
>> $x = "\x{D6}";
>> $x =~ m/\w/;
>
>> matcht nicht ($x ist ein Bytestring, und da ist \x{D6} kein
>> Word-Charactet sondern irgendwas undefiniertes),
>
> War mir nicht bewusst.
> Also noch ein Grund, \w nicht zu verwenden. Die Menge \w ist ja eine
> durchaus veränderliche, je nach 'use utf8', 'no utf8', 'use locale', 'no
> locale'.
>
> Deshalb sollte man sich angewöhnen, lieber UNICODE-Properties zu verwenden:
>
> my $ident_pattern = '\p{Letter}\p{Number}_';

Tatsächlich, das funktioniert auch bei Bytestrings. Das war wiederum mir
nicht bewusst.

hp

--
_  | Peter J. Holzer    | It took a genius to create [TeX],
|_|_) | Sysadmin WSR       | and it takes a genius to maintain it.
| |   | hjp@hjp.at         | That's not engineering, that's art.
__/   | http://www.hjp.at/ |	-- David Kastrup in comp.text.tex

[ Auf dieses Posting antworten ]