nntp2http.com
Posting
Suche
Optionen
Hilfe & Kontakt

Re: F: Codepage Konvertierung

Von: Bodo Thiesen (bothie@gmx.de) [Profil]
Datum: 02.06.2008 02:15
Message-ID: <g1ve3l$rou$00$1@news.t-online.com>
Newsgroup: de.comp.lang.c
* Stefan Reuther <stefan.news@arcor.de> hat geschrieben:

>* Bodo Thiesen wrote:
>> Dir geht es um Umwandlungen von einer Codepage in die andere? Nichts
>> leichter als das:
> Wer sowas sagt, dem empfehle ich die Lektüre der Dokumentation von GNU
> recode.

Kannst Du kurz zusammenfassen, was Du damit meinst? (Gerne via PN, falls
es über (1) und (2) hinausgeht.)

> Dem OP natürlich auch, falls er nach 2 1/2 Jahren hier noch mitliest.

ARGH!

Das ist ein "Feature" das ich an Claws-Mail so gerne habe: Immer
standardmäßig die ältesten Posts oben anzeigt ...

>> Du brauchst eine virtuelle Codepage, die ALLE Zeichen enthält. (Unicode
>> wäre ein guter Ansatz, leider nehmen die ja nicht alle Zeichen auf, so
daß
>> Du also einen erweiterten Zeichensatz brauchst.)
> Ooooch, würde mich wundern, wenn du mit deinem Algorithmus auf ein
> Zeichen stößt, das in einer Codepage drin ist, aber im Unicode nicht 
:-P

Nehme zum Beispiel den Klingonischen Zeichensatz. (Der OP sprach nicht von
iso-codepages. Für mich fallen da auch "nicht existierende" Codepages
drunter ;)

Aber so die trivialen (cp*, iso* usw) kann man natürlich auch auf uni
mappen.

>> Das eigentlich Aufwendige sind nicht die Algorithmen, sondern die
>> Tabellen ;)
> Die Tabellen bekommt man auf ftp.unicode.org oder aus RFC 1345.

Ich sagte NICHT, daß die Beschaffung aufwändig ist.

> (1) wenn man zwei Codepages hat, [...] reversible Transformation

Gut, das wird natürlich mit meinem Ansatz etwas tricky, aber bleibt
prinzipiell möglich (man kann sich dann aber nicht auf eine [256]-Tabelle
beschränken).

> (2) akzentuierten Zeichen, [...] nicht-akzentuierte Zeichen machen?

dito.

Allerdings sind beides Features, die zwar "schön" aber nicht
"notwendig"
sind. Läuft aber auch in diesem Fall wieder darauf hinaus, mehr Tabellen
zu haben - und was schrieb ich schon? -> Das eigentlich Aufwendige sind
die Tabellen. Denn c=codepage1_to_codepage2[c]; ist ja nun wirklich der
billigste Algorithmus, den ich kenne, und damit ist sowohl (1) als auch
(2) gelöst ;)

Gruß, Bodo


[ Auf dieses Posting antworten ]

Antworten