Re: F: Codepage Konvertierung
Von: Bodo Thiesen (bothie@gmx.de) [Profil]
Datum: 02.06.2008 02:15
Message-ID: <g1ve3l$rou$00$1@news.t-online.com>
Newsgroup: de.comp.lang.c
Datum: 02.06.2008 02:15
Message-ID: <g1ve3l$rou$00$1@news.t-online.com>
Newsgroup: de.comp.lang.c
* Stefan Reuther <stefan.news@arcor.de> hat geschrieben: >* Bodo Thiesen wrote: >> Dir geht es um Umwandlungen von einer Codepage in die andere? Nichts >> leichter als das: > Wer sowas sagt, dem empfehle ich die Lektüre der Dokumentation von GNU > recode. Kannst Du kurz zusammenfassen, was Du damit meinst? (Gerne via PN, falls es über (1) und (2) hinausgeht.) > Dem OP natürlich auch, falls er nach 2 1/2 Jahren hier noch mitliest. ARGH! Das ist ein "Feature" das ich an Claws-Mail so gerne habe: Immer standardmäßig die ältesten Posts oben anzeigt ... >> Du brauchst eine virtuelle Codepage, die ALLE Zeichen enthält. (Unicode >> wäre ein guter Ansatz, leider nehmen die ja nicht alle Zeichen auf, so daß >> Du also einen erweiterten Zeichensatz brauchst.) > Ooooch, würde mich wundern, wenn du mit deinem Algorithmus auf ein > Zeichen stößt, das in einer Codepage drin ist, aber im Unicode nicht :-P Nehme zum Beispiel den Klingonischen Zeichensatz. (Der OP sprach nicht von iso-codepages. Für mich fallen da auch "nicht existierende" Codepages drunter ;) Aber so die trivialen (cp*, iso* usw) kann man natürlich auch auf uni mappen. >> Das eigentlich Aufwendige sind nicht die Algorithmen, sondern die >> Tabellen ;) > Die Tabellen bekommt man auf ftp.unicode.org oder aus RFC 1345. Ich sagte NICHT, daß die Beschaffung aufwändig ist. > (1) wenn man zwei Codepages hat, [...] reversible Transformation Gut, das wird natürlich mit meinem Ansatz etwas tricky, aber bleibt prinzipiell möglich (man kann sich dann aber nicht auf eine [256]-Tabelle beschränken). > (2) akzentuierten Zeichen, [...] nicht-akzentuierte Zeichen machen? dito. Allerdings sind beides Features, die zwar "schön" aber nicht "notwendig" sind. Läuft aber auch in diesem Fall wieder darauf hinaus, mehr Tabellen zu haben - und was schrieb ich schon? -> Das eigentlich Aufwendige sind die Tabellen. Denn c=codepage1_to_codepage2[c]; ist ja nun wirklich der billigste Algorithmus, den ich kenne, und damit ist sowohl (1) als auch (2) gelöst ;) Gruß, Bodo[ Auf dieses Posting antworten ]
Antworten
- Florian E. Teply (02.06.2008 11:50)
- Bodo Thiesen (02.06.2008 13:26)
- Florian E. Teply (02.06.2008 13:59)
- Stefan Reuther (03.06.2008 18:45)
