HTML/Unicode/UTF-8

Papyrus kann bei mir nicht ordentlich mit Unicode/UTF-8 umgehen - und schon gar nicht mit UTF-8-codierten HTML-Seiten. Wenn ich eine HTML-Seite mit korrektem Meta-Tag für UTF-8 lade, erscheint der bekannte Zeichengulasch.

Einen UTF-8-Text mit BOM (das ist die interne Kennung für Unicode-Texte) muss ich ausdrücklich als UTF-8 öffnen, aber auch dann wird der BOM nicht ausgeblendet, sondern es stehen zwei verfuschte Zeichen vor dem eigentlichen Text. Öffne ich das Dokument als normalen Text, wird er überhaupt nicht als UTF-8 aufgefasst. Eigentlich sollten der BOM und bei HTML-Seiten der Meta-Tag genau so etwas verhindern.

Das ist auch so nicht gedacht, dass Papyrus Unicode HTML Seiten zur Weiterverarbeitung einladen kann.

Unsere HTML Funktionalität soll keinen aufwändigen HTML Editor ersetzen, sondern einem nur erlauben, schnell mal aus Texten eine Internet-Seite zu bauen.

Basis ist ja daher auch “nur” HTML 3.2, da das für eben diese Anwendung reicht.