Benutzer-Werkzeuge

Webseiten-Werkzeuge


webedition:administration:charset-conversion-of-legacy-sites

Zeichensatz-Umstellung älterer Sites von ISO auf UTF-8

Eine automatisierte Umstellung einer Site von einem ISO Zeichensatz auf UTF-8 wird von webEdition nicht unterstützt.

Zwar läßt sich nachträglich (im Dialog Hilfe→Update, Tab Sprachen) eine UTF-8 Benutzeroberfläche installieren (z.B. Deutsch_UTF-8), im Einstellungsdialog (Extras→Einstellungen→Allgemein) im Tab Oberfläche die Sprache entsprechend ändern und UTF-8 als Standard-Charset wählen, die eigentliche Umstellung muss dann jedoch von Hand erfolgen. Für jedes Dokument/Objekt usw. ist der eingestellte Zeichensatz zu ändern, anschließend sind alle Umlaute in allen Dokumenten/Objekten, der Navigation usw. von Hand zu korrigieren. Ein Vorgehen, das sich nur für kleine Sites realistisch umsetzen läßt.

Ab der Version 6.1.0 bietet sich jedoch ein Weg, der die manuellen Umstellungsarbeiten drastisch reduziert.

Nicht alle Sites, die das Shopmodul verwenden, können in dieser Version bereits umgestellt werden. Ein Erfolg ist abhängig von den verwendeten Features und der Serverkonfiguration. Für die nächste Version ist eine Erweiterung der Umstellungsmöglichkeiten geplant.

Dieser besteht im Import eines WE-Backups in eine neu installierte (leere) webEdition-Version. Dabei wird die Fähigkeit des XML-Parsers genutzt, eine Zeichenkonvertierung in einen Zielzeichensatz vorzunehmen.

Notwendige Vorarbeiten

Neue Installation

  • Die Installation sollte in ein leeres Verzeichnis und einer nicht belegten Domain (z.B. in einer Sub-Domain) direkt mit einer UTF-8 Benutzeroberfläche erfolgen (z.B. Deutsch_UTF-8). Dabei ist darauf zu achten, das die Datenbank die Kollation utf-8 aufweist (z.B. utf8_general_ci), dies sollte gegebenfalls extern (z.B. phpMyAdmin) überprüft werden.
  • In den Einstellungen (Menü Extras→Einstellungen→Allgemein) sollte im Tab Oberfläche neben der Sprache (z.B. Deutsch (UTF-8)) der Standard-Charset auf UTF-8 festgelegt werden, Im Tab System der Verbindungszeichensatz ebenfalls auf utf8 festgelegt werden.
  • Alle Module sollten aktiviert sein
  • Die Backup-Geschwindigkeit sollte relativ niedrig angesetzt werden, da die Konvertierung Zeit und Ressourcen verbraucht

Alt-Installation

  • Alle Dokumente/Objekte sollten entweder geparkt oder veröffentlicht sein. Da die Tabelle TemporaryDocs nicht vollständig unterstützt wird, müssen modifizierte, aber in der letzten Version noch nicht veröffentlichte Dokumente (blau) vermieden werden.
  • DB/Objekt-Modul: In allen Klassen ist unbedingt darauf zu achten, dass in den Feld-Beschreibungen und in den Feld-Voreinstellungen keine Umlaute mehr enthalten sind! Bleibt bei einer Klasse in diesen beiden Fällen auch nur ein Umlaut erhalten, so sind die gesamten Voreinstellungen und Beschreibungen dieser Klasse verloren und müssen "von Hand" nachgetragen werden. Die Voreinstellungen müssen gegebenenfalls für den anschließenden Backup-Vorgang umbenannt werden (ü→ue usw.).
  • Erstellung eines Backups, dabei sollten die folgenden Optionen abgeschaltet werden: Einstellungen sichern, Temporäre Dateien sichern und Daten der Rechtschreibprüfung sichern (diese werden beim Wiedereinspielen sowieso nicht übernommen). Angeschaltet werden sollte die Option webEdition-externe Dateien/Verzeichnisse sichern und Logbuch erstellen.

Durchführung der Umstellung

Die Umstellung sollte auf keinen Fall durch Einspielen des Backups in eine vorhandene Installation erfolgen!

Dabei droht vollständiger Datenverlust

  • Einspielen des Backups mit der Option Beim Einspielen des Backups Umstellung der Installation von ISO auf UTF-8.
  • DB/Objekt-Modul: Überprüfung, gegebenenfalls Korrektur der Voreinstellungen / Beschreibungstexte.
  • Durchführen von Rebuilds:
    Dokumente und Vorlagen (dabei Haupttabelle und Temporäre Tabelle neu speichern anwählen)
    Objekte
    Index-Tagelle,
    Navigation

In Einzelfällen (bei Backups aus sehr alten Versionen) eventuell notwendig:

  • manuelle Einstellung des Zeichensatzes in den Klassen
    Anschließend Übertragen des in der Klasse eingestellten Zeichensatzes auf die einzelnen Objekte (im Tab "Arbeitsbereich" des Objekt-Ordners in einem Rutsch für alle Objekte einer Klasse möglich)

Weiterführende Informationen

webedition/administration/charset-conversion-of-legacy-sites.txt · Zuletzt geändert: 2015/12/22 16:30 von Marc Krämer

Recent changes RSS feed