Diakritika im Text automatisch erzeugen lassen

Wie schön wäre es, wenn Sie beim Schreiben tschechischer Texte auf die diakritischen Zeichen verzichten könnten und stattdessen ein Programm sie im Nachhinein selbst hinzufügt?
Genau das bewerkstelligt das Online-Programm CZACCENT des Zentrums für natürliche Sprachverarbeitung der Informatik-Fakultät der Masaryk-Universität in Brünn.
Ich habe es kurz mit einem Satz aus dieser Meldung des Tages getestet.
Zunächst den Satz ohne Diakritika eingegeben:
Cesti hokejiste skoncili stejne jako v predchozich dvou letech uz ve ctvrtfinale mistrovstvi sveta.
CZACCENT hat diesen Satz umgewandelt in:
Čeští hokejisté skončili stejně jako v předchozích dvou letech už ve čtvrtfinále mistrovství světa.
Der Satz ist nach der Konvertierung orthographisch 100% richtig. Alle Diakritika stimmen. Dennoch sollten Sie vorsichtshalber einen Blick auf das Ergebnis werfen, falls Sie einen wichtigen Text schreiben.  Ich weiß nicht, ob das Programm jeder Prüfung standhält.
Es gibt noch ein Tool, das Diakritika hinzufügt, aber das nur halbautomisch und es steht auch nicht online zur Verfügung, sondern muss auf dem Rechner installiert werden. Es ist das Tool cz2cz, das ich im Posting Konverter für tschechische Zeichensätze beschrieben habe.

7 Kommentare

  1. Ja, schade. In der Unterzahl (wegen pingeligem Schiedsrichter) die ersten zwei Tore kassiert.
    Aber das Tor in Unterzahl 3 gegen 5 war auch nicht schlecht.

  2. Hallo Petra, danke für den Hinweis aud CZACCENT. Meine Frage (weil ich zu faul bin, das erst auszuprobieren: Kommt der Text dann beim Empfänger lesbar an – also ohne die üblichen Hieroglyphen?

    • @karin Der Output von CZACCENT hat die ISO-8859-2-Kodierung. Wenn das Email-Programm des Absenders und des Empfängers die Kodierung des Textes als ISO-8859-2 erkennt, bleibt der Text 1:1 erhalten (in diesem Fall lesbar in der ISO-8859-2-Kodierung).
      Heutige Email-Programme erkennen die richtige Kodierung des Textes (dabei auf die neueste Version des Emails-Programm achten. Vorallem beim Outlook.). Wenn der Text beim Empfänger dennoch nicht lesbar ankommt, dann empfiehlt sich zum Abschicken von Emails im Email-Programm die UTF-8-Kodierung einzustellen.

  3. wieder so ein nützlich Ding. Danke für den guten Tip. (Ich verweigere michd er neuen dt. Rechtschreibung wo immer es geht 😉

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert