2.4.1 Schriftsatz (character set)
-
1 Spezialschriftzeichen verschiedener Sprachen
-
2 ISO-Schriftsatz
Normen zu Zeichenkodierungen
⇒ Siehe "Inernet-Grundlagen":
Normen/Sektoren
Zeichenkodierung Allgemein
-
Unter Zeichenkodierung (englisch Character encoding, kurz Encoding)
versteht man das Darstellen eines Schriftzeichens, also eines Buchstabens,
einer Ziffer oder eines Symbols, mittels eines im Aufbau einfacheren oder
für die betreffende Anwendung geeigneteren Codes.
ISO 8859
-
Die ISO-8859-Familie wurde vom European Computer Manufacturer's
Association (ECMA) entwickelt. Es handelt sich um ein Set von
standardisierten Zeichenkodierungen für alphabetische Schriften.
Dazu gehören die lateinischen Schriften, auf denen die meisten
Sprachen Westeuropas und Amerikas beruhen, oder etwa die kyrillischen
Schriften.
-
Alle Kodierungen dieser Familie basieren auf der Speicherung eines
Zeichens mit genau einem Byte. Das heißt, die Codetabellen, auf
denen diese Kodierungen aufbauen, enthalten 256 mögliche Zeichen.
Bei allen Codetabellen sind die ersten 128 Zeichen, also die Zeichen
mit den Werten 0 bis 127, identisch mit der ASCII-Codetabelle.
Das hat den Vorteil, dass die üblichen lateinischen Groß- und
Kleinbuchstaben, die arabischen Ziffern und die üblichen
Sonderzeichen wie Satzzeichen oder kaufmännische Zeichen bei
diesen Kodierungen immer zur Verfügung stehen.
ISO 8859-1 (Latin-1)
-
Die Codetabelle dieser Kodierung enthält die schriftspezifischen
Zeichen für westeuropäische und amerikanische Sprachen.
Der Zeichenvorrat deckt die Sprachen Albanisch, Dänisch, Deutsch,
Englisch, Färöisch, Finnisch, Französisch, Galizisch, Irisch,
Isländisch, Italienisch, Katalanisch, Niederländisch, Norwegisch,
Portugiesisch, Schwedisch und Spanisch ab.
-
Eiinzelne Zeichen wie das niederländische ?, die französischen
Ligaturen œ (&oelig) und Œ (Œ) oder
die deutschen Anführungszeichen „ („) und “
(&ldquo) fehlen.
ISO 8859-2 (Latin-2)
-
Die Codetabelle dieser Kodierung enthält die schriftspezifischen
Zeichen für die meisten mitteleuropäischen und slawischen Sprachen.
Sie deckt die Sprachen Kroatisch, Polnisch, Rumänisch, Slowakisch,
Slowenisch, Tschechisch und Ungarisch ab.
ASCI Codes (American Standard Code for Information Interchange)
ISO 646 Internationale Alphabet Nr. 5 (IA5)
-
3 Umlaute
a) Zu ersetzende Buchstaben
uml;
-
ä durch ä = a Umlaut
-
Ä durch Ä = A Umlaut
-
ö durch ö = o Umlaut
-
Ö durch Ö = O Umlaut
-
ü durch ü = u Umlaut
-
Ü durch Ü = U Umlaut
-
ë durch "ë"
-
Ë durch "Ë"
-
ï durch "ï"
-
Ï durch "Ï"
zlig;
-
ß durch ß = deutsches Doppel s
acute;
-
é durch é
-
É durch "É"
grave;
-
à durch à
-
À durch À
-
è durch è
-
È durch È
circ;
-
â durch â
-
 durch Â
-
ê durch "ê"
-
Ê durch "Ê"
cedil;
lig;
-
æ durch "æ"
-
Æ durch "Æ"
-
œ durch "œ"
-
Œ durch "Œ"
slash;
-
ø durch ø = durchgestrichener Buchstabe
-
Ø durch Ø = durchgestrichener Buchstabe
b) Beispiel
1) Wie das im Quelltext geschrieben wird:
<p>Ich hätte ähnliche Übungen
öfters machen müssen</p>
2) Was der Browser dann anzeigt:
Ich hätte ähnliche Übungen öfters machen müssen
c) Workshops
-
4 Sonderzeichen
a) Oft gebrauchte Sonderzeichen
-
© durch © = Copy-Zeichen
-
® durch ® = registry = Registriert-Zeichen
-
€ durch € = Euro-Zeichen
-
† durch † = Gestorben-Zeichen
-
• durch • = Bullauge-Punkt
-
– durch – = dash = kurzer Strich
-
— durch — = dash = langer Strich
-
⇒ durch ⇒ = Arrow = Doppel-Pfeil nach rechts
(Achtung: für den Doppelpfeil ist "Arr" gross geschrieben)
Bemekung: Der Internet Explorer Version 6 kennt dieses Zeichen nicht
-
→ durch → = right arrow = Einfacher Pfeil nach rechts
(Achtung: für den einfachen Pfeil ist "arr" klein geschrieben)
b) Sonderzeichen, die im Dokument keine Funktion ausführen dürfen
Diese Zeichen müssen in diesem Fall im Quelltext ersetzt werden:
-
" durch " = quotation mark = Anführungs-Zeichen
-
« durch « = left quotation mark = links Anführungszeichen (oder links Hinweis)
-
» durch » = right quotation mark = rechts Anführungszeichen (oder rechts Hinweis)
-
& durch & = ampersand = kommerzielles UND-Zeichen
-
# durch # = Rautetaste = "Gartenhaag" = dièse (franz.)
-
{ durch { = geschweifte Klammer öffnend
-
} durch } = geschweifte Klammer schliessend
-
= durch = = Gleichheitszeichen = "Gleich"
-
< durch < = lower than = kleiner als
-
> durch > = greater than = grösser als
-
± durch ± = plus minus
-
× durch × = multipliziert mit
-
÷ durch ÷ = geteilt durch
-
∗ durch ∗
c) Zeichen, die in ISO 8859-1 (Latin-1) nicht enthalten sind
Bei der Überprüfung werden diese Zeichen als Fehler angezeigt.
Deutsche Anführungszeichen
-
„ durch „
-
“ durch &ldquo
d) Weitere Sonderzeichen
| Zeichen |
Windows 1252 Dezimal |
Unicode Dezimal Zeichenreferenz |
Unicode Hexadezimal Zeichenreferenz |
Entity-Referenz |
| › ‹ |
0155 |
0139 |
› |
‹ |
› |
‹ |
› |
‹ |
| » « |
0187 |
0171 |
» |
« |
» |
« |
» |
« |
| ‚ ‘ |
0130 |
0145 |
‚ |
‘ |
‚ |
‘ |
‚ |
‘ |
| „ “ |
0132 |
0147 |
„ |
“ |
„ |
“ |
„ |
“ |
| ’ |
0146 |
’ |
’ |
’ |
| – |
0150 |
– |
– |
– |
| — |
0151 |
— |
— |
— |
| ¼ |
0188 |
¼ |
¼ |
¼ |
| ½ |
0189 |
½ |
½ |
½ |
| ¾ |
0190 |
¾ |
¾ |
¾ |
| × |
0215 |
× |
× |
× |
| … |
0133 |
… |
… |
… |
| ∗ |
|
∗ |
∗ |
∗ |
e) Grundlagen und Workshops
-
Big Baer:
HTML 4.01 supports the ISO 8859-1 (Latin-1) character set.
The lower part of ISO-8859-1 (codes from 0-127) is the original 7-BIT ASCII standard.
Most of these characters can be used without a character reference.
The higher part of ISO-8859-1 (codes from 160-255) can all be used using character entity names.
HTML 4 Sonderzeichen
-
Digital Media Minute:
This page contains the 252 allowed entities in HTML 4 and XHTML 1.0,
as outlined in section 24 of the official HTML 4 specifications, published by the W3C.
XHTML Sonderzeichen
-
5 Formeln
⇒ Internet-Grundlagen:
Hard- und Software/Editor/Formeleditor
↑