Digitalisierung Lexikon ’88
inkl. Geographisches Lexikon der Schweiz
- Monatlich ca. 2 Feedbacks von LesernAusblick
Anhang: Checkliste für Korrekturen
Formatierungen in Pseudo- HTML
Besten Dank im Voraus für Ihre wertvolle Unterstützung!
Einleitung
![]()

Fig. 1: Homepage, Startseite www.peter-hug.ch
Hinweis: Die URI-Adresse //localhost/ steht auf den Abbildungen an Stelle von //www.peter-hug.ch/.
für das Lexikon mit mehr als 100'000 Artikeln, vielfältigen Links, Quellen und Zitaten:
Dies ist eine aktuelle Form von "Nachschlagewerken des allgemeinen Wissens" mit vielfältigen Links. Eine typische Seite zeigt die Vielfalt. Die Angaben sind aus Werken vom 19. Jahrhundert, erarbeitet von Christian Aschoff. Liste aller Artikel.
Danksagung: Hardware: Bruno Bossert (CH-Kerzers); OCR: OmniPage 16.1 (Nuance); Software: SAS Institut (USA-Cary); Provider: www.hostpoint.ch (CH-Rapperswil); Begleitung: Liliane Regamy (Nationalbibliothek der Schweiz); Idee: Christian Aschoff (D-Ulm); Fachliche Beratung: Carl-Philipp Albert (D-Tübingen); Sponsoren: -; Gewidmet: Meiner Familie.
Barrierefreiheit / Textgröße: kleiner,
normal, grösser.
Diese Website soll möglichst klar und einfach nutzbar sein. Deshalb
berücksichtigt sie die Richtlinien für Webinhalte (WCAG V1.0) mit XHTML 1.1 und
CSS. Alle Spezifikationen des W3C werden so weit wie möglich befolgt.
Kontaktieren Sie mich bitte, wenn diese Website in irgendeiner Hinsicht nicht
standardgemäß oder barrierefrei sein sollte.
Rechtliche Hinweise:
Darstellung, Funktion und Präsentation vom Lexikon '88 sind Werke im Sinne vom
Schweizerischen Urheberrechtsgesetz. Obwohl die Informationen mit grösster
Sorgfalt zusammengetragen und geprüft werden, kann es sein, dass sie
unvollständig oder gar falsch sind. Die Verantwortung für die Handhabung der
Daten und Inhalte liegt beim Nutzer der Ergebnisse. Wir können keine Haftung
für Schäden, welche in diesem Zusammenhang entstanden sind, übernehmen.
Peter Hug. Ich freue mich über ein Feedback! Breitmattweg 6
CH-3173 Oberwangen bei Bern
Telefon: +41 (0)51 220 26 66 (Büro)
E-Mail: familie.hug@swissonline.ch
![]()

Fig. 2: Lexikon Menüs
Die Quelle der meisten Texte ist die RetroBibliothek.de, die neben anderen Werken eine Digitale Ausgabe von Meyers Konversations-Lexikon enthält, aus dem Verlag des Bibliographischen Instituts, Leipzig und Wien, Vierte Auflage, 1885-1892.
Die Darstellung folgt so stark wie möglich dem Original, z. B. bei grossen Zahlen, Jahrzahlen, kursiven Abkürzungen von naturwissenschaftlichen Autoren etc. Speziell zu erwähnen sind einige Elemente für die Präsentation im Internet:
10. Ziffern nach dem Dezimalkomma werden mit kleiner Schrift angezeigt, z. B. π = 3,14159. In Tabellen werden Dezimalpunkte statt Kommata geschrieben. Damit können Tabellen und Zahlen direkt in EXCEL übertragen werden.
![]()

Fig. 3: Bilder über das Geographische Lexikon der Schweiz, Band 1
Einige Hinweise zum Aufbau der URL-Links in der Adresszeile
der Browser.
Die Parameter bedeuten 1=ein, 0=aus:
|
Basis + |
http://www.peter-hug.ch/lexikon |
|
Band 4, Seite 37 |
Die Basis mit /04_0037 ergänzen, z. B. http://www.peter-hug.ch/lexikon/04_0037 |
|
Artikel "Zinsrechnung" |
Jede
Suche entspricht auch einem Link. Die Basis mit /Zinsrechnung ergänzen, |
|
Originalformat |
Den Link
mit ?asis=1 ergänzen,
|
|
Ergänzungen zeigen |
Den Link
mit ?Lvoll=1
ergänzen, |
|
Lange Listen |
Den Link
mit /Alle_Elemente?Lvoll=1
ergänzen, |
|
Kurze Listen |
Den Link
mit /Limit_Elemente?Lvoll=1
ergänzen, |
|
Druckformat
|
Den Link
mit ?Typ=Druck
ergänzen, |
|
PDF
Format |
Den Link
mit ?Typ=PDF
ergänzen, |
|
Mobile |
Für
einfachste Anzeige mit ?Typ=Mobile
ergänzen, |
|
Sicher
|
https:// = verschlüsseltes Protokoll mit https://www.peter-hug.ch/lexikon |
Zur Optimierung vom Lexikon '88 werden verschiedene Hilfsmittel eingesetzt: Einträge aus dem Server Log zeigen, welche Artikel gefragt wurden. Listen über mögliche Wortfehler, die Artikelfolge, unvollständige Links und Datenbankgrösse zeigen kritische Stellen. Verzeichnisse zeigen Tabellen, Zwischentitel und "lange Wörter" im Lexikon '88. Bei Bedarf können das Datenmodell und die SAS-Programme erläutert werden. Allgemeinen Charakter hat die grosse Tabelle mit definierten Zeichen.
Boudry

Fig. 4: Suche nach Boudry
Basis sind mit Scanner digitalisierte Faksimile, welche mit Optical Character Reading (OCR) in Text umgewandelt wurden. Mit eigener Software legen wir darüber ein Netzwerk aus vielseitigen Links innerhalb der Texte.
Schriftprobe für die Schriftgrössen im Lexikon: Normal
Schriftprobe für die Schriftgrössen im Lexikon: klein
Schriftprobe für die Schriftgrössen im Lexikon: ganz klein
Verschiedene Wege führen zu den Seiten und zu den Artikeln im Lexikon:
a) Mit
"Suche" auf das zutreffende Stichwort oder die Seite.
b) Alle Artikel sind im detaillierten Inhaltsverzeichnis aufgeführt, das im
linken Fenster angezeigt werden kann.
c) Die Zitate zeigen alle jene Artikel, bei denen das betreffende Stichwort
verwendet wird.
Vielfältige Links führen zu weiteren Stellen, an denen mehr zum gesuchten Artikel vorhanden ist. Den ungefähren Inhalt und den grossen Umfang zeigen die Liste der Artikel und die Sitemap.
In diesem
Lexikon können Sie Aussagen zum 19. Jahrhundert an dem damaligen Zeitgeist
überprüfen. Stichworte sind über das Inhaltsverzeichnis zu finden oder mit der
Funktion "Suchen". Diese springt auch direkt zu einer bestimmten
Seite, z. B. mit 4.234 zu Band 4 Seite 234 oder mit
einem Stichwort zu einem bestimmen Artikel, z. B. mit Gold.
Über Links können Sie anschliessend im Thema von einem Artikel zum nächsten
verzweigen. Damit ist ein einfaches und umfassendes Bearbeiten von
Themengebieten möglich: Die Links zeigen in den Artikeln "vorwärts und
rückwärts".
Über Kontext und Themen sind zwei Suchen in
"diagonaler Richtung" verfügbar: Artikel sind auffindbar, die mit dem
gewählten Stichwort eine thematische Beziehung haben, z. B. benachbarte
Ortschaften oder im Bereich Landwirtschaft. Weitere Erläuterungen sind unter
den Hinweisen zu finden.
![]()
![]()

Fig. 5: Stichwort Boudry, Auswahl der Gemeinde
Die folgende Liste zeigt die Art der regelmässigen Kontrollen:
Systematisch wird überprüft, ob bei den Artikeln die alphabetische Reihenfolge stimmt und ob der Bezug zum Seitentitel korrekt ist.

Fig. 6: Typische Seite im Lexikon
Das interne Korrekturverfahren richtet sich nach folgenden Leitlinien:
![]()

Fig. 7: Übersicht nach Bildern
Im technischen Gerüst vom Lexikon '88 liest ein Programm in der Sprache SAS die Textseiten ein und speichert die Position von allen Artikeln (Stichwörtern) in einer SAS-Datenbank. Ein zweiter Durchgang prüft im Text jedes Wort, ob es mit einem Artikel übereinstimmt, unter Berücksichtigung der deutschen Grammatik (Bach = Bäche etc.). Mit Zwischentabellen ist das Lexikon schliesslich zweiseitig verknüpft mit Links im Text vorwärts zum erwähnten Schlagwort sowie zurück zu denjenigen Artikeln, die das aktuelle Stichwort enthalten ("wird zitiert in" = Volltextsuche). Dieses aufwändige Verfahren umfasst mehrere Schritte:
Im Output gibt es 3 Arten von Dateien: Die in XHTML übertragenen Textseiten vom Lexikon, z. B. Band 1 Seite 102 als Datei 01_0102.html, die Einträge aus Tabellen der Datenbank sowie Steuerprogramme, z. B. /lexikon mit Hilfsprogrammen, Fehlerlisten, Startseite, Legende, graphischen Symbolen etc. Sodann werden als Bilder alle Faksimile in Originalgrösse mit bis zu 600 dpi und als kleine Vorschau (=Thumbnail) gespeichert.
![]()

Fig. 8: Galerie aller Abbildungen
|
Name |
Peter Hug |
|
Geboren |
27. Juni 1960 |
|
Studium |
Mathematik an der Universität Zürich |
|
Zivilstand |
Verheiratet, 2 Töchter |
|
Wohnort |
CH-3173 Oberwangen bei Bern |
|
Telefon |
+41 (0)51 220 26 66 (Büro) |
|
|
familie.hug@swissonline.ch |
|
|
|
|
Arbeitgeber |
Schweizerische Bundesbahnen SBB |
|
Aufgaben |
Reisendenzählungen |
|
|
Ertragsanteile in Tarifverbunden |
|
|
Hochrechnung der Erlöse im Personenverkehr |
|
Interessen |
Blasmusik |
|
|
Familienforschung (Genealogie) |
|
|
Lokalpolitik |
|
|
Reisen und alte Sprachen |
|
Göttibub |
Lukas Blaser, Junior bei FC Spiez |
|
Hobby |
Ein flexibles und starkes Lexikon erstellen |
|
Ziele |
Gute Gesundheit und Lebensqualität |
|
Aktuell |
Das Geographische Lexikon der SCHWEIZ digitalisieren |
Zielsetzung: Dies ist eine private Website, sie hat einen ideellen Charakter, wird im Hobby erstellt und sie ist durch die Faszination des Neuen und des Entdeckens getrieben.
Philosophie: Das bewährte Wissen vom 19. Jahrhundert soll einfach im Internet zugänglich sein. Mit vielfältigen Links soll die ganze Breite der verfügbaren Lexika erschlossen werden.
Motto: Qualität und Innovation.
Motivation: Immer wieder bewegt mich die Frage: "Wie kann der Inhalt der Lexika noch besser vermittelt werden?" Die Antwort finden Sie in monatlichen Erweiterungen der Website, sei es in der Form, in der Präsentation, der Usability oder im Umfang.
![]()

Fig. 9: Download von Texten im Rohformat
Meilensteine: Im April 2004 stiess ich auf das Projekt www.RetroBibliothek.de von Christian Aschoff. Zunächst mussten viele Seiten nach Scannen und OCR manuell korrigiert werden. Ab April 2005 wurden erste Versionen vom Lexikon '88 als HTML-Text in verlinkter Form auf dem Internet verfügbar. Sie waren direkt mit der Software SAS erstellt.
Anfang 2006 erfolgte der Wechsel auf eine Internet Sprache. Somit waren Online-Datenbanken und grössere Leistungen verfügbar. Seit Anfang 2007 sind die Seiten bei Google gut indiziert. Im März 2008 ist auch Yahoo! dabei und Bilder vom Lexikon werden direkt mit den Stichworten je Artikel verknüpft. Die korrekte Umsetzung wird mit systematischen Kontrollen in den Bänden 4 und 11 sichergestellt.
15. November 2008: Besuch der Ausstellung "Lexika in der Schweiz" der Schweizerischen Nationalbibliothek in Bern. Daraus abgeleitet möchte ich das Geographische Lexikon der Schweiz vollständig digitalisieren. Alle nötigen Voraussetzungen sind erfüllt!
Kennzahlen: Mittelwert an Besuchern pro Tag: 2005 = 1; 2006 = 10; 2007 = 500; 2008 = 2000; 2009 zunehmend. In vergleichbarem Ausmass wurden erweitert: Usability, Funktionalität, Professionalität und Inhalte.
![]()

Fig. 10: Index über alle Seiten
Die Redaktion und die Schriftsetzer im Geographischen Lexikon der Schweiz waren offenbar nicht einig, wie die Regeln der Schriftsprache in der Schweiz anzuwenden sind. Auf den ersten Seiten ist ein grosser Wildwuchs sichtbar. Nach Handelswaaren werden Waren gehandelt, und schlimmer: Die Schreibweise der Ortsnamen ändert sich, z. B. von Hinweil (falsch) auf Hinwil (wie heute), oder Wohlhusen zu Wolhusen. Willhelm Tell war in Küssnach statt Küssnacht. Die erste (einzige?) Auflage dieses Werkes in Deutsch und Französisch war für den Verlag sehr anspruchsvoll.
Als OCR-Software ist OmniPage 16 gewählt. Der Test mit Abbyy FineReader wurde nach ca. 150 Seiten abgebrochen, weil auch gut digitalisierte Seiten mühsam korrigiert werden mussten. Das OCR-Programm meldet unsichere Stellen sofort, das erste Korrigieren geht somit schnell und sicher. Der Einbau der Bilder geht praktisch automatisch.
Beim Geographischen Lexikon meiner Urgrosseltern musste ich die Deckel wegschneiden. Im Moment hält der 1. Band noch knapp an den zusammengenähten Fäden. Bis zur letzen Seite ist zu vermuten, dass der Band 1 an der einen oder anderen Stelle zerreißen wird. Das stört, denn es gibt genügend vollständige Exemplare in den Bibliotheken. Bei Antiquaren kann dieses Lexikon jederzeit für ca. 600 Franken gekauft werden.
Das Scannen erfolgt Seite um Seite mit einem billigen Epson Multifunktionsgerät zu Hause. Dieser Prozess scheint zwar langsam (1 Minute pro Seite) aber es ist der schnellste Teil. Ein professioneller Scanner im wäre auch viel effizienter. Das OCR geht ganz flott. Vor dem systematischen Lesen zur Korrektur sorgt ein kleines Programm für Ordnung, sodass ich die gleiche Textstruktur wie bei Meyers Lexikon erreiche. Wichtig sind Tags, die flexibel ergänzt werden: <k> Kapitälchen </k>, <b> Fett </b>, <i> kursiv </i>, <s1> grosse Schrift <s1>, <im 41_0234.jpg> für Bilder, <c> zentriert </c>, <r> rechtsbündig </r> und so weiter.
Die zeitlich grösste Arbeit (gleichzeitig die schönste Arbeit) ist das genaue Korrekturlesen "Wort für Wort". Nach dem aktuellen Stand der Arbeiten prüfe ich jede Seite genau 1 Mal im Detail. Dazu kommen verschiedene, maschinelle Tests über bekannte Wortfehler, die Abfolge der Artikel etc. Die hohe Qualität von Meyers Lexikon werde ich mit dem Geographischen Lexikon kaum erreichen. Zu viele ^[richtig: ...] wären nötig. Mit anderen Worten, offensichtliche Druckfehler korrigiere ich direkt. Dafür werden vor interessanten Stellen ^[Note:] eingesetzt, damit später die Höhepunkte sichtbar sind.
Einen grossen Wunsch ist die Vernetzung mit Profis. Die Nationalbibliothek ist eine sehr wichtige Hilfe. Sie ist deshalb im Impressum bei der Danksagung aufgeführt. Herzlichen Dank!
![]()

Fig. 11: Inhaltsverzeichnis
- Dies ist ein Hobby
- Professionelle Resultate sind gefordert
- Qualität vor Quantität
- Start 2004
- Basis ist das Meyers Konversationslexikon 1888 (4. Auflage)
- 20'000 Zeilen eigene Software in SAS
- 6’000 Besucher pro Tag (März 2009)
- 25’000 Seiten pro Tag
- PDF ist ein Hit für die Suchmaschinen
- Links werden automatisch gesetzt
- Landkarten werden indiziert
- Monatlich ca. 2 Feedbacks von Lesern
· Prüfung der Website durch die Nationalbibliothek nach verschiedensten Kriterien
· Inputs zur Verbesserung
· Das Lexikon der Schweiz (1947). Ab 2011?
![]()

Fig. 12: Alphabetische Liste der Artikel
Df Dorf
Ew Einwohner
Gem Gemeinde
h heilig
H Häuser
Kath. katholisch
l links
n nördlich
o östlich
ö östlich
r recht
ref reformiert
s südlich, Siehe
S. A. C. Schweizerischer Alpenclub
S. C. B. Schweizerische Centralbahn
s. v. a. so viel als
u. s. f. und so fort
u. s. w. uns so weiter
w westlich
z. Z. zur Zeit
alamann alemann
A. Rh. A.-R.
Basel-Land Baselland
Basel-Stadt Baselstadt
Cement Zement
Constanz Konstanz
Greierz Gruyère
Hinweil Hinwil
Hülfs Hilfs
I. Rh. I.-Rh.
krystall kristall
Küsnach Küsnacht
Küssnach Küssnacht
Moesa Moësa
Mönchenstein Münschenstein
ARNEGG (OBER) Oberarnegg (=Beispiel)
Rätisch Rhätisch
Rothkreuz Rotkreuz
Sernftthal Sernftal
Stanzerhorn Stanserhorn
St. Immer St. Imier
thal tal
waaren waren
Walenstaad Walenstadt
Wohlhusen Wolhusen
![]()

Fig. 13: Einträge nach Datum
Fehler Richtig
(Et. (Kt.
Gern Gem
in. m.
in) m)
Mordes Morcles
0. O.
1. Ufer l. Ufer
aipen alpen
Beyer Bever
dein dem
Gh Ch
Ölten Olten
primär primar
Schottland Schöftland
sekundär sekundar
sieh sich
stellen stehen
Têne Tène
thai thal
Thür Thur
vorn vom
waiden walden
a) Trennzeichen werden eliminiert. Die Rechtschreibung (von 1900) wird nicht verändert, z. B. Thal statt Tal. Ebenso werden in Tabellen die Wiederholungszeichen » (=Gänsefüsschen) durch den sinngemässen Text ersetzt.
b) Triviale Druckfehler (z. B. fehlende oder falsche Abstände) werden ohne Hinweis korrigiert.
c) Inhaltliche Fehler im Text (z. B. fehlerhafte Namen und Bezeichnungen) werden mit ^[richtig: ] korrigiert.
d) Berichtigungen auf den ersten Seiten von jedem Band im Lexikon werden mit ^[Berichtigung: ] ergänzt. Zu streichende Texte werden gestrichen.
e) Bilder werden bei den zutreffenden Artikeln eingereiht (an der passenden Stelle und in den Tendenz am Anfang).
![]()

Fig. 14: Statistische Kennzahlen
Fett = bold <b> ... </b>
Zentriert = center <c> ... </c>
Kursiv = italic <i> ... </i>
Kapitälchen <k> ... </k>
Löschen = Durchgestrichen <l> ... </l>
Rechtsbündig = rechts <r> ... </r>
Grosse Schrift = Size 1 <s1> ... </s1>
Sehr gross = Size 2 <s2> ... </s2>
Unterstrichen <u> ... </u>
Dashed unterstrichen <ud> ... </ud>
Abbildung <im41_0xxx-1.jpg>
Prongnosen in Zukunft etc ^[Wertung:]
Anekdote, Geschichte ^[History:]
Lateinischer Text ^[Latein:]
Diverses ^[Note:]
41.340 Bramberg
In memoriam proelii Laupensis, e quo Bernenses cum sociis die XXI Junii MCCCXXXIX victores discessere hic lapis positus est MDCCCLIII.
![]()

Fig. 15: Gliederung nach Themen / Kantonen
2009-03-24 => 44132 Seiten total, Bilder Huber 20 + Geographie 384 + Band 99_G 26.
RetroBib Summe => 43702 Zusätzlich Hug: 430 Seiten
Total Bilder 540
Unkorrigiert => 19422 44.4 %
Netto => 24280 1.8 %
Alle Hinweise werde ich genau prüfen und soweit als möglich als Verbesserungen umsetzen. Das dauert unter Umständen einige Zeit.
Bei rund 100'000 Artikeln und rund 40'000 Webseiten in mehreren Formaten sind Fehler nie ganz zu vermeiden. In der Praxis setze ich auf hohe Qualität und auf rasche Innovationen. Auch mit dem Risiko, dass kurzfristige Pannen auftreten.
Bei Fehlern und Mängeln im Lexikon '88 bitte ich deshalb um Entschuldigung. Die Messlatte bei der Beurteilung ist immer die inhaltliche Nähe zum gedruckten Original.
![]()

Fig. 16: Feedback