|
Sie befinden sich hier: Insider 
Insiderwissen
Auf dieser Seite möchte ich den interessierten Lesern beschreiben, wie diese Webseite hergestellt wird.
Zunächst habe ich überlegt, kommerzielle Programme zur Webseitenerstellung einzusetzen.
Doch konnten diese alle nicht mit dynamischen Inhalten umgehen, denn die Inhalte der Webseite ändern sich durch ständige Anmeldungen, Ummeldungen und Änderungen dauernd.
Ein zweiter Blick auf "Content-Managment-Systeme" brachte im Freeware oder noch bezahlbaren Bereich (die VdS ist ein ehrenamtlicher Verein) auch nichts Brauchbares zum Vorschein.
| Erklärung der Symbole: |
 | Eigene Software. |
 | Kommerzielle Software. |
 | Web Datenbank. |
 | Freeware Software. |
 | System Software. |
Daher beschloß ich, meine selbstgeschriebenen Programme unter QBasic weiter zu entwickeln und diese für die Seitenerstellung zu benutzen.
Kern der gesamten Webseite ist die Zusammenstellung von Dietmar Bannuscher.
Diese liegt im Word Format vor. Für eine automatisierte Vorgehensweise ein ungeeignetes Format.
Daher wird der Text zunächst als reiner ASCII Text abgespeichert (und zusätzlich in anderen Formaten).
Mit einem eigenen Programm werden übliche Tippfehler entfernt bzw. geändert. Die zeilenübergreifenden Einträge werden automatisiert in eine Zeile gebracht.
Ein weiteres Programm erkennt aus den Trennungen der Einträge die Autoren, die Artikel, die Journale und die Seiten. Dazu wird eine Autorendatenbank beim ersten Lauf
angelegt bzw. erweitert, so daß neue Autoren bei jedem neuen Journal erkennt und manuell zugeordnet werden können, z.B. bei andersartiger Schreibung. Gleichzeitig
wird auch eine Artikeldatenbank angelegt, die später zum Einsatz kommen soll.
Da im Originaltext jeder Artikel und jedes Foto einmal nach Autor und einmal nach Bezeichnung eingetragen wird, wird von einem Programm ein Fehlerprotokoll
mit wahrscheinlichen Tippfehlern erstellt. Dieses erhält Dietmar zur Durchsicht. In der Regel sind dort nur sehr wenige Einträge vorhanden.
Zum Schluß erstellt ein Programm die Autoren und Journalseiten mit den gegenseitigen HTML Sprungmarken, was aber etliche Tausend Seiten ergibt.
Ein weiteres Basisstück der Webseite ist die jeweils vorliegenden PDF Datei des Journales. Diese wird zunächst mit fehlenden Leerseiten ergänzt und evtl. die Seitenreihenfolge
korrekt umgeformt. Dazu wird jede PDF Datei in Einzelseiten zerlegt, eingefügt bzw. umbenannt und wieder zusammengefügt. Anschließend wird jede PDF Datei in Einzelseiten
im JPEG Format zerlegt. Leider gibt es unterschiedliche Größen und Qualitäten (manchmal nur als Scan vorliegend). Daher werden alle JPEG Dateien anschließend auf eine
einheitliche Breite transformiert. Nun startet ein Programm, welches die HTML Dateien erzeugt, mit denen man durch diese Einzelseiten navigieren kann.
In Zunkunft ist eine reine HTML Seitenschreibweise mit Text und Grafiken statt reiner Grafikdarstellung der Einzelseite geplant. Dazu müssen aber noch etliche
Vorarbeiten geleistet und Tests gefahren werden, da so ein Projekt auch nur atomatisiert durchführbar ist.
Die weiteren Informationen, wie Statistik, Dateigröße etc. werden ebenfalls automatisiert bestimmt und eingefügt.
Alle Seiten werden automatisiert in einer Nacht hochgeladen, wobei nur geänderte und neue Seiten berücksichtigt werden.
Verwendete Programme und Informationen (zusätzlich kommen etliche weitere nicht veröffentlichte eigene Hilfsprogramme hinzu):
Addline: Zeilen mit zusätzlichen Texten versehen.
Adobe Acrobat: PDF Writer.
BUMWA: Sonderzeichen aus und in alle DOS/Windows etc. Systeme wandeln.
Command Line Paket: Diverses aus dem Unixbereich.
Croque Mort: E-Mail Adresse prüfen.
CSV Double: Zeilen mit doppelten kombinierten Spalten einer CSV Tabelle herausnehmen.
CSV Head: CSV Tabellenkopf prüfen.
CSV HTML: Umwandeln einer CSV Tabelle mittels Kommandos in beliebige Seiten und Texte.
CSV Missing: Zeilen mit nicht belegten Spalten einer CSV Tabelle herausnehmen.
CSV Sorting: Sortieren einer CSV Tabelle nach einer Spalte.
CSV Table: Umwandeln einer CSV Tabelle in eine Webseitentabelle.
CSV to text: Umwandeln einer CSV Tabelle in eine Textliste.
CZ-XLS2CSV: Automatische Konvertierung aller Tabellen einer Excel Datenbank in das CSV Format.
CutePDFWriter: PDF für diverse Anwendungen.
DateTime.Bat: Datum und Uhrzeit in die Umgebungsvariablen.
DBF2CSV: DBF Datenbanken in CSV wandeln.
Delay: Ersatz des "Pause" DOS Befehls.
ESRI Data 2000: Bundesländergrenzen.
Excel: Datenbankanwendung.
FeBooti DOS Mailer: E-Mails per DOS verschicken.
Free PDF Compressor: Komprimieren von PDFs.
FTP: DOS FTP Programm (aus Windows NT und für Win2000).
FTP Backup: Automatisches Hochladen geänderter und neuer Dateien auf einen FTP Server.
Eudora to Tabelle: Unwandeln der Script Formulardaten in Listen.
Geodäsie: Erläuterungen und Umrechungen.
GhostScript: Das bekannte GhostScript.
Gnuplot: Automatisches Plotten von Meßwerten.
GSAR: General Search and Replace - Zeichenersetzung.
HTM Bytes: Einfügen von Dateigrößen in Links.
HTM Formular: Auslesen eines Formulares aus einer HTML Datei.
HTM No Comment: Entfernen von Kommentaren aus einer HTML Datei.
HTML Studio: HTML Code auf Fehler prüfen.
ImageMagick: Automatisiertes Bearbeiten von Bildern, langsam, aber sehr mächtig.
IrfanView: Automatisiertes Bearbeiten von Bildern, schnell, aber nur die Basics.
JJ GIF-JPG: Überprüfen der richtigen Kennung von GIF und JPEG Dateien.
JJ HTML: Entfernen von überflüssigen Daten aus HTML Dateien.
JJ IMG Source: Extrahieren aller Bilderlinks in einer Webseite mit Publikation derselben.
LinkList: Erzeugung von Linklisten.
LinkSleuth: Überprüfen von Verlinkungen auf einer Webseite.
Mail Check: Liste von e-mail Adressen prüfen.
Map24.de: Eine öffentliche Kartierungssoftware.
Map Creator Personal: Erzeugung der repräsentativen Karte.
MBTPDFASM: Diverse PDF Manipulationen.
Mittelwert: Berechnen von Mittelwerten.
Motigo: Abrufstatistiken einbauen.
MSort: DOS Sortierung von Martin Katz.
NewDate.Bat: Datum und Uhrzeit in die Umgebungsvariablen.
Offline Explorer Pro: Download von kompletten Webseiten.
OpenGeoDB: Grenzen der Bundesrepublik.
PaintShop Pro: Bildbearbeitung und Bannererzeugung mit einem preiswerten Programm.
PDF Analyzer: Analyse von PDFs.
PDF Konverter: Extrahieren von Bildern und Texten aus PDF Dateien.
PDF-Convert: PDF in verschiedene Formate wandeln.
PDF to HTML: PDFs zu HTML per Kommandozeile.
PDF to HTML GUI: Windows GUI für PDFtoHTML.
PDF Toolkit: PDFs per Kommandozeile bearbeiten, vor allen Dingen Seitenoperationen.
PDF-Tools: PDF Tools, auch auf Kommandoebene.
PLZ GPS: Erzeugen von Koordinatenlisten aus Postleitzahlen und der interaktiven Karte.
Rename Doppel: Vorbereiten von Dateibatches.
Random file: Erzeugen von Zufallszahlen in eine Datei.
Tadzio's File Compare: Vergleichen von Dateien.
Remove line: Doppelte Zeile aus einer Datei entfernen.
Splitz: Bild in Unterbilder aufteilen.
TXT Add: Eine Zeile zu allen Dossiereinträgen hinzufügen.
TXT in BMP: Ober- und Untertitel in Bilder einbinden.
TXT to CSV: Listen in CSV Tabellen wandeln.
URL2BMP: Speichert eine Webseite als Bild ab.
WS FTP Pro: Komfortables FTP Hochladen per Windows.
Sleep: Läßt einen DOS Batch nach Ausführung eines Programmes eine bestimmte Anzahl Sekunden warten (z.B. nach Start eines Windows Programmes) (Download).
URL to file: Quellcode einer Webseite laden.
Wetter24.de: Eine öffentliche Wetterkarte.
Wget: Download von Webseiten.
Word List: Wortlisten erstellen.
Xenu LinkSleuth: Prüfen der Verlinkungen.
XLS Corrector: Korrektur von Zeilenumbrüchen in einer CSV Datei.
XPDF: Command Line Tools für PDF Dateien.
Yahoo EMail: E-Mails aus dem Yahoo Groups Listen Export extrahieren.
Bei weiteren Fragen mailen Sie mich bitte an.
|