Web-Archiv Teil 3: Wallabag-Tuning

Wie die Grundlegende Konfiguration des Reverse Proxy im Synology NAS funktioniert, habe ich in einem anderen Text schon erläutert. Das Setup für Wallabag ist gleich: SSL via Letsencrypt mit HTTP/2, welches man via (Sub)domain auf einen internen Port des NAS umleitet.

Hat man seine (Sub)domain eingerichtet, kann man die Container-Umgebungsvariable SYMFONY__ENV_DOMAIN_NAME nun mit dem korrekten Weiterlesen

Web-Archiv Teil 4: Wallabag-Konfiguration und Paywall-Konfiguration

Wallabag destilliert Websites, indem es nur den Haupttext anzeigt und absichert – doch wie funktioniert das? Dahinter steckt das bekannte und robuste php-readability. Die Wallabag-Macher haben allerdings eine eigene Version namens graby gebaut. Dieses Tool errät quasi anhand des Verhältnisses von HTML und Plaintext, in welchem Bereich der HTML-Seite sich der Haupttext befindet und bereit diesen dann auf. Dies funktioniert natürlich nicht immer 100% perfekt, aber meist mindestens akzeptabel. In Wallabag gibt es einen Konfigurations-Ordner, der Profile für viele gängige Websites enthält. Diese enthält beispielsweise auch Informationen, wo der Author des Artikels im HTML gefunden werden kann oder weist den Parser an, eine „Druck“-Version statt der normalen Version herunterzuladen oder entstückelt mehrseitige Artikel. Sollte die Lieblings-Website hier nicht vorhanden sein, lässt sich auch schnell ein neues Profil anlegen.
All diese Dateien Weiterlesen

Web-Archiv Teil 5: Wallabag-Backup und Versionsupdates

Wie bei jeder Software und Datenbank empfiehlt es sich natürlich, regelmässige Backups der Daten anzufertigen. Bei Docker-Containern kann man dies prinzipiell auf zwei Arten machen: Erstens, indem man einen Order des Host-Systems in den Container einbindet — alle geschriebenen Daten landen also quasi direkt im Host-Dateibaum und können von da mittels rsync oder anderweitig weg gesichert werden.
Zweitens, indem man die entsprechenden Daten regelmäßig aus dem Container heraus und in sein Filesystem kopiert. Welchen Weg man wählt, ist prinzipiell egal – das Wichtige ist, daran zu denken, überhaupt Backups zu machen. Ich habe mich hier für die 2. Variante entschieden, da inbesondere der Asset-Ordner, der Artikelbilder zwischenspeichert, sehr kleinteilig ist und Hunderte oder Tausende Dateien enthalten kann. Die möchte ich nicht alle dauernd offen Weiterlesen