over het gebruik
van DjVu-bestanden
op nl-wikisource


Het verdient de voorkeur om bestanden met de DjVu-extensie op Wikisource te gebruiken (boven pdf-bestanden). Dat is ook niet zo heel lastig. Veel oudere bestanden op Internet Archive (IA) op archive.org zijn al geconverteerd naar DjVu. Voorbeeld daar: Album der Natuur 1854. Kijk bij de "download options" bij "show all". Daar is het eerste bestand een djvu-bestand (of kijk hier).

Over het DjVu-bestandsformaat: het Wikipedia-artikel w:nl:DjVu; voor meer technische info op de Engelstalige Wikisource: en:s:Help:DjVu_files

Tegenwoordig converteert IA helaas niet meer naar DjVu. Maar het is niet zo lastig om het toch voor elkaar te krijgen met een tool die daarvoor speciaal door Wikimedia ontwikkeld is.

Aangezien Gebruiker:Vincent Steenberg en Gebruiker:Dick Bos (ik) (tot nu toe) de enigen zijn die regelmatig met deze tool werken, het onderstaande goeddeels in de "ik-vorm".


Een DjVu-bestand maken bewerken

Stel je beschikt over een pdf-bestand. Load dit dan eerst up naar Internet Archive.

Zie deze how to's op help.archive.org.
Je moet in ieder geval een account aanmaken op IA (Internet Archive).
Dan verschijnt, als je bent ingelogd, in de rechterbovenhoek een link: UPLOAD.
Voorbeeld: Witte's Wandelgids op archive.org. Die komt als pdf weer van Delpher (en dat staat ook in het "description"-veld).

Let hier al goed op de correcte naamgeving. Ik ben hier nog niet helemaal uit. Ik hanteer twee vormen door elkaar (zie: mijn uploadpagina op archive.org):

  • Eerst de titel, dan auteur en jaartal
  • Eerst auteur en jaartal, dan titel
  • Veel gebruikt is : Eerst achternaam auteur met komma, dan titel en dan jaartal tussen ronde haken.

Misschien moeten we hier een meer uniform systeem proberen in te voeren!

Meestal moet je enige tijd (een paar uur tot een dag) wachten, voordat alles in orde is op IA.

Let op bewerken

Bij boeken van Google Books moet eerst de voorste pagina, met het logo van Google etc. verwijderd worden. Dat kan bijv. online via deze pagina op smallpdf.com (meer in het bijzonder, via: pagina verwijderen).

Het is altijd spannend hoe de kwaliteit van de OCR in IA geworden is. Als alles is bewerkt (geduld!), kun je dat goed zien in de full text-versie (een van de "download options" rechts onder het gescande boek). Als het allemaal te bedroevend is, loont het de moeite op dit moment uit te kijken naar een betere scan!

Uploaden naar commons met de IA-upload-tool bewerken

Dan moet het bestand met de upload-tool naar Wikimedia Commons worden overgebracht. En dan wordt er automatisch een DjVu-bestand van gemaakt (als alles goed gaat).

De IA-upload-tool vind je op tools.wmflabs.org

Wat betreft de naamgeving van het bestand: kies voor een duidelijke bestandsnaam met de (achternaam van de) auteur, het jaar van publicatie en de titel (en zie hierboven voor: volgorde)

Vermeld ook de herkomst van het bestand.

Om de IA-upload-tool te kunnen gebruiken moet men inloggen op Wikimedia. Daarna kunnen alle gegevens worden ingevoerd in een sjabloon.

  • Merk op dat veel gegevens al automatisch worden geïmporteerd uit de metadata op IA.
  • Gebruik bij voorkeur een creator template op Wikimedia Commons voor de schrijver (en eventueel de illustrator). Daarmee is een koppeling aan Wikidata gegarandeerd.
  • Het verdient aanbeveling voor elk boek een aparte categorie aan te maken. Vergelijk op Wikimedia Commons c:Category:Heinrich Witte - Wandelgids Bennekom 1902.
  • Let op dat er in dit geval ook een item aangemaakt is voor de editie op Wikidata (meer over "works" en "editions" op Wikidata: d:Wikidata:WikiProject Books).
  • Ook hier geldt weer: ga na het uploaden even iets anders doen. Het kan even duren, voordat alles klaar is.
  • Als alles goed is gegaan zie je het boek vanzelf in je lijst van contributions op Wikimedia Commons verschijnen.

Van jpg-bestanden naar DjVu bewerken

Je kunt op IA ook een set jpg-scans uploaden. Dat is gunstig. Hogere resolutie etc. Het is wel wat lastiger.

Zie deze HowTo op help.archive.org van 29 januari 2022.

Van een enkelvoudig jpg-bestand kan ook online een djvu-bestand gemaakt worden via Convertio op convertio.nl.

Nog wat (deels verouderde) aantekeningen: Creating and uploading a DjVu-file bewerken

The easy way: find an existing DjVu-file (e.g. in Internet Archive). Download it to a directory on the computer. Remove the "copyright"-stuff (and the Google pages etc.) with:

djvm -d filename.djvu 1

(in Win10 on the prompt (via Win-X)). Take care that djvm.exe and two other files are already installed in the same dir. This removes the first page. Leave no blank spaces in filename!
This works well in Linux too.

Next: upload to Commons. And give proper information in template: IA-source etc. and categories.

For a more complicated use of djvm tool: see: s:en:Wikisource:Scriptorium/Help/Archives/2017#Please_help_with_creating_djvu-file:_Bevan_(1894)_-_Willliam_Petty - thanks to s:en:User:Inductiveload. (2017-12-11)

Aarzel niet om bij problemen contact te zoeken met Gebruiker:Dick Bos.