Wikisource:De kroeg/Archief/sep 2023


Stand van zaken OCR op nlWikisource

bewerken

Dag iedereen, ik probeer door het bos de bomen te zien over het gebruik van OCR als hulp bij het transcriberen. Is er ergens goede documentatie of kennis bij bepaalde gebruikers over wat vandaag mogelijk is? In het bijzonder bij mijn test met een manuscript biedt de OCR-knop weinig tot geen meerwaarde, maar misschien kan ik ergens voor een bepaald model en/of taal kiezen? Ik las hier bijvoorbeeld over de integratie van Transkribus en ook andere beschikbare OCR-modellen, maar zie alsnog niet of/hoe die in de Nederlandstalige Wikisource geïntegreerd zijn. Beireke1 (overleg) 1 sep 2023 10:30 (CEST)[reageren]

Dag @gebruiker:Beireke1, je hebt een jpg-file op wikisource index gezet met achtervoegsel djvu, dat gaat niet goed. Geen jpg's meer gebruiken voor een INDEX. Eerst moet je alle pagina's van het manuscript scannen als meer-pagina pdf, of je moet alle pagina's scannen offotograferen als jpg, de pagina's samenvoegen tot één pdf (en die eventueel omzetten tot djvu). Dan kun je het bestand uploaden op commons. Wat betreft OCR, er zijn drie varianten, de knop die je gebruikt hebt, is niet de beste. Je kunt beter rechts in het menu op de transcribeerknop klikken, en dan kijken wat het beste resultaat geeft: google, tesseract of externe OCR. --Havang(nl) (overleg) 1 sep 2023 10:43 (CEST)[reageren]
Bedankt voor de tips @gebruiker:Havang(nl). Ik had de jpg met online software omgezet naar een djvu (niet enkel het achtervoegsel veranderd), dus dacht dat het dan goed zou gaan. Ik begrijp uit je reactie dat tussenstap via pdf dus noodzakelijk is? Ik heb met je suggestie over de transcribeerknop intussen kunnen testen wat ik wou. Als mijn djvu-bestand niet bruikbaar blijkt, kan het misschien best verwijderd worden? Allen zie ik daar geen knop voor. Alle hulp is dus welkom. Beireke1 (overleg) 1 sep 2023 11:28 (CEST)[reageren]
@gebruiker:Beireke1 Ik kreeg in eerste instantie voor de afbeelding een heel lange titel met een url en [...djvu...djvu.jpg] en ik kon hem niet op commons bereiken. Nu heb ik op de indexpagina scan=djvu ingevuld en kan ik hem op commons bereiken.
Door alle pagina's van een grotere tekst op één bestand in de index in te voeren, worden automatische processen mogelijk, met name een eenvoudige code voor transclusie naar de hoofdruimte. En Het is echter heel veel onderhoudswerk om een serie losse pagina's op wikisource onder één doorlopende index te brengen. vb. Apocriefe boeken gaan over naar Index:De apocriefe boeken (1906).pdf. Trouwens, als je straks de oude 1-pagina djvu vervangt door de veel-pagina's djvu, komen alle pagina's onder deze index te staan, die hoeft dus niet verwijderd te worden als je binnen redelijke tijd die grote djvu gereed hebt. Afgezien van dat 1-pagina probleem, begon je dus wel correct volgens Wikisource:MaakIndex. --Havang(nl) (overleg) 1 sep 2023 12:48 (CEST)[reageren]
@Havang(nl) Bedankt voor de toelichting. Het ziet er niet naar uit dat ik zelf op korte termijn toegang heb tot het manuscript om scans van het hele werk te maken. Voorlopig zal het dus bij deze ene pagina blijven. Mocht het er toch van komen, zal ik dan in dat geval de huidige djvu vervangen door één met meerdere pagina's. Beireke1 (overleg) 1 sep 2023 13:40 (CEST)[reageren]
Hoi Beireke1, Ik probeer die OCR-knop uit en het lijkt inderdaad standaard niet veel te helpen! Heb je het uitklapmenu ernaast gezien, waar je een ander model kunt selecteren om mee te transcriberen? Er is één andere beschikbaar, die van Google, en die lijkt wel wat meer success te hebben.
Ik zie op de Engelse Wikisource dat je daar inderdaad ook Transkribus als optie kunt selecteren, wat blijkbaar speciaal gemaakt is om handgeschreven tekst beter te herkennen. Dit hebben wij nog niet op de Nederlandse Wikisource, maar ik ga eens kijken of we daar wat aan kunnen doen. Raketsla (overleg) 1 sep 2023 19:00 (CEST)[reageren]
De OCR-knop links is verkeerd benoemd, hij lijkt meer op de toverstokknop op de franse wikisoure, die o.a. Indexpaginakopteksten en enige lay-out automatiseert.Ik weet niet wat die met OCR temaken zou hebben. @[[Gebruiker:Raketsla}} Zou je daar ook eens naar kunne kijken. Voor OCR dient de transccribeerknop, zoals ik hierboven schreef, en die toegang geeft tot Tesseract OCR, google OCR en een externe OCR (buiten wikisource). --Havang(nl) (overleg) 1 sep 2023 19:07 (CEST)[reageren]
Ah, ik had het over de “Transcribeer”-knop ja, excuus. Reageer zo op de rest. Raketsla (overleg) 1 sep 2023 19:18 (CEST)[reageren]
Ik weet niet precies wat jij ziet als je op de knop genaamd “OCR” drukt links. Hij lijkt mij toch een soort OCR uit te voeren, als ik tenminste naar de pagina uit het manuscript kijk. Maar wel lijkt het wéér een ander model te zijn, dan die beschikbaar zijn met de Transcribeerknop rechts. Dat, (en het feit dat veel van de infrastructuur hier toch een aantal jaren oud lijkt te zijn,) doet me eigenlijk denken dat deze (linker)knop wellicht een achterhaalde manier is om OCR uit te voeren. Raketsla (overleg) 1 sep 2023 19:43 (CEST)[reageren]
Gevonden. De “OCR”-knop is in 2010 [1] toegevoegd en maakt gebruik van dit script. Het is wél daadwerkelijk karakterherkenning, maar maakt gebruik van een totaal andere website dan de normale/huidige knop. Ik geloof dat dit [2] daar misschien de broncode van is; het lijkt dus ook een vorm van Tesseract te gebruiken.
Misschien kan die knop dan wel weg, toch? Van wat ik zo snel probeer lijkt hij vergelijkbare resultaten te geven als Tesseract via de Transcribeerknop, wat logisch is, maar ik kan niet direct zien of er één beter is.
Verder vind ik die toverstokknop ook interessant! Weet jij wat dat precies doet?
In ieder geval: zodra wij weer een interface-moderator hebben moeten we dat MediaWiki:Common.js (en wellicht meer) eens grondig herzien, denk ik zo. Raketsla (overleg) 1 sep 2023 20:22 (CEST)[reageren]
Op de toverstokknop klikken opent geen programma, maar geeft automatisch een running (pagina)header van even naar even, van oneven naar oneven (niet de artikelheader, maar wat hier Sjabloon:RH handmatig schijnt te doen, dat sjabloon beheers ik nog niet) ; bij aanwezigheid van een eerste blanco lijn van de OCR-transcritp plaatst de toverstok de code nowiki /, dat lijkt op Sjabloon:nop onderin de vorige pagina, zodat je de blanco pagina's kunt invoegen met harde return. De Transcribeer knop heeft keuze uit drie, maar dat is niet meteen zichbaar. Tesseract volgt beter de typografie van Wikisource, Google geeft betere tekstweergave. Typografisch interessant is de T knop op s:fr, die corrigeert (à la franse typgrafie) een aantal dingen zoals overbodige spaties, etc. --Havang(nl) (overleg) 1 sep 2023 21:04 (CEST)[reageren]
@Havang(nl)@Raketsla Ter info: wat er nu in mijn testje staat is het onbewerkte resultaat van de keuze van Transkribus OCR met daarbij het model "de-hd-m1 - Transkribus Dutch Handwriting M1". Niet slecht als automatisch resultaat alvast. Beireke1 (overleg) 4 sep 2023 14:50 (CEST)[reageren]

Tech News: 2023-36

bewerken

MediaWiki message delivery 5 sep 2023 01:33 (CEST)[reageren]

Tekst op wikipedia niet ook op wikisource?

bewerken

Dag allemaal, een serie volksliederen die identiek of uitvoeriger op wikipedia staan, horen toch niet ook nog op wikisource? Voorbeeld: Bolivianos, el hado propicio en m:nl:Bolivianos, el hado propicio. Te verwijderen? Havang(nl) (overleg) 5 sep 2023 14:12 (CEST)[reageren]

Mee eens. De lezer is bij dit soort constructies niet echt geholpen.
Als je het goed zou willen doen, dan zou je A. een goede scan van het betreffende volkslied uploaden naar commons. en B. bekend zijn met een muzieknotatiesysteem, zoals LilyPond. Ik blijf al bij punt A. steken. Ik heb bijvoorbeeld ooit gekeken naar Aash Al Maleek, maar kon nergens een scan of pdf vinden. Als dat bij dit ene volkslied al zo moeilijk is, dan vrees ik dat dat ook geldt voor alle andere. Om van punt B. maar te zwijgen. Vincent Steenberg (overleg) 5 sep 2023 15:35 (CEST)[reageren]
Het probleem in deze is dat Wikipedia eigenlijk z'n boekje te buiten gaat. Wikisource is voor bronteksten, wat o.a. een liedtekst is. Wikipedia is bedoeld om kennis te verzamelen over onderwerpen en niet de onderwerpen zelf te bevatten. De liedtekst staat dus prima op Wikisource. Verwijderen lijkt me in strijd met de bedoeling van Wikisource. Romaine (overleg) 5 sep 2023 19:40 (CEST)[reageren]
@Gebruiker:Romaine: Niet mee eens, om meerdere redenen: de tekst is niet beperkt tot het volkslied, maar geeft een wikpediaans commentaar en blijkt ook gekopieerd van wikipedia. Wikisource heeft geen gescande brontekst van deze volksliederen, vreemde talen horen op de anders-talige wikisourcen. --Havang(nl) (overleg) 5 sep 2023 19:53 (CEST)[reageren]
Ik snap wat je bedoelt, @Romaine en op Wikipedia kom ik ook wel eens mensen tegen die zeggen dat liedteksten niet op Wikipedia, maar op Wikisource thuishoren. Maar de praktijk is volgens mij toch anders. De liedtekst van Aash Al Maleek bijvoorbeeld is in het Wikipedia artikel drie keer verwijderd, maar hij is steeds herplaatst. Alle 15 coupletten van het Wilhelmus staan ook op Wikipedia. Het artikel Het Wilhelmus komt mij dan een beetje knullig over. Beter zou het zijn als er een echte bron achter de liedteksten op Wikisource zou bestaan. Bijvoorbeeld uit https://resolver.kb.nl/resolve?urn=MMSFKB02:000037249. Maar voor de modernere volksliederen valt het niet mee die te vinden. Vincent Steenberg (overleg) 5 sep 2023 21:39 (CEST)[reageren]
Volgens mij word ik niet helemaal begrepen en ben ik mogelijk onvoldoende duidelijk geweest met wat ik bedoelde. Allereerst, de bedoeling van Wikisource is om naast een korte inleiding (1 of 2 zinnen) alleen de liedtekst te hebben, zonder verdere encyclopedische kennis. De bedoeling van Wikipedia is juist om niet de liedtekst te bevatten en juist wel de encyclopedische informatie die de achtergrond van het onderwerp beschrijft. De praktijk op Wikipedia is daarbij dat veel gebruikers Wikisource niet/onvoldoende kennen en ook die scheiding tussen welk soort kennis er waar thuishoort, met als gevolg van er te veel encyclopedische kennis op Wikisource wordt toegevoegd en de liedteksten op Wikipedia. Dat men op Wikipedia niet snapt waarvoor Wikisource en Wikipedia dienen, is geen goede reden om een hele pagina met liedtekst dan maar op Wikisource te verwijderen. Wikisource wordt daar alleen maar slechter van en overal op het internet waar men naar deze pagina gelinkt heeft komt dan uit op een teleurstelling.
  • "de tekst is niet beperkt tot het volkslied" -> Bij iedere tekst is een context nodig, voor een boek is dat bv de auteur, publicatiedatum, thema, en dat soort dingen, voor een liedtekst zijn er ook enkele basisgegevens die context bieden. Als gevonden wordt dat de geleverde context te lang is, kunnen we zeker nadenken over inkorten.
  • "Wikisource heeft geen gescande brontekst van deze volksliederen" -> Een gescande brontekst is een mogelijkheid, maar niet de enige. De essentie van Wikisource zijn bronteksten, waar hier zeker sprake van is.
  • "vreemde talen horen op de anders-talige wikisourcen" -> Een tekst uitsluitend in een andere taal dan het Nederlands hoort inderdaad op een anderstalige Wikisource, maar een anderstalige tekst met Nederlandstalige vertaling erbij is nog steeds een brontekst en hoort juist wel op de Nederlandstalige Wikisource. Romaine (overleg) 6 sep 2023 15:04 (CEST)[reageren]
@Gebruiker:Romaine. Je hebt nog de oude visie van Wikisource van vóór de tijd van de corrigeer-uitbreiding, toen men nog artikelen schreef op wikisource. Wikipedia, wikisource, commons en wikidata hebben ieder een onderscheiden functie gekregen. Toen men old-wikisource verliet voor het nieuwe wikisource, is de afspraak gemaakt dat teksten in andere talen op de anderstalige wikisource geplaatst wordt; dat wikisource documenten bevat in de eigen taal die aan wikipedia, wikidata, commons en anderstalige wikisources gekoppeld worden en dat de context op wikisource niet gegeven wordt, maar dat men zich tot de pure tekst beperkt, gebaseerd op scans met OCR-tekstherkenning, die via de Index-pagina's zich laten vergelijken met de transcriptie die wij doen. Wij zijn op wikisoure correctoren van bronteksten, geen tekstschrijvers. Vandaar de titel "Tekst op wikipedia niet ook op wikisource?" Het doet hilarisch aan, deze volksliederen als wikipedia-artikel op wikisource te zien. --Havang(nl) (overleg) 6 sep 2023 16:42 (CEST)[reageren]
Ik heb nooit gedacht dat gebruikers op Wikisource "tekstschrijvers" zijn. Dat er via OCR bronteksten geplaatst kunnen worden is één methode, maar niet de enige.
In mijn vorige bericht schreef ik juist dat bronteksten geplaatst worden op de wiki van de taal waarin ze gesteld zijn, geen idee waarom gesuggereerd wordt iets anders zei.
Het kan volgens mij nooit de bedoeling zijn dat een bezoeker op een Wikisource-pagina uitkomt en maar moet gaan raden wat diegene voor zich ziet. Een regel met in dit voorbeeld dat het een liedtekst is van componist X, is daarmee passend. Zoals gezegd, als de tekst bovenaan te lang is kan die ingekort worden. Romaine (overleg) 10 sep 2023 17:29 (CEST)[reageren]
Als wikisource goed geintegreerd is via wikidata met wikipedia en commons en zusterprojecten is dat probleem verdwenen. Ik zoek vergeefs op s:nl naar een linkmogelijkheid naar wikidata items. Havang(nl) (overleg) 11 sep 2023 16:59 (CEST)[reageren]

Er zijn hier heel veel teksten uit lang vervlogen tijden (laten we zeggen uit de tijd voor de introductie van de proofread-extensie op nl-ws). Het is inderdaad heel zinnig en nuttig om eens in alle rust te overleggen over wat we daarmee gaan doen. Voor een deel kunnen er bronnen bij gezocht worden, en misschien kunnen sommige teksten zelfs wel worden overgebracht naar de nieuwe vorm. Andere dingen - die bijv. al breeduit op Wikipedia staan - moeten we hier misschien maar eens opruimen. Ik weet het ook niet precies. Ik weet niet eens hoe groot het "probleem" precies is. Zou het mogelijk zijn om een soort overzicht te maken van de teksten waar het hier om gaat, en zouden we die kunnen indelen/rubriceren, zodat we er een beeld van krijgen van het "probleem", hoe groot het is, en hoe we het zouden kunnen gaan aanpakken? Die volksliederen zijn één rubriek, maar er staan veel meer liederen op nl-ws, als ik het goed heb. Bijvoorbeeld ook veel Sinterklaas-liedjes, kinderliedjes etc. Misschien moeten we ook eens nagaan hoe vaak zulke pagina's bezocht worden.

De aanpak zoals op Aash Al Maleek spreekt me erg aan. Kan er ook nog een timestamp in die waarschuwings-banner?

Dit geldt mutatis mutandis ook voor dingen in de Auteur-naamruimte, trouwens. Daar is ook nog werk te doen. --Dick Bos (overleg) 8 sep 2023 10:37 (CEST)[reageren]

Die lijst met auteurspagina’s valt nog wel aan te pakken volgens mij; ik zat er ook aan te denken en de hele lijst past op één pagina, dus dat zouden we best allemaal handmatig kunnen bekijken. (Natuurlijk neem ik dan aan dat alle auteurspagina’s in de goede namespace staan. Als dat niet zo is kan het nog wel lastig worden. Maar ik zie in ieder geval al dat het Sjabloon:Infobox auteur eigenlijk nergens gebruikt wordt buiten de Auteur: namespace [10].)
Voor andere pagina’s is dat lastiger natuurlijk. Ik zie wel dat er zo’n 7.000 pagina’s zijn die Sjabloon:Koptekst gebruiken, en 1.052 pagina’s die het oudere Sjabloon:Infobox auteur gebruiken. Misschien zouden we daar kunnen beginnen?
@Havang(nl) had een tijdje terug ook statistieken over het aantal teksten zonder brontekst, waar kwamen die vandaan? -- Raketsla (zij/haar) (overleg) 8 sep 2023 11:38 (CEST)[reageren]
Ik ben die link al kwijtgeraakt, voordat ik de fotomontage had gemaakt. Ik kwam er vanaf Metawiki:Wikisource:ProofreadPage Statistics verder zoekend. --Havang(nl) (overleg) 8 sep 2023 13:01 (CEST)[reageren]
Ik ben die link al kwijtgeraakt, voordat ik de fotomontage had gemaakt. google: Wikisource:ProofreadPage Statistics - Wikisource Havang(nl) (overleg) 8 sep 2023 13:03 (CEST)[reageren]
Oh ja! oldwikisource:Wikisource:ProofreadPage Statistics linkt naar https://phetools.toolforge.org/statistics.php, en op die website vind ik die grafiekjes.
(Side note: Dit is dezelfde website, als die de verouderde knop genaamd “OCR” gebruikt om OCR uit te voeren!) -- Raketsla (zij/haar) (overleg) 8 sep 2023 13:09 (CEST)[reageren]
Zoo… dat is nog een flinke berg teksten zonder scans, om inderdaad wat mee te doen.
Moet je die Spaanse grafiek eens zien; die hebben begin dit jaar zo de helft van hun bronloze teksten weggedaan, lijkt het! -- Raketsla (zij/haar) (overleg) 8 sep 2023 13:16 (CEST)[reageren]
Oh hey, nog iets gevonden! Speciaal:PaginasZonderScans. Laat er maar 5.000 tegelijk zien, en als we de grafiek van hierboven mogen geloven, zijn er in totaal zo’n 7.000. Maar het is een lijst van pagina’s zonder bron!
Ook interessant: Speciaal:OudstePaginas. -- Raketsla (zij/haar) (overleg) 8 sep 2023 13:26 (CEST)[reageren]

Misschien moeten we eerst teruggaan naar het begin. Hierboven lijkt gesuggereerd te worden dat bronteksten zonder OCR een probleem zijn. Waar is er afgesproken/besloten dat alle bronteksten uitsluitend en alleen via OCR op Wikisource mogen staan? Romaine (overleg) 10 sep 2023 17:45 (CEST)[reageren]

Een combinatie van factoren doen wikisource die richting uit gaan. Wikisource is uitgebreid naar corrigeerbaarheid (proofread-extension). Wikisource werkt nu met pdf en djvu documenten geimporteerd als bron in de Index, die in pagina's gesplitst wordt en als vis-à-vis de wikisource transcriptie krijgt, waarna in de hoofdruimte alleen maar meer de transclusie, gebaseerd op de voor servers digitaal zuinige <pages index code> code komt te staan, en tegelijk verificatie binnen de Index blijvend mogelijk is. We werken er dus aan, oude teksten zoveel mogelijk te voorzien van een gescande pdf- of djvu-bron, om die verificatie blijvend mogelijk te maken. Een e-tekstbestand (word-doc e. d.) tot pdf of djvu omgezet hoeft niet door de wikisource correctoren bewerkt te worden. Dus een pdf van een e-tekstbestand van (bijv) een volkslied binnen halen op wikisource, brengt geen meerwaarde, geeft zelfs verlies van weergavekwaliteit bij export vergeleken met een origineel e-tekst-document. Dit geeft meteen aan, waarom pdf's van e-tekst-documenten van 't Gugenberg project of DNB niet op wikisource geupload dienen te worden. Die zijn al door een proofreadteam bewerkt, door een correctieproces gegaan.--Havang(nl) (overleg) 10 sep 2023 18:33 (CEST)[reageren]
Ik geloof dat men best wel begrijpt wat je zegt, @Havang(nl), maar dat lost het vraagstuk nog niet helemaal op.
Feit is dat steeds meer (misschien alle) van de nieuwe teksten, met Proofread Page worden aangemaakt. Ik denk ook dat we het er allemaal over eens zijn dat dit een aantal grote voordelen heeft, zoals dat men andermans tekst makkelijk kan controleren, en dat we altijd vastleggen van precies welke publicatie ónze versie afkomstig is.
Met die trend is nog niet gelijk besloten dat teksten die daar niet aan (kunnen) voldoen, hier niet meer thuishoren. Dat is wel iets wat we zouden kunnen afspreken, maar nog geen uitgemaakte zaak, lijkt me. -- Raketsla (zij/haar) (overleg) 10 sep 2023 19:26 (CEST)[reageren]
Goed idee. Voor zover ik weet hebben we nu alleen deze pagina om aan te duiden wat hier wel en niet thuishoort; dat is dus zo ongeveer alles wat gepubliceerd en vrij van auteursrechten is.
Ik vind het geen slecht idee om daar eens opnieuw over na te denken, en mogelijk een en ander aan te scherpen; volgens mij zeg ik dan ongeveer hetzelfde als @Dick Bos. Maar dan kunnen discussies over individuele pagina’s waarschijnlijk inderdaad beter wachten tot ná dat gesprek. -- Raketsla (zij/haar) (overleg) 10 sep 2023 18:21 (CEST)[reageren]
Voorbeelden waren om het concreet maken, en basserden zich ook op De Nederlandstalige Wikisource stelt zich tot taak het aanbieden van Nederlandstalige bronnen. Wie kan zich in dit voorstel vinden: tekst op wikipedia, niet ook op wikisource. Intussen ga ik verder met gescande bronnen toevoegen aan artikelen zonder bron. --Havang(nl) (overleg) 10 sep 2023 19:31 (CEST)[reageren]
Dat laatste is sowieso geweldig natuurlijk!
Zelf vind ik belangrijk dat de teksten die hier staan naar een bron verwijzen, al dan niet met ProofreadPage, zodat we kunnen verantwoorden dat de tekst inderdaad zó is. Misschien geen gek idee om zo een lijstje te maken met ieders idee van wat hier hoort? -- Raketsla (zij/haar) (overleg) 10 sep 2023 19:42 (CEST)[reageren]
Oorspronkelijk was bronvermelding niet zo belangrijk, maar tegenwoordig wel. De oudste bronteksten op Wikisource zijn denk ik met de grootste zorg door de gebruikers destijds op Wikisource geplaatst, maar de bron kan dus ontbreken. Het lijkt me zeer goed dat op zoveel mogelijk plekken de bron(nen) alsnog wordt toegevoegd.
Ik vind Wikipedia regelmatig tamelijk wispelturig, dus beleid op Wikipedia baseren vind ik niet zo handig. Morgen zou zomaar een gebruiker een discussie kunnen opstarten om alle/een deel van de bronteksten van Wikipedia te verwijderen omdat ze er niet thuishoren (of zelfs zonder discussie), gevolg: dan staan ze nergens meer als ze op Wikisource eerder verwijderd zouden zijn vanwege Wikipedia. Wikisource is een zelfstandig project met eigen beleid en daarom lijkt mij dat of iets wel of niet op Wikipedia staat niet relevant voor Wikisource.
Het lijkt me goed om de discussie voort te zetten op de overlegpagina van Wikisource:Over Wikisource, waarbij eveneens deze discussie van de Kroeg naar die overlegpagina verplaatst wordt, zodat in de toekomst overleg hierover wat minder versnipperd terug te vinden is op één plek. Romaine (overleg) 14 sep 2023 10:37 (CEST)[reageren]

Mijn voorstel is om de discussie – die minstens al sinds 2015 speelt (en die vorig jaar door Gebruiker:Vincent Steenberg nog werd bijgewerkt naar de actualiteit) – over de toekomst van de Nederlandstalige Wikisource voort te zetten op de overlegpagina van Wikisource:Over Wikisource. Misschien kan daar ook een samenvatting van de bovenstaande discussie bij? Ik heb in ieder geval daar mijn visie uiteengezet! --Dick Bos (overleg) 13 sep 2023 17:16 (CEST)[reageren]

Uitbreiding moderatorschap

bewerken

Ik draag @Gebruiker:Dick Bos en @Raketsla voor als moderatoren. Dick Bos, vanwege zijn lange ervaring op wikisource, en Raketsla vanwege de efficiente bijdragen in het uptodate maken van de wikisource infrastruktuur. Bericht ook t.a.v @Gebruiker:Romaine--Havang(nl) (overleg) 7 sep 2023 10:40 (CEST)[reageren]

Ik steun @Dick Bos daar zeker in, als hij die taak op zich wil nemen. Meer moderatoren is een goede zaak, volgens mij.
Zelf zou ik het zeker leuk vinden om interface-moderator te worden; ik geloof dat ik dan echt wel goede dingen aan de infrastructuur kan doen, zoals de layouts repareren, en gadgets toevoegen om het gebruik van Wikisource wat makkelijker te maken. Nu weet ik dat interface- en normale moderator zijn wel vaak samengaan (op w:en: is het zelfs beleid is dat interface-moderatoren ook moderator moeten zijn, zie ik), maar dat hoeft natuurlijk niet. Ik ben benieuwd wat jullie ervan vinden.
Hoe dan ook zou ik het allebei graag doen! -- Raketsla (zij/haar) (overleg) 7 sep 2023 16:37 (CEST)[reageren]
Ik voel me eerlijk gezegd niet zo geroepen tot het moderatorschap. Ik blijf maar liever een gewone, trouwe gebruiker, zoals ik dat ook op de andere projecten ben. Ik werk het liefst in mijn eigen tempo (dat zal de leeftijd wel zijn) en ik heb heel weinig sjoege van al die dingen die onder de motorkap zitten. Maar meer gekwalificeerde moderators is iets wat heel goed zal zijn voor de Nederlandstalige Wikisource! Overigens ben ik van mening dat moderators in de allereerste plaats ook gewoon "gebruikers" zouden moeten zijn. Enige kennis van hoe het voor een gewone gebruiker allemaal werkt is noodzakelijk om de gemeenschap (en zeker zo'n kleine als de onze) goed te kunnen (be-)dienen. --Dick Bos (overleg) 8 sep 2023 10:50 (CEST)[reageren]

Stemming Moderatorschap Raketsla

bewerken
  1. Voor. (proposant)--Havang(nl) (overleg) 7 sep 2023 16:49 (CEST)[reageren]
  2. Ook voor. Vincent Steenberg (overleg) 7 sep 2023 18:36 (CEST)[reageren]
  3. Voor! WeeJeeVee (overleg) 7 sep 2023 21:09 (CEST)[reageren]
  4. Helemaal mee eens, voor! Hamaryns (overleg) 7 sep 2023 21:35 (CEST)[reageren]
  5. Voor dus. Dick Bos (overleg) 8 sep 2023 10:50 (CEST)[reageren]
  6. Lijkt me prima. Romaine (overleg) 10 sep 2023 17:19 (CEST)[reageren]
Aanvraag ingediend --Havang(nl) (overleg) 15 sep 2023 13:01 (CEST)[reageren]

Wie heeft zin...

bewerken

Ik heb de scan gevonden bij Eedverbond der Edelen, wie heeft zin dit na te kijken (7 pagina's): Index:Eedverbond der Edelen.pdf --Havang(nl) (overleg) 10 sep 2023 16:00 (CEST)[reageren]

Ja leuk! Moeten we dan op de hoofdpagina nog iets zetten over de (18e eeuwse?) bron? -- Raketsla (zij/haar) (overleg) 10 sep 2023 17:03 (CEST)[reageren]
Nu ook bron toegevoegd, en al gecorrigeerd : Smeekschrift der Edelen. --Havang(nl) (overleg) 10 sep 2023 17:12 (CEST)[reageren]

Tech News: 2023-37

bewerken

MediaWiki message delivery 11 sep 2023 23:07 (CEST)[reageren]

Over gedichten over meerdere pagina’s

bewerken

Hallo — hoe werken jullie met gedichten die meerdere pagina’s lang zijn? Op de Engelse Wikisource is daar en:Template:Ppoem, waarmee men kan aangeven of het gedicht op de volgende pagina direct doorgaat, of dat er een nieuw stanza volgt. Ik gebruik nu hier de <poem /> tag, maar de afstand die je dan tussen pagina’s krijgt zit een beetje tussen de twee mogelijkheden in.

Is er al een betere manier? Zo niet, dan ga ik proberen en:Template:Ppoem over te nemen. -- Raketsla (zij/haar) (overleg) 12 sep 2023 15:45 (CEST)[reageren]

Het viel mij ook op, dat bij vervolg over twee pagina's de regelafstand eenmalig een fractie groter is. Dat schijnt tyoisch voor hier te zijn, ik heb er geen last van op s:fr. Daar hebben ze trouwens een combinatie van block center met poem gemaakt: s:fr:Modèle:Pom die ook interessant is.

De engelse Ppoem zier er wel ingewikkeld uit, met zowat alles in één, is dat een voordeel, of een nadeel? --Havang(nl) (overleg) 12 sep 2023 16:39 (CEST)[reageren]

Ah ja, ik moet ook zeggen, dat ik het eigenlijk alleen gebruik voor de start- en end-functie, om in hetzelfde stanza dan wel het volgende door te kunnen.
Ik heb het gevoel dat <poem /> zelf op de Engelse niet anders werkt… maar ik zal ook eens naar de Franse kijken. Ben wel benieuwd of je het daar dan ook zowel met als zonder witregel ertussen kunt doen? Hier lijkt het in ieder geval niet uit te maken als ik een witregel aan het eind van een <poem /> toevoeg. -- Raketsla (zij/haar) (overleg) 12 sep 2023 16:52 (CEST)[reageren]
De Franse wikisource maakt met CSS de overgang van de ene poem tag naar de volgende bijna onzichtbaar, maar met en:Template:Ppoem wordt het in transclusie semantisch daadwerkelijk één gedicht; dat lijkt me (ook met het oog op exports en verschillende apparaten) een nog betere optie. Maar wellicht geen gek idee om ze allebei te implementeren, zodat de poem tag er ook beter uitziet. -- Raketsla (zij/haar) (overleg) 12 sep 2023 18:51 (CEST)[reageren]
Het einde van de pagina doet niets met witregels, die worden niet weergegeven. Ik gebruik daarom sjablonen nop of nops niet. Ik zet witregels (1 of eventueel 2) op de nieuwe pagina na <poem> net zoals ik 1 of meer witregels zet na <nowiki /> aan het begin van nieuwe pagina's, die worden precies als aangegeven weergegeven.--Havang(nl) (overleg) 13 sep 2023 06:58 (CEST)[reageren]

Systeemfout ?

bewerken

Zit er een systeemfout in de harde return? Er zijn spontaan ongewenste dingen bij het gebruik van of verwijderen van de harde return, zoals het plotseling verschijnen van een deelstreepje; of bij de poging dat deelstreepje te verwijderen, het verdwijnen van de letter erna; of het niet meer werken van een sjabloon (Alineasjabloon, spatieringsjabloon e.d.) na die (ingevoerde of verwijderde) harde return. --Havang(nl) (overleg) 13 sep 2023 07:26 (CEST)[reageren]

Jouw wiki zal binnenkort in de 'alleen-lezen' modus te gebruiken zijn

bewerken

Trizek_(WMF) (talk) 15 sep 2023 11:23 (CEST)[reageren]

Aandacht voor de INDEX

bewerken

De INDEX is rijk aan mogelijkheden, maar die worden nog niet altijd volledig benut. Besteed dus aandacht aan het invullen van de INDEX. Op de Index kun je veel meer voorbereiden, zodanig dat niet op de transclusie-pagina's in de hoofdruimte maar alleen op de indexruimte veranderingen gemaakt hoeven te worden. Ideaal zou zijn als in de hoofdnaamruimte de getranscribeerde teksten alleen maar gebruik maken van de pages index tag. Speciale vensters van de index:

  • Scan leidt naar het brondocument, dat op commons alle brongegevens bevat (die hoeven dus niet allemaal herhaald te worden in de hoofdnaamruimte).
  • Pagelist maakt de individuele pagina's toegankelijk (zorgt voor het splitsen van de scan) en dient voor transclusie met de pages index tag. Tekst in dit vak boven de pagelist is bedoeld als aanwijzing voor de corrector en wordt niet getranscludeert.
  • Opmerkingen is de plek waar de Inhoud komt te staan. Die Inhoud daar stuurt de magic header aan en de nieuwe footer (dank @Gebruiker:Raketsla ) als in de tag pages index staat: header=1. Alle tekst in dit vak wordt getranscludeerd in de hoofdruimte als in de tag pages index staat: header=overzicht — misschien zou het veld Opmerkingen hernoemd kunnen worden naar Inhoud of Inhoud (Overzicht).
  • Delen kan gebruikt worden voor een serie boeken of een serie tijdschriftjaargangen en zou misschien als serie hernoemd kunnen worden.

Havang(nl) (overleg) 16 sep 2023 09:41 (CEST)[reageren]

Zeker! Ik geloof dat “Opmerkingen” op de Engelse Wikisource ook gewoon “Table of Contents” heet; misschien zouden we dat hier ook kunnen doen.
Maar vergeet niet mensen ook een beetje hun gang te laten gaan, hè. Dat Sjabloon:Koptekst werkt nog steeds prima, als men dat liever gebruikt (en krijgt ook gewoon de automatische footer!) Als je het graag wil stimuleren, kunnen we natuurlijk wel proberen die magic header nóg mooier te maken, zodat iedereen het op hun pagina’s wil! Haha. -- Raketsla (zij/haar) (overleg) 16 sep 2023 12:21 (CEST)[reageren]
Tja, onbekend maakt onbemind. Hoe meer men binnen de Index alles op orde heeft, hoe meer profijt van automatiseringen en nieuwe ontwikkelingen. De Index is de sleutel tot voortschrijdende automatisering, ook voor koppeling aan de bron en afbeeldingen op commons, aan wikidata, aan delen van een serie binnen wikisource, aan auteurs. --Havang(nl) (overleg) 16 sep 2023 13:15 (CEST)[reageren]

Auteurs op Wikisource

bewerken

Het verbaasde mij, dat veel verwijzingen bij de artikelen naar wikipedia niet verwijzen naar het document, maar naar de auteur. Dan is de stap via de wikisource-auteurspagina net zo zinvol, en kan men in navolging van s:Fr:Modèle:Auteur geautomatiseerde links naar wikipedia(=biografie), commons(=afbeeldingen) en wikidata maken in de auteursheader, zodat men op wikisource alleen een bibliografische lijst hoeft te plaatsen. Het argument dat op wikisource een introductie over de auteur gewenst is, vervalt daarmee. Kun je daar eens naar kijken, @Gebruiker:Raketsla ?--Havang(nl) (overleg) 16 sep 2023 13:15 (CEST)[reageren]

Vertaald uit de toelichting op het franse Modèle:Auteur
Deze syntaxis {{Auteur |contenu= {{Auteur |bevat= is degene die bij voorkeur moet worden gebruikt. Het heeft geen argumenten nodig, omdat het sjabloon de informatie uit Wikidata op zichzelf haalt, maar de pagina moet worden gekoppeld aan het overeenkomstige Wikidata-item. Om dit te doen, moet u eerst de auteurspagina op Wikisource maken, er verschijnt een foutmelding maar deze moet tijdelijk worden genegeerd. Vervolgens gaan we naar de Wikidata-pagina die deze auteur beschrijft om de link toe te voegen naar de nieuw aangemaakte "Auteur:XXXXX" pagina in de Wikisource sectie. Ten slotte kunt u teruggaan naar Wikisource en controleren of de informatie correct wordt weergegeven (na een zuivering (cache-purge) is de fout verdwenen). 
Dus met dat model krijgen we de gewenste mogelijkheid tot koppelen auteur aan wikidata er in één klap bij.-- Havang(nl) (overleg) 16 sep 2023 13:26 (CEST)[reageren]
Je moet eens kijken naar wat {{Infobox auteur}} nu al doet zonder enige argumenten, als de wikidata goed zit. Stiekem werkt het al lang, blijkbaar! Opmaak zou ondertussen wel weer vernieuwd kunnen worden, natuurlijk. -- Raketsla (zij/haar) (overleg) 16 sep 2023 13:32 (CEST)[reageren]
Dat sjabloon heet in s:fr: Syntaxe obsolètes, en dat obsolete sjabloon blijft actief voor bestaande auteurpagina's. Dus de variant met de korte syntaxis gebaseerd op Wikidata, met de tekst : " {{Auteur |contenu=", waarna je gegevens van wikidata met categorieen en interwiki's binnen haalt, is veel simpeler kan meer en is een verdere stap naar integratie van s: nl in het geheel van wikimedia sites. --Havang(nl) (overleg) 16 sep 2023 16:51 (CEST)[reageren]
bewerken

Ik heb s:fr:Auteur:Guillaume le Taciturne aangemaakt, met wikidatalink William the Silent, maar dat botst op wikisource met Hoofdportaal:Geschiedenis/Nederland/Willem van Oranje. Ik heb Auteur:Willem de Zwijger nog niet aangemaakt, in de hoop dat Raketsla dat kan naar Frans model, zodat na creatie de wikidatalink verplaatst kan worden van Hoofdportaal:... naar Auteur:... (betreft Index:Correspondance de Guillaume le Taciturne, prince d’Orange, 1857.djvu met fr en nl teksten) --Havang(nl) (overleg) 16 sep 2023 18:00 (CEST)[reageren]

@Havang(nl), Je kunt op wikidata Hoofdportaal:Geschiedenis/Nederland/Willem van Oranje gewoon vervangen door Auteur:Willem van Oranje. Het hoofdportaal niet hernoemen, a.u.b. En ja, ik weet dat deze er op dit moment een beetje sneu uitziet, maar daar wordt aan gewerkt. Vincent Steenberg (overleg) 16 sep 2023 19:28 (CEST)[reageren]

Late reactie

bewerken

@Gebruiker:Raketsla, @Gebruiker:Havang(nl). Sorry, ik ben niet zo vlot soms. Ik zie dit nu pas. Hebben jullie ook gekeken naar de opmerking onder Wikisource:Standaardopmaak van een auteur#Geautomatiseerde aanmaak van auteurspagina? Een paar jaar geleden hebben we dat "cadeau gekregen" tijdens een of andere hackathon of zo. Het werkt niet helemaal 100%, maar ik gebruik het wel. Het is enigszins vergelijkbaar met wat ook op en-ws wordt gebruikt. Dit zijn dingen, die eigenlijk het mooist Wikisource-breed, dus voor alle talen, zouden moeten worden ontwikkeld. Op zichzelf is dit een goed voorbeeld van gewenste integratie van Wikidata en Wikisource, waarbij ik me (in de toekomst) nog veel meer kan voorstellen, zoals bijv. dat vanuit Wikidata ook weer de informatie op de auteurspagina's in de verschillende talen kan worden gehaald (maar die moet dan wel gestandaardiseerd, in een sjabloon of zo, worden aangeboden, natuurlijk). --Dick Bos (overleg) 5 okt 2023 16:43 (CEST)[reageren]

Nieuwe feature: Kop- en voettekst in de Pagina-namespace voor een heel werk

bewerken

Hoii, ik heb iets aan de praat gekregen wat jullie misschien handig vinden, dus ik laat het even weten.

Zoals jullie misschien weten, kun je op sommige wikisources op de Indexpagina iets invullen bij de koptekst en voettekst, en dit wordt dan automatisch aan elke nieuwe pagina toegevoegd in die velden. Dat werkt nu hier ook!

Dus bijvoorbeeld: stel dat veel pagina’s, zoals in Plantenschat (te zien op bijv. deze pagina) bovenaan de pagina het paginanummer heeft, dan kun je in de Indexpagina dit toevoegen bij het veld Koptekst:

{{RH||— {{{pagenum}}} —|}}

En dan zou elke nieuwe pagina dat automatisch in de koptekst krijgen (met het goede paginanummer).

(Ik heb hier de velden intern voor moeten hernoemen, dus als men hier al eerder mee getest heeft, zullen ze opnieuw aan de Indexpagina’s moeten worden toegevoegd.) -- Raketsla (zij/haar) (overleg) 16 sep 2023 14:41 (CEST)[reageren]

Handig! En "pagenum" correspondeert dan met de pagelist? Vincent Steenberg (overleg) 16 sep 2023 15:24 (CEST)[reageren]
En dit kan ook?
{{c|— {{{pagenum}}} —}}
Vincent Steenberg (overleg) 16 sep 2023 15:25 (CEST)[reageren]
Ja, dat kan net zo goed inderdaad! Pagenum komt inderdaad uit de pagelist, en ik ga proberen en:Template:Recto-verse header over te nemen zodat je ook automatisch verschillende dingen op de even en oneven pagina’s kunt zetten. -- Raketsla (zij/haar) (overleg) 16 sep 2023 15:41 (CEST)[reageren]

Nieuwe velden op Indexpagina

bewerken

Hallo hallo, even voor wie mee wil denken: ik zou graag een paar (optionele) velden willen toevoegen aan de Indexpagina en het Sjabloon:Koptekst, namelijk:

  • De druk
  • Het jaar van eerste uitgave
  • Een ondertitel

De ontertitel kan mooi zijn als extra formattering voor wie dat wil (zie ook Overleg gebruiker:Raketsla#Subtitel in Index ?), en de druk en oorspronkelijke uitgave lijken me mooi voor teksten waarvan verschillende versies bestaan, om duidelijker te maken om welke versie het gaat. Zo zou ik het bijv. mooi vinden als de Max Havelaar vermeldt dat het om de vyfde druk gaat, en dat het jaartal van de eerste druk (1860) ook wordt weergegeven.

Ik hoop dat dat niet erg controversieel is als optionele velden, die anders gewoon weggelaten worden? En ik zou het ook graag horen als mensen nog andere wensen hebben qua velden op de Indexpagina en in de koptekst! -- Raketsla (zij/haar) (overleg) 16 sep 2023 21:10 (CEST)[reageren]

Ondertitel is al eerder gevraagd. Druk en eerste... nuttig. --Havang(nl) (overleg) 17 sep 2023 08:51 (CEST)[reageren]

Tech News: 2023-38

bewerken

MediaWiki message delivery 18 sep 2023 21:19 (CEST)[reageren]

Hoi, ik heb deze anonieme gebruiker geblokkeerd vanwege trollengedrag. Ik hoop dat dat ok is. Vincent Steenberg (overleg) 22 sep 2023 18:33 (CEST)[reageren]

Well done. Ik wilde het je net vragen.--Havang(nl) (overleg) 22 sep 2023 19:14 (CEST)[reageren]

Tech News: 2023-39

bewerken

MediaWiki message delivery 26 sep 2023 18:51 (CEST)[reageren]

Koptekst tijdschriftartikel

bewerken

Gebruiker @Raketsla heeft op mijn overlegpagina aangegeven dat ze wil kijken of Sjabloon:Koptekst ook voor andere soorten bronnen gebruikt kan worden dan alleen boeken. Goed idee. Als het mij ligt bestaat de koptekst tijdschrift uit de volgende elementen:

  1. naam auteur (liefst met label bijv. [[Auteur:Piet Jansen|P. Jansen]]; dit met het oog op eventuele pseudoniemen, enz. en ik vind het best pratice als de namen in de koptekst overeen komt met namen in het artikel).
  2. datum van uitgave (liefst zo specifiek mogelijk bijv. zaterdag 1 januari 2000, maar altijd zoals die voorkomt in het tijdschrift)
  3. titel van het tijdschriftartikel
  4. titel van het tijdschrift
  5. jaargang (indien aanwezig)
  6. nummer (indien aanwezig)
  7. paginanummers (indien aanwezig)

Ik heb voor De Stijl/Jaargang 1/Nummer 1/Ter inleiding een wikidata item gemaakt, maar die doet vooralsnog niks. Misschien heb ik hem verkeerd ingevuld. Vincent Steenberg (overleg) 27 sep 2023 17:35 (CEST)[reageren]

“Zoals het voorkomt in het tijdschrift” is gelukkig goed in de Wikidata te regelen! Zie bijv. d:Q122800658#P50, waar de auteur naar Eduard Douwes Dekker linkt met “oorspronkelijke schrijfwijze” (“object named as” in het Engels) als Multatuli. En dat kan dan ook automatisch worden overgenomen, hier te zien.
Wikidata doet inderdaad tot nu toe standaard heel weinig: het kan missende velden op de Indexpagina laten zien, maar die worden niet daadwerkelijk door de magic header overgenomen. Zoals je misschien gezien hebt ben ik aan het werken aan een nieuwe magic header die zelf ook de data uit Wikidata haalt, zodat dat geen probleem is. (bijv. te zien op Wys my de plaats waar ik gezaaid heb!) Maar omdat dat nog volop in ontwikkeling is, moet je dat handmatig per werk aanzetten. Daar wil ik iemand best mee helpen, maar voordat het op grotere schaal in kan worden gezet moet er eigenlijk nog best wel wat gebeuren. -- Raketsla (zij/haar) (overleg) 28 sep 2023 20:59 (CEST)[reageren]
Die kwalificatie kende ik nog niet. Bedankt voor de tip! Ja, ik zie bij recente wijzigingen regelmatig proeven van jou voorbijkomen met Wikidata in relatie tot Wikisource. Ik ben benieuwd naar de uitkomst. Fijn dat je dat allemaal wil doen voor onze mini-gemeenschap. Vincent Steenberg (overleg) 28 sep 2023 21:16 (CEST)[reageren]
ideetje voor artikelkoptekst opmaak -- Raketsla (zij/haar) (overleg) 28 sep 2023 21:31 (CEST)[reageren]
Kun je voor artikelkoptekst enerzijds Tijdschriftgegevens en anderzijds Artikelgegevens apart houden? Bijvoorbeeld : artikeltitel en artikelauteur bovenaan, en De Stijl, jaargang 4, nr.1, januari 1921 p.1-5 samenvoegen tot één regel en die onderaan. Binnen een regel, geen stapeling van links (De Stijl,Jaargang 4, Nummer 1), maar korter, directer : De Stijl, Jaargang 4, Nummer 1 ? --Havang(nl) (overleg) 29 sep 2023 15:40 (CEST)[reageren]