Pslits
Welkom op Wikisource, Pslits!
|
Welkom
bewerkenWelkom Pslits op Wikisource. Fijn dat je wil bijdragen.
Ik zag dat je een 2 nieuwe indexen hebt aangemaakt. Ik geloof dat degene die eindigt op /7 fout was en hierbij meld ik even dat ik die heb verwijdert. Als je nog verdere vragen hebt staat het je vrij om deze te vragen. Dat kan op deze pagina of hier. WillemBK (overleg) 7 okt 2016 21:59 (CEST)
Welkom!
bewerkenDag,
fijn om te zien dat je bijdraagt aan nl-wikisource! Welkom. Als je iets te vragen hebt, aarzel dan niet. We zullen je graag helpen.
Een kleinigheidje: misschien wil je je bewerkingen standaard even voorzien van een korte bewerkingssamenvatting. Dat houdt de lijst met recente wijzigingen wat overzichtelijk. Als je geen bewerkingssamenvatting geeft, verschijnt in de lijst automatisch een heel verhaal, nl. het begin van de aangemaakte pagina.
Hartelijke groet,
tools
bewerkenDag,
als ik het me goed herinner, is de "cleanup OCR" tool een onderdeel van de tool die ik hier heb beschreven. Maar ik weet het eerlijk gezegd niet meer helemaal zeker (ik vermoed dat ik het op nl-ws in 2015 heb geïnstalleerd; ik had het al eerder op de Engelse in gebruik, waarschijnlijk omdat een collega daar me erop wees). De tool verschijnt alleen in de linkerbalk onderaan als je in de edit mode bent (Brontekst bewerken, als de VE is ingeschakeld; anders wrsch. gewoon bewerken). Het is een groep onder de titel "Page Tools" en een linkje verwijst naar deze pagina. Zou je het eens willen uitproberen? En dan is een volgende stap natuurlijk om te bekijken hoe het "gelokaliseerd" zou kunnen worden.
De manier waarop ik de tool gebruik is als volgt:
- een nieuwe pagina, bijv. Pagina:Land_en_volk_van_Sumatra_(1916).djvu/161:
- eerst de header maken (sorry: Koptekst)
- in dit geval ook even de "hwe"
- alinea's indelen en tussenkopje
- dan gebruik ik: "Cleanup OCR"; belangrijkste functie is dat daarmee in één keer voor de hele pagina de harde returns worden opgeruimd. Maar goed. de tool doet ook nog een aantal andere dingen: eventuele afbreekstreepjes worden opgeruimd, en er wordt dus ook gerommeld aan de gedachte(n)streepjes, als die in de tekst zitten. En er zullen nog wel wat meer dingen worden gedaan, die ik nu even niet paraat heb.
- ik ruim ook nog altijd meteen de "references"-tag in de voettekst op (als die niet nodig is; in andere gevallen vervang ik die door 12px (omdat ik dat mooier vind) en als ik zo bij het "bekijken" van de edit foutjes zie, doe ik die ook meteen.
(Ik lees in ieder geval de pagina niet helemaal door in dit stadium).
Dan sla ik de pagina op, met omschrijving: cleanup ocr etc.
"Land en volk van Sumatra" is een aardig voorbeeld. Als je tijd hebt, zou je het eens even moeten proberen.
Tot zover even, hartelijke groet, --Dick Bos (overleg) 11 nov 2016 09:24 (CET)
- Ik heb gezien dat het script nu niet beschikbaar is op de Nederlandse wikisource. Ik heb niet de rechten om het te kopieren, dus heb ik het maar even naar een persoonlijke sub-pagina gekopieerd. Ik heb gezien dat het proofreading script specifiek voor het Engels is ontworpen. Wat ik kan doen, is het geschikt maken voor het Nederlands, maar dan moeten er wel keuzes gemaakt worden betreffende stijl. Verder kunnen er ook correcties in opgenomen worden van fouten die vaak voorkomen en specifiek met het Nederlands te maken hebben. Is het mogelijk, omdat samen met u te doen? Als testversie kan dan voorlopig gebruik gemaakt worden van mijn persoonlijk script, totdat we deze goed genoeg vinden. Als start heb ik iets aangemaakt op mijn gebruikerspagina. Vriendelijke groeten --Pslits (overleg) 12 nov 2016 12:05 (CET)
Mooi werk!
bewerkenDag,
mag ik voorstellen dat we elkaar tutoyeren? Dat is toch wel een beetje gebruik op Wikipedia en de andere projecten. Verder: fantastisch dat je al zo enthousiast met de "cleanup OCR" tools aan de slag bent gegaan! Er blijken allerlei dingen in schuil te gaan, waarvan ik werkelijk niet vermoedde dat die erin zaten. Natuurlijk wil ik graag behulpzaam zijn om hier een mooie tool van te maken, die aangepast is aan de Nederlandse situatie. Eén van de dingen die zouden kunnen worden aangepast is dus bijv. de kwestie van de gedachtenstreepjes! Verder zal ik alle dingen de komende tijd doorlopen. Leg mij voor de zekerheid nog even uit hoe ik het test-script kan gebruiken (en hoe ik eventueel het oude -"Engelse" - script weer kan terugzetten als ik dat nodig heb.
Verder: ik zit momenteel midden in een verhuizing, dus ik heb niet zoveel tijd. Het kleine beetje tijd dat ik beschikbaar heb, besteed ik voor een deel ook aan een klus op en-ws waar ik druk mee ben op het moment. Dus het kan wel even duren. Maar laat je daar niet door weerhouden! Het ziet er allemaal al heel goed uit. En ik heb er alle vertrouwen in dat dit een mooi ding gaat worden. Helaas zijn er niet zoveel mensen die met de proofread-extensie werken op nl-ws, tot nu toe. Ik hoop natuurlijk dat dat gaat veranderen. Eén andere actieve bewerker ken ik heel goed (dat is mijn partner). Zij zal ook zeker hieraan mee willen doen. Tot gauw, --Dick Bos (overleg) 15 nov 2016 19:32 (CET)
Share your experience and feedback as a Wikimedian in this global survey
bewerkenHello! The Wikimedia Foundation is asking for your feedback in a survey. We want to know how well we are supporting your work on and off wiki, and how we can change or improve things in the future.[survey 1] The opinions you share will directly affect the current and future work of the Wikimedia Foundation. You have been randomly selected to take this survey as we would like to hear from your Wikimedia community. To say thank you for your time, we are giving away 20 Wikimedia T-shirts to randomly selected people who take the survey.[survey 2] The survey is available in various languages and will take between 20 and 40 minutes.
You can find more information about this project. This survey is hosted by a third-party service and governed by this privacy statement. Please visit our frequently asked questions page to find more information about this survey. If you need additional help, or if you wish to opt-out of future communications about this survey, send an email to surveys@wikimedia.org.
Thank you! --EGalvez (WMF) (talk) 13 jan 2017 23:25 (CET)
- ↑ This survey is primarily meant to get feedback on the Wikimedia Foundation's current work, not long-term strategy.
- ↑ Legal stuff: No purchase necessary. Must be the age of majority to participate. Sponsored by the Wikimedia Foundation located at 149 New Montgomery, San Francisco, CA, USA, 94105. Ends January 31, 2017. Void where prohibited. Click here for contest rules.
djvu
bewerkenDag, Wat fijn dat je weer even terug bent op Wikisource. Dat stimuleert mij ook weer om wat op te pakken. Ik heb nog wel een vraag. Je hebt verleden jaar twee boeken geupload, Reize door de Majorei... en Tweede reize door ..... Nu is dat Reize door de Majorei in het djvu formaat. Hoe kom jij daar aan? Kan jij die zelf aanmaken? Daar ben ik erg nieuwsgierig naar. Groet Wilma WeeJeeVee (overleg) 9 sep 2017 10:55 (CEST)
- Dag Wilma,
- Ja, ik ben idd weer eens terug. Dat gaat zo met seizoenen bij mij ;) Houd me hiernaast ook bezig met genealogie, waarbij ik ook originele archieven digitaliseer. Is weer een andere tak van sport. Mijn interesse ligt in ieder geval bij geschiedkunde. Vandaar de keuze voor de boeken die ik nu digitaliseer. Het djvu-bestand heb ik vorig jaar eerst plaatje per plaatje gedownload als jpg's en heb ze daarna met ABBYY Finereader OCR gegevens toegevoegd en geëxporteerd als djvu. Ik moet wel zeggen dat de standaard OCR cleanup die door verschillende mensen gebruikt wordt niet werkte op deze OCR en heb ik daar een aanpassing op gemaakt. Op mijn persoonlijke site staat een beschrijving hoe je mijn versie kunt gebruiken.
- Als je iets hebt wat je wilt omzetten naar djvu, dan laat het gerust weten. Dan kunnen we het meteen ook documenteren welke stappen er dan doorlopen moeten worden, zodat anderen dat kunnen hergebruiken.--Pslits (overleg) 9 sep 2017 15:04 (CEST)
- Dank voor je antwoord en je aanbod! Er komt regelmatig iets op mijn pad waarvan ik eigenlijk een djvu zou willen hebben. Nu even niets paraat, ook ik ben af en toe meer met andere dingen bezig dan met wikisource. Maar kom altijd wel weer terug. Zo gauw ik iets heb, kom ik er mee. En natuurlijk is het een heel goed plan om dan de stappen te documenteren. Voor mezelf, maar ook voor anderen.
Groet Wilma WeeJeeVee (overleg) 9 sep 2017 19:27 (CEST)
- Dag Pslits, Inmiddels heb ik een projectje waar ik graag een djvu van zou willen hebben. Het is een klein boekje van 32 pagina's. Deze 32 pagina's hebben we in PNG formaat. Graag wil ik die omzetten naar djvu. Hoe zullen we dat aanpakken? WeeJeeVee (overleg) 13 sep 2017 16:19 (CEST)
- Dag Wilma, Hebben jullie al eens met WeTransfer gewerkt? Hiermee kun je grotere bestanden met elkaar uitwisselen. Dit is gratis tot 2 GB, maar daar zal dit boekje wel in passen. Omdat we via wikisource niet kunnen mailen stel ik het volgende voor: ga naar http://www.wetransfer.com en upload de png bestanden en laat de download link naar je eigen email adres sturen. In de mail die je ontvangt kun je de download link kopiëren in hier op de overlegpagina plakken. Dan kan ik, als het goed is, de bestanden ook downloaden. Als ik alles verwerkt heb tot een djvu bestand, dan zal ik het omgekeerde doen. Gaat dan lukken denk je? Groeten, Paul --Pslits (overleg) 13 sep 2017 20:09 (CEST)
- Ja, dat gaat lukken! WeeJeeVee (overleg) 13 sep 2017 20:20 (CEST)
- Hier is de link, succes ermee. Als de OCR niet erg goed is, is dat in dit geval niet erg. We hebben al een getranscribeerde tekst. [1] WeeJeeVee (overleg) 14 sep 2017 12:25 (CEST)
- Hallo Wilma, ik ben nog bezig met het onderzoeken welke methode ik het beste kan gebruiken. Finereader is een nogal prijzig alternatief, maar er zijn ook andere oplossingen. Er is wat scripting die gebruikt kan worden, maar dat vereist helaas wel heel wat kennis. Ben nu aan het kijken wat ik met het internet archive kan doen. Ik houd je op de hoogte... --Pslits (overleg) 17 sep 2017 21:25 (CEST)