Bronnen

0

Oude liederen vinden we terug in lang vergeten “cahiers” of schriftjes waarin ijverige jongeren een kleine honderd jaar geleden de volgens hen memorabele liedjes noteerden. Of in zuinig bewaarde marktzangersliedbladen. Of in vergeelde boeken.

Hoe?

De meeste schriftjes die we verzamelden kan u zelf integraal lezen via de link naar de PDF-scan1 die we er van maakten. Ook de marktzangersliedbladen en onze verzameling van meer dan 800 boeken of van artikels in tijdschriften hebben we ingescand en omgezet naar PDF.

Alle PDF-documenten werden en worden met OCR2 lees- en doorzoekbaar gemaakt voor de computer en geïndexeeerd zodat opzoekingen naar en vergelijkingen van teksten makkelijker worden.

Er zijn een paar beperkingen die dat doorzoeken toch nog bemoeilijkt:

  • OCR werkt redelijk goed met gedrukte tekst, voor zover die zuiver en gelijkmatig is en geen gebruik maakt van fantasierijke lettertypes. Voor oude en vergeelde boeken valt dat dikwijls tegen en voor slordig gedrukte marktzangersblaadjes ook.
  • Handgeschreven liedschriften zijn dan weer helemaal onleesbaar voor OCR. Die moeten eerst minstens gedeeltelijk overgetypt worden in een tekstverwerker, een tijdrovend en eentonig werkje. Extra-moeilijk als er een slordig of zeer persoonlijk handschrift in het spel is.
  • de titels van de liederen zijn – zeker in liedschriften – dikwijls verzonnen door de verslaggever en ook de tekst van strofen en refrein staat vol drukfouten of verkeerd begrepen woorden, zoeken op een hele zin levert dus meestal weinig resultaten op
  • hoewel ook mooi gedrukte muziekpartituren mits extra-software omgezet kunnen worden naar bewerkbare digitale versies, hebben we daar weinig aan: partituren zijn zelden voorhanden, zelfs niet in liedboeken, en als ze er wel zijn gaat het vaak om handgeschreven versies die te onregelmatig zijn om softwarematig om te zetten. Al onze partituren zijn dus door onszelf ingetikt en van begeleidingsakkoorden voorzien.

1 PDF = het Portable Document Format, gebaseerd op PostScript, dat door Adobe circa 1993 werd bedacht en voor iedereen toegankelijk gemaakt met de (sinds 1994) gratis Acrobat Reader. Bovendien is PDF in Apple’s Mac OS lees- en schrijfbaar zonder extra software.
Om PDF-bestanden te indexeren en die index te raadplegen heb je dan weer wel de prijzige “professionele” Adobe Acrobat software nodig …
2 OCR = Optical Character Recognition

 

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *

This site uses Akismet to reduce spam. Learn how your comment data is processed.

Copyright © 1995-2019 Wreed en Plezant Alle rechten voorbehouden.
Deze site is met behulp van deMulti kind-thema, v2.2, bovenop
het bovenliggende themaDesk Mess Mirrored, v2.5, vanBuyNowShop.com