Captcha en digitale boeken

Posted on | april 17, 2009 | No Comments

<tip> Mede-webber Eefje op de Den Buysch wees me vandaag op een interessante toepassing waar ik niet eerder bij heb stil gestaan: de reCaptcha, een tool van de Carnegie Mellon universiteit die een digitale toepassing combineert met wetenschappelijk nut.

reCaptcha

Een captcha (afkorting van “completely automated public Turingtest to tell computers and humans apart”) is een reactietest die in de gegevensverwerking wordt gebruikt om te bepalen of er al dan niet sprake is van een menselijke gebruiker. Captcha’s worden gebruikt om te voorkomen dat bots diverse online diensten gebruiken. Captcha’s verhinderen automatische deelname van bots aan online opiniepeilingen en automatische inschrijving voor gratis e-mailboxen (die dan kunnen worden gebruikt om spam te verzenden), en voorkomen dat bots spam versturen door de (niet herkende) afzender een captchatest te laten afleggen alvorens het e-mailbericht te verzenden.

De applicatie van Carnegie Mellon voegt hier een nieuw aspect aan toe. Zij gebruikt woorden uit boeken die gedigitaliseerd worden en door een computer niet gelezen kunnen worden. Hierdoor beveilig je niet alleen je systeem, maar lever je ook een bijdrage aan het digitaliseren van kennis. Momenteel werkt de universiteit aan het digitaliseren van onder meer oude edities van de New York Times. Ze zeggen hier zelf over:

reCAPTCHA improves the process of digitizing books by sending words that cannot be read by computers to the Web in the form of CAPTCHAs for humans to decipher. More specifically, each word that cannot be read correctly by OCR is placed on an image and used as a CAPTCHA. This is possible because most OCR programs alert you when a word cannot be read correctly.

Alice in Wonderland

Een belangrijke gebruiker van de reCaptcha is het alom gehypte Twitter. Ik juich het gebruik van dit soort open source toepassingen toe. Het nuttige met het nuttige vereenzelvigen. Bij het digitaliseren van boeken had ik nog ergens een romantisch idee, gestoeld op het monnikenwerk (zie Anno.nl) uit de Middeleeuwen, al is dat natuurlijk totaal niet aan de orde. Met hulp van scanners gaat het overzetten van boeken in een rap tempo.

Zo is het mogelijk dat ineens de meest bijzondere edities van het favoriete boek van Eefje en mij beschikbaar zijn. Ze ruiken dan wel niet zo lekker -en vasthouden gaat ook wat lastig- maar kijken, genieten en leren wordt makkelijker dan ooit.

  • Share/Bookmark

No related posts.

Comments

Leave a Reply





  • Over

    De Uitgeeffabriek blogt over transmediale ontwikkelingen.

    Twitter Button from twitbuttons.com


  • @Hillevanderkaa

  • laatste reacties