Item


Reptes i oportunitats en la transcripció automàtica de textos manuscrits: l’explotació dels llibres de l’Ofici d’Hipoteques

Enric Saguer esmenta que un dels reptes dels historiadors és afrontar el caràcter massiu de la documentació i el tractament de les sèries documentals. Amb la tecnologia de transcripció automàtica de textos manuscrits, que ara està en procés de desenvolupament, es dona resposta a aquesta gestió massiva de documentació i esdevé un pas qualitatiu alhora que canvia la manera de treballar amb la documentació d’arxiu, un canvi que exigeix noves competències per part dels historiadors. Continua distingint entre la transcripció automàtica de textos impresos i la de textos manuscrits, essent aquesta última més complicada. Anomena dues maneres de transcripció automàtica de textos: la de word spotting, la detecció probabilística de paraules clau a partir d’imatges, i la transcripció completa o diplomàtica, que seria la transcripció del text original. Aquesta última és la que ens mostra i ens explica a través del projecte de recerca cooperatiu que participa. Aquest té el focus en la transcripció automàtica de textos manuscrits per estudiar el canvi social durant la segona meitat del segle XVII a través de l’Ofici d’Hipoteques de Girona d’uns 135.000 documents. 95.900 dels quals ja estan buidats i els resultats estan en la base de dades que s’ha creat, producte d’aquesta transcripció automàtica, i que és consultable en suport web en fase de proves. Continua explicant que el procés de transcripció del text manuscrit passa per diferents fases: la de digitalització, la de descodificació i reestructuració i la de transcripció. Fa esment en les dificultats actuals d’aquesta eina pels seus costos, la taxa alta d’errors i l’exigència elevada d’un treball de correcció i normalització, malgrat que es mostra esperançat que aquestes dificultats seran superades en poc temps i esdevindrà una eina a l’abast de moltes persones.

7022.mp4 7022.mp3

4

Institut de Recerca Històrica

Author: Saguer Hom, Enric
Date: 2023 February 24
Abstract: Enric Saguer esmenta que un dels reptes dels historiadors és afrontar el caràcter massiu de la documentació i el tractament de les sèries documentals. Amb la tecnologia de transcripció automàtica de textos manuscrits, que ara està en procés de desenvolupament, es dona resposta a aquesta gestió massiva de documentació i esdevé un pas qualitatiu alhora que canvia la manera de treballar amb la documentació d’arxiu, un canvi que exigeix noves competències per part dels historiadors. Continua distingint entre la transcripció automàtica de textos impresos i la de textos manuscrits, essent aquesta última més complicada. Anomena dues maneres de transcripció automàtica de textos: la de word spotting, la detecció probabilística de paraules clau a partir d’imatges, i la transcripció completa o diplomàtica, que seria la transcripció del text original. Aquesta última és la que ens mostra i ens explica a través del projecte de recerca cooperatiu que participa. Aquest té el focus en la transcripció automàtica de textos manuscrits per estudiar el canvi social durant la segona meitat del segle XVII a través de l’Ofici d’Hipoteques de Girona d’uns 135.000 documents. 95.900 dels quals ja estan buidats i els resultats estan en la base de dades que s’ha creat, producte d’aquesta transcripció automàtica, i que és consultable en suport web en fase de proves. Continua explicant que el procés de transcripció del text manuscrit passa per diferents fases: la de digitalització, la de descodificació i reestructuració i la de transcripció. Fa esment en les dificultats actuals d’aquesta eina pels seus costos, la taxa alta d’errors i l’exigència elevada d’un treball de correcció i normalització, malgrat que es mostra esperançat que aquestes dificultats seran superades en poc temps i esdevindrà una eina a l’abast de moltes persones.
7022.mp4 7022.mp3
4
Format: audio/mpeg
video/mp4
Document access: http://hdl.handle.net/10256.1/7022
Language: cat
Publisher: Institut de Recerca Històrica
Collection: Segones Jornades Institut de Recerca Històrica: Història, Humanitats i Noves Tecnologies
Rights: Attribution-NonCommercial-ShareAlike 4.0 International
Rights URI: http://creativecommons.org/licenses/by-nc-sa/4.0/
Subject: Humanitats - Innovacions tecnològiques
Humanities - Technological innovations
Title: Reptes i oportunitats en la transcripció automàtica de textos manuscrits: l’explotació dels llibres de l’Ofici d’Hipoteques
Type: info:eu-repo/semantics/lecture
Repository: DUGiMedia

Subjects

Authors