Ítem


Reptes i oportunitats en la transcripció automàtica de textos manuscrits: l’explotació dels llibres de l’Ofici d’Hipoteques

Enric Saguer esmenta que un dels reptes dels historiadors és afrontar el caràcter massiu de la documentació i el tractament de les sèries documentals. Amb la tecnologia de transcripció automàtica de textos manuscrits, que ara està en procés de desenvolupament, es dona resposta a aquesta gestió massiva de documentació i esdevé un pas qualitatiu alhora que canvia la manera de treballar amb la documentació d’arxiu, un canvi que exigeix noves competències per part dels historiadors. Continua distingint entre la transcripció automàtica de textos impresos i la de textos manuscrits, essent aquesta última més complicada. Anomena dues maneres de transcripció automàtica de textos: la de word spotting, la detecció probabilística de paraules clau a partir d’imatges, i la transcripció completa o diplomàtica, que seria la transcripció del text original. Aquesta última és la que ens mostra i ens explica a través del projecte de recerca cooperatiu que participa. Aquest té el focus en la transcripció automàtica de textos manuscrits per estudiar el canvi social durant la segona meitat del segle XVII a través de l’Ofici d’Hipoteques de Girona d’uns 135.000 documents. 95.900 dels quals ja estan buidats i els resultats estan en la base de dades que s’ha creat, producte d’aquesta transcripció automàtica, i que és consultable en suport web en fase de proves. Continua explicant que el procés de transcripció del text manuscrit passa per diferents fases: la de digitalització, la de descodificació i reestructuració i la de transcripció. Fa esment en les dificultats actuals d’aquesta eina pels seus costos, la taxa alta d’errors i l’exigència elevada d’un treball de correcció i normalització, malgrat que es mostra esperançat que aquestes dificultats seran superades en poc temps i esdevindrà una eina a l’abast de moltes persones.

7022.mp4 7022.mp3

4

Institut de Recerca Històrica

Autor: Saguer Hom, Enric
Data: 24 febrer 2023
Resum: Enric Saguer esmenta que un dels reptes dels historiadors és afrontar el caràcter massiu de la documentació i el tractament de les sèries documentals. Amb la tecnologia de transcripció automàtica de textos manuscrits, que ara està en procés de desenvolupament, es dona resposta a aquesta gestió massiva de documentació i esdevé un pas qualitatiu alhora que canvia la manera de treballar amb la documentació d’arxiu, un canvi que exigeix noves competències per part dels historiadors. Continua distingint entre la transcripció automàtica de textos impresos i la de textos manuscrits, essent aquesta última més complicada. Anomena dues maneres de transcripció automàtica de textos: la de word spotting, la detecció probabilística de paraules clau a partir d’imatges, i la transcripció completa o diplomàtica, que seria la transcripció del text original. Aquesta última és la que ens mostra i ens explica a través del projecte de recerca cooperatiu que participa. Aquest té el focus en la transcripció automàtica de textos manuscrits per estudiar el canvi social durant la segona meitat del segle XVII a través de l’Ofici d’Hipoteques de Girona d’uns 135.000 documents. 95.900 dels quals ja estan buidats i els resultats estan en la base de dades que s’ha creat, producte d’aquesta transcripció automàtica, i que és consultable en suport web en fase de proves. Continua explicant que el procés de transcripció del text manuscrit passa per diferents fases: la de digitalització, la de descodificació i reestructuració i la de transcripció. Fa esment en les dificultats actuals d’aquesta eina pels seus costos, la taxa alta d’errors i l’exigència elevada d’un treball de correcció i normalització, malgrat que es mostra esperançat que aquestes dificultats seran superades en poc temps i esdevindrà una eina a l’abast de moltes persones.
7022.mp4 7022.mp3
4
Format: audio/mpeg
video/mp4
Accés al document: http://hdl.handle.net/10256.1/7022
Llenguatge: cat
Editor: Institut de Recerca Històrica
Col·lecció: Segones Jornades Institut de Recerca Històrica: Història, Humanitats i Noves Tecnologies
Drets: Attribution-NonCommercial-ShareAlike 4.0 International
URI Drets: http://creativecommons.org/licenses/by-nc-sa/4.0/
Matèria: Humanitats - Innovacions tecnològiques
Humanities - Technological innovations
Títol: Reptes i oportunitats en la transcripció automàtica de textos manuscrits: l’explotació dels llibres de l’Ofici d’Hipoteques
Tipus: info:eu-repo/semantics/lecture
Repositori: DUGiMedia

Matèries

Autors