Ítem


ARI: Agent Recaptador d’Informació : desenvolupament d’una aplicació que reculli informació de portals web dedicats a la gestió de premsa

Tenint en compte l’evolució a Internet dels portals d’informació dels mitjans de comunicació, sorgeix la idea d’un motor de cerca orientat a la recaptació de notícies dispersades per les diferents pàgines web dels grans mitjans de comunicació espanyols, que permetés obtenir informació sobre “descriptors contractats” pels usuaris d’un portal. El primer objectiu és l’anàlisi de les necessitats que es volen cobrir per a un hipotètic client de l’aplicació, el segon és en l’àmbit algorítmic, cal obtenir una metodologia de treball que permeti l’obtenció de la notícia. En l’àmbit de la programació es consideren tres etapes: descarregar les pàgines web necessàries, que es farà mitjançant les eines que proporciona la llibreria cUrl; l’anàlisi de les notícies (obtenir tots els enllaços que corresponen a notícies, filtrar els descriptors per decidir si cal guardar la notícia, analitzar l’estructura interna de les notícies seleccionades per guardar-ne només les parts establertes), i la base de dades que ens ha de permetre organitzar i gestionar les notícies escollides

Director: Patow, Gustavo Ariel
Altres contribucions: Universitat de Girona. Escola Politècnica Superior
Autor: Gómez Pérez, Alejandra
Resum: Tenint en compte l’evolució a Internet dels portals d’informació dels mitjans de comunicació, sorgeix la idea d’un motor de cerca orientat a la recaptació de notícies dispersades per les diferents pàgines web dels grans mitjans de comunicació espanyols, que permetés obtenir informació sobre “descriptors contractats” pels usuaris d’un portal. El primer objectiu és l’anàlisi de les necessitats que es volen cobrir per a un hipotètic client de l’aplicació, el segon és en l’àmbit algorítmic, cal obtenir una metodologia de treball que permeti l’obtenció de la notícia. En l’àmbit de la programació es consideren tres etapes: descarregar les pàgines web necessàries, que es farà mitjançant les eines que proporciona la llibreria cUrl; l’anàlisi de les notícies (obtenir tots els enllaços que corresponen a notícies, filtrar els descriptors per decidir si cal guardar la notícia, analitzar l’estructura interna de les notícies seleccionades per guardar-ne només les parts establertes), i la base de dades que ens ha de permetre organitzar i gestionar les notícies escollides
Accés al document: http://hdl.handle.net/2072/183573
Llenguatge: cat
Drets: Aquest document està subjecte a una llicència Creative Commons: Reconeixement – No comercial – Sense obra derivada (by-nc-nd)
URI Drets: http://creativecommons.org/licenses/by-nc-nd/3.0/es/deed.ca
Matèria: Cercadors d’Internet
Indexació automàtica
Premsa electrònica -- Bases de dades
Web search engines
Automatic indexing
Electronic journals -- Databases
Títol: ARI: Agent Recaptador d’Informació : desenvolupament d’una aplicació que reculli informació de portals web dedicats a la gestió de premsa
Tipus: info:eu-repo/semantics/bachelorThesis
Repositori: Recercat

Matèries

Autors