Item


ARI: Agent Recaptador d’Informació : desenvolupament d’una aplicació que reculli informació de portals web dedicats a la gestió de premsa

Tenint en compte l’evolució a Internet dels portals d’informació dels mitjans de comunicació, sorgeix la idea d’un motor de cerca orientat a la recaptació de notícies dispersades per les diferents pàgines web dels grans mitjans de comunicació espanyols, que permetés obtenir informació sobre “descriptors contractats” pels usuaris d’un portal. El primer objectiu és l’anàlisi de les necessitats que es volen cobrir per a un hipotètic client de l’aplicació, el segon és en l’àmbit algorítmic, cal obtenir una metodologia de treball que permeti l’obtenció de la notícia. En l’àmbit de la programació es consideren tres etapes: descarregar les pàgines web necessàries, que es farà mitjançant les eines que proporciona la llibreria cUrl; l’anàlisi de les notícies (obtenir tots els enllaços que corresponen a notícies, filtrar els descriptors per decidir si cal guardar la notícia, analitzar l’estructura interna de les notícies seleccionades per guardar-ne només les parts establertes), i la base de dades que ens ha de permetre organitzar i gestionar les notícies escollides

Manager: Patow, Gustavo Ariel
Other contributions: Universitat de Girona. Escola Politècnica Superior
Author: Gómez Pérez, Alejandra
Abstract: Tenint en compte l’evolució a Internet dels portals d’informació dels mitjans de comunicació, sorgeix la idea d’un motor de cerca orientat a la recaptació de notícies dispersades per les diferents pàgines web dels grans mitjans de comunicació espanyols, que permetés obtenir informació sobre “descriptors contractats” pels usuaris d’un portal. El primer objectiu és l’anàlisi de les necessitats que es volen cobrir per a un hipotètic client de l’aplicació, el segon és en l’àmbit algorítmic, cal obtenir una metodologia de treball que permeti l’obtenció de la notícia. En l’àmbit de la programació es consideren tres etapes: descarregar les pàgines web necessàries, que es farà mitjançant les eines que proporciona la llibreria cUrl; l’anàlisi de les notícies (obtenir tots els enllaços que corresponen a notícies, filtrar els descriptors per decidir si cal guardar la notícia, analitzar l’estructura interna de les notícies seleccionades per guardar-ne només les parts establertes), i la base de dades que ens ha de permetre organitzar i gestionar les notícies escollides
Document access: http://hdl.handle.net/2072/183573
Language: cat
Rights: Aquest document està subjecte a una llicència Creative Commons: Reconeixement – No comercial – Sense obra derivada (by-nc-nd)
Rights URI: http://creativecommons.org/licenses/by-nc-nd/3.0/es/deed.ca
Subject: Cercadors d’Internet
Indexació automàtica
Premsa electrònica -- Bases de dades
Web search engines
Automatic indexing
Electronic journals -- Databases
Title: ARI: Agent Recaptador d’Informació : desenvolupament d’una aplicació que reculli informació de portals web dedicats a la gestió de premsa
Type: info:eu-repo/semantics/bachelorThesis
Repository: Recercat

Subjects

Authors