Tesi specialistica

Titolo:

"Studio di approcci statistici al problema del Question Answering in Information Retrieval".

Lo scopo di questo lavoro di tesi consiste nell'analizzare l'efficacia di approcci di recupero di tipo statistico nell'ambito di sistemi di Question Answering. Gli studi condotti sono stati testati su Vicky, l'avatar virtuale dell'INPS, sviluppato da Almaviva e presentato al Forum PA 2007 e 2008.

Per fornire risposta alle domande poste dagli utenti in linguaggio naturale Vicky utilizza una piattaforma semantica che implementa tecniche di Natural Language Processing. L'obiettivo principale della tesi è stato quello di studiare soluzioni di tipo statistico che potessero sostituire efficacemente l'approccio semantico di Vicky.

In quest'ottica sono state analizzate e applicate, nell'ambito dei modelli di Divergence From Randomness (DFR), tecniche di:
  • query expansion
  • proximity
  • studio della correlazione tra termini.
Lo studio e l'utilizzo delle ultime due tecniche è stato intrapreso per superare i limiti imposti dall'assunzione di indipendenza dei termini compiuta nei modelli bag of words recuperando così ulteriori informazioni altrimenti non disponibili.

Le soluzioni individuate sono state implementate e inserite all'interno di un prototipo valutativo basato sulla piattaforma di retrieval Terrier, sviluppata dall'università di Glasgow.

I documenti relativi alla tesi e alle slide ad essa associati sono pubblicati sotto licenza Creative Commons.
Vicky l'avatar virtuale di INPS
Slides
Documento Tesi
 
Valid XHTML 1.0!    Valid CSS!    Level Triple-A conformance icon, W3C-WAI Web Content Accessibility Guidelines 1.0    Tableless!
Angelus' World © 2007-2012. Sito realizzato da Valerio Capozio
Italiano | Inglese | Home Page | Chi sono | Ricerca | Tesi Triennale | Tesi Specialistica | Portfolio | Software | Contatti |