Grundlagen des Information Retrieval

Submitted by webmaster on Fri, 10/22/2021 - 14:48
Course No: 
188977
Course Type: 
VU
Term: 
2021W
Weekly Hours: 
2.0
Lecturer: 
Markus Zlabinger
Allan Hanbury
Language: 
German
Objective: 

Ziel dieser LVA ist die Vermittlung folgender Punkte:

  • Grundlegendes Verständnis was hinter einer Suchmaschine wie Google, Bing, Lucene, Elasticsearch, etc… steht
  • Wie man effizient viele Dokumente anhand einer Suchanfrage in eine Relevanz-Reihenfolge bringt und diese evaluiert
  • Wie man zusätzlich zum einfachen Text weiteren Kontext für bessere Ergebnisse verwendet (z.B. PageRank für Webseiten)
  • Außerdem wie man Audio und Bilder vergleicht und danach suchen kann
Content: 
  • Grundlagen des Information Retrieval
    • Inverted Index
    • Textverarbeitung: Tokenization, Stemming, etc..
    • Suche mit dem Inverted Index (Dokumente nach enthaltenen Wörtern finden)
  • Effiziente IO-intensive Programme (inklusive Profiler, memory access optimizations)
  • Scoring und Ranking
    • Relevanz Formeln
  • Evaluierung von Suche
    • Metriken zur IR Evaluierung: MAP, NDCG, etc...
  • Websuche
    • PageRank
  • Musik Suche
Information: 

Die Link zur online Vorlesung ist auf TUWEL.
Wir verwenden TUWEL für Termine, Slides, und die Übungsbeispiele.
 
ECTS Aufwand:Vorlesung: 7 Einheiten a 2h: 14hÜbungsbeispiele (#1: 40h, #2: 10h)Vorbereitung Prüfung: 10hPrüfung: 1h----------------------------------------------Summe: 75h

Notes: 
Examination: 

Zwei praktische Übungen und eine Prüfung

Recommendation: 

Gute Programmierkenntnisse einer statischen Programmiersprache