Course No:
188977
Course Type:
VU
Term:
2019W
Weekly Hours:
2.0
Lecturer:
Allan Hanbury
Sebastian Hofstätter
Language:
German
Course Link:
Objective:
Ziel dieser LVA ist die Vermittlung folgender Punkte:
- Grundlegendes Verständnis was hinter einer Suchmaschine wie Google, Bing, Lucene, Elasticsearch, etc… steht
- Wie man effizient viele Dokumente anhand einer Suchanfrage in eine Relevanz-Reihenfolge bringt und diese evaluiert
- Wie man zusätzlich zum einfachen Text weiteren Kontext für bessere Ergebnisse verwendet (z.B. PageRank für Webseiten)
- Außerdem wie man Audio und Bilder vergleicht und danach suchen kann
Content:
- Grundlagen des Information Retrieval
- Inverted Index
- Textverarbeitung: Tokenization, Stemming, etc..
- Suche mit dem Inverted Index (Dokumente nach enthaltenen Wörtern finden)
- Effiziente IO-intensive Programme (inklusive Profiler, memory access optimizations)
- Scoring und Ranking
- Relevanz Formeln
- Evaluierung von Suche
- Metriken zur IR Evaluierung: MAP, NDCG, etc...
- Websuche
- PageRank
- Bild und Musik Suche
Information:
Wir verwenden TUWEL für Termine, Slides, und die Übungsbeispiele.
Notes:
Examination:
Zwei praktische Übungen und eine Prüfung
Recommendation:
Gute Programmierkenntnisse einer statischen Programmiersprache