Ziel dieser LVA ist die Vermittlung folgender Punkte:
- Grundlegendes Verständnis was hinter einer Suchmaschine wie Google, Bing, Lucene, Elasticsearch, etc… steht
- Wie man effizient viele Dokumente anhand einer Suchanfrage in eine Relevanz-Reihenfolge bringt und diese evaluiert
- Wie man zusätzlich zum einfachen Text weiteren Kontext für bessere Ergebnisse verwendet (z.B. PageRank für Webseiten)
- Außerdem wie man Audio und Bilder vergleicht und danach suchen kann
- Grundlagen des Information Retrieval
- Inverted Index
- Textverarbeitung: Tokenization, Stemming, etc..
- Suche mit dem Inverted Index (Dokumente nach enthaltenen Wörtern finden)
- Effiziente IO-intensive Programme (inklusive Profiler, memory access optimizations)
- Scoring und Ranking
- Relevanz Formeln
- Evaluierung von Suche
- Metriken zur IR Evaluierung: MAP, NDCG, etc...
- Websuche
- PageRank
- Musik Suche
Die Link zur online Vorlesung ist auf TUWEL.
Wir verwenden TUWEL für Termine, Slides, und die Übungsbeispiele.
ECTS Aufwand:Vorlesung: 7 Einheiten a 2h: 14hÜbungsbeispiele (#1: 40h, #2: 10h)Vorbereitung Prüfung: 10hPrüfung: 1h----------------------------------------------Summe: 75h
Zwei praktische Übungen und eine Prüfung
Gute Programmierkenntnisse einer statischen Programmiersprache