Deutsch Intern
    Chair of Computer Science VI - Artificial Intelligence and Applied Computer Science

    Ausgewählte Themen des Web 2.0: Mining Massive Datasets

    Seminar

    (0808565)

    Die Entstehung der Web 2.0 Applikationen haben dazu beigetragen, dass immer mehr
    Nutzerdaten im Internet gesammelt und für verschiedene Data-Mining Anwendungen
    (Empfehlungen, Ranking, Werbung) verwendet werden können. Die massiven Daten, die trotz
    steigender Speicherleistungen teilweise nicht in den Hauptspeicher passen, stellen neue
    Herausforderungen an Data-Mining Algorithmen, die fortschrittlich Web 2.0 Anwendungen
    ermöglichen, dar. In diesem Seminar sollen diese Herausforderungen diskutiert werden: Von
    der Map-Reduce Technologie über eine effiziente Verarbeitung von Datenströmen bis zu
    spezifischen Algorithmen für Empfehlungen oder Werbung können verschiedene Themen
    rund um "Massive Dataset-Mining" gewählt werden.

    Veranstalter:

    Prof. Dr. Andreas Hotho, Wi.-Inf. Beate Navarro Bullock

    Vorbesprechung/Einstieg:

    Freitag, 06.05.2011 um 14 Uhr im Raum B015

    Leistungsnachweis:

    Drei (3!) Tage vor dem geplanten Vortrag sind per Email als PDF abzugeben:

    eine einseitige Zusammenfassung (die allen Teilnehmern ausgehändigt wird), der Foliensatz eine 11-12-seitige Ausarbeitung im unter http://www.springer.com/computer/lncs?SGWID=0-164-6-793341-0 beschriebenen Format. Die Vorlage für LaTeX findet sich hier, die Vorlage für Word ist hier.

    Die einseitige Zusammenfassung wird von dem Betreuer drei Tage vor dem Seminarvortrag an alle Teilnehmer gesendet, so dass sich die Teilnehmer auf die vorgetragenen Themen einstellen können. 

    Vorherige Absprachen mit dem Betreuer sind ausdrücklich erlaubt. Alle verwendeten Referenzen sind zusätzlich zum Literaturverzeichnis der Ausarbeitung in www.bibsonomy.org einzugeben, mit den Tags "massive-datamining", "seminar", "2011" und weiteren sinnvollen Tags.

    Die Vortragsdauer beträgt verbindlich 30 Minuten, nach dem Vortrag besteht Gelegenheit zur Diskussion. Wir empfehlen, den Vortrag vorher vor Zuhörern zu üben. Der Vortrag (inkl. Folien und Abstract) geht mit 40% in die Endnote ein, die Ausarbeitung ebenfalls mit 40%. Die letzten 20% bewerten die Eigenständigkeit der Ausarbeitung, Einhaltung von Terminen, Beteiligung am Seminar etc.

    Ablauf des Seminars 

    Gefordert ist eine wissenschaftliche Auseinandersetzung mit dem Thema, die insbesondere den Bezug auf Originalliteratur einschliesst. Diese kann ggf. durch graue Literatur ergänzt, jedoch keinesfalls ersetzt werden. Es wird zu Beginn pro Thema jeweils ein Teilbereich (Kapitel) aus den unter Literatur zitierten Grundlagenbüchern ausgegeben. Dieser bildet die Grundlage. Zusätzlich soll der Seminarteilnehmer aktuelle Literatur zu Netzwerken des Web 2.0 recherchieren, in denen Ergebnisse zur Grundlagenthematik vorgestellt werden. Diese Auswahl der weiteren Literatur trifft der Seminarteilnehmer in Absprache mit dem Betreuer.

    Termine

    Die Veranstaltungstermine (Blockseminar) werden in der Vorbesprechung diskutiert. Bei den Terminen stellen die Teilnehmer ihre Ausarbeitungen vor. Es besteht Anwesenheitspflicht.

    Bearbeitungshinweise

    Als Richtlinie für die Erstellung einer guten Seminararbeit (inkl. Vortrag und Ausarbeitung) wird das Buch

    Markus Deininger and Horst Lichter and Jochen Ludewig and Kurt Schneider. Studien-Arbeiten: ein Leitfaden zur Vorbereitung, Durchführung und Betreuung von Studien-, Diplom- Abschluss- und Doktorarbeiten am Beispiel Informatik. 5. Auflage. vdf Hochschulverlag, Zürich, 2005. 

    empfohlen, welches beim Betreuer des Seminars (Prof. Dr. Andreas Hotho) ausliegt. Wir empfehlen die Anschaffung dieses Buchs (9,50 €), da es Sie bis zur Masterarbeit (und weiter) begleiten kann. Die Benotung der Seminararbeit erfolgt in Anlehnung an das dort auf Seite 77 angegebene Schema, angepasst auf die Erfordernisse einer Seminararbeit.

    Literatur

    Folgene Bücher dienen als Grundlage für das Seminar:

     

    Anand Rajaraman, Jeff Ullman: Mining of Massive Datasets, 2010. Online available.

     

     

    James Abello, Panos M. Pardalos, and Mauricio G. C. Resende (Eds.). 
    2002. Handbook of Massive Data Sets. Kluwer Academic Publishers, Norwell, MA, USA.

     

    Es ist möglich, sich während der Semesterferien bei Prof. Dr. Andreas Hotho oder Wi.-Inf. Beate Navarro zu melden, um ggf. nachträglich in das Seminar einzusteigen und dabei die Semesterferien noch zu nutzen.

    Contact

    Lehrstuhl für Informatik VI (Künstliche Intelligenz und angewandte Informatik)
    Am Hubland
    97074 Würzburg

    Phone: +49 931 31-86731
    Email

    Find Contact

    Hubland Süd, Geb. M2