User Tools

Site Tools


softwareprojekt08:student:meeting081120

Anwesenheit: alle
Topic: Input/Output-Komponenten beim crawling

Bis Jetzt:
* Google News Seite crawling funktioniert
* Text aus HTML-Code extrahieren und in DB speichern
* Häufigkeit am Tag dass einzelner Artikel gecrawlt wurde
* In python neben Code dokumentieren

To-Do bis nächsten Donnerstag:
* In python neben Code dokumentieren
* Templates in Django bauen
* Funktionierende Web-Applikationen zeigen
* Methode testen (um beispielweise Ergebnis aus news article zu vergleichen)
* Einbindung von Webinterfaces
* Diagramm zeigen (Z.B: im Cluster_List die Anzhal der relationalen Artikeln zum bestimmten Cluster)

Next Meeting 27.11.2008 um 15 Uhr

softwareprojekt08/student/meeting081120.txt · Last modified: 2008/11/21 16:42 (external edit)