Publikation: xCrawl: a high-recall crawling method f...
Stammdaten
Titel: | xCrawl: a high-recall crawling method for Web mining |
Untertitel: | |
Kurzfassung: | Web mining systems exploit the redundancy of data published on the Web to automatically extract information from existing Web documents. The first step in the Information Extraction process is thus to locate as many Web pages as possible that contain relevant information within a limited period of time, a task which is commonly accomplished by applying focused crawling techniques. The performance of such a crawler can be measured by its “recall”, i.e., the percentage of documents found and identified as relevant compared to the total number of existing documents. In this paper, we propose xCrawl, a new focused crawling method which outperforms state-of-the-art approaches with respect to the recall values achievable within a given period of time. This method is based on a new combination of ideas and techniques used to identify and exploit the navigational structures of Web sites, such as hierarchies, lists, or maps. |
Schlagworte: |
Publikationstyp: | Beitrag in Zeitschrift (Autorenschaft) |
Erscheinungsdatum: | 11.2010 (Print) |
Erschienen in: |
Journal Knowledge and Information Systems
Journal Knowledge and Information Systems
(
Springer Verlag GmbH;
)
zur Publikation |
Titel der Serie: | - |
Bandnummer: | - |
Heftnummer: | - |
Erstveröffentlichung: | Ja |
Seite: | S. 303 - 326 |
Versionen
Keine Version vorhanden |
Erscheinungsdatum: | 11.2010 |
ISBN: | - |
ISSN: | 0219-1377 |
Homepage: | - |
AutorInnen
K. Shchekotykhin
Keine Daten vorhanden
*
|
D. Jannach
Keine Daten vorhanden
*
|
G. Friedrich
Keine Daten vorhanden
*
|
Dietmar Jannach (intern) |
Gerhard Friedrich (intern) |
Kostyantyn Shchekotykhin (intern) |
Zuordnung
Organisation | Adresse | ||||
---|---|---|---|---|---|
Fakultät für Technische Wissenschaften
Institut für Artificial Intelligence und Cybersecurity
|
AT - A-9020 Klagenfurt |
Kategorisierung
Sachgebiete | |
Forschungscluster | Kein Forschungscluster ausgewählt |
Zitationsindex |
Informationen zum Zitationsindex: Master Journal List
|
Peer Reviewed |
|
Publikationsfokus |
Klassifikationsraster der zugeordneten Organisationseinheiten:
|
Arbeitsgruppen | Keine Arbeitsgruppe ausgewählt |
Kooperationen
Keine Partnerorganisation ausgewählt
Forschungsaktivitäten
Hier werden alle mit dieser Publikation in Zusammenhang stehenden Forschungsaktivitäten angezeigt. Mit dem untenstehenden Link können sie sich diese Forschungsaktivitäten in der Suche anzeigen lassen und gegebenenfalls exportieren.
(Achtung: Externe Aktivitäten werden im Suchergebnis nicht mitangezeigt)
Zugehörige Forschungsaktivitäten in der Suche anzeigen
(Achtung: Externe Aktivitäten werden im Suchergebnis nicht mitangezeigt)
Projekte: | Keine verknüpften Projekte vorhanden |
Publikationen: | Keine verknüpften Publikationen vorhanden |
Veranstaltungen: | Keine verknüpften Veranstaltung vorhanden |
Vorträge: | Keine verknüpften Vorträge vorhanden |
Beiträge der Publikation
Keine verknüpften Publikationen vorhanden