Torun Ünver

Web Crawler Methodik. Breitensuche in Python mit Scrapy Framework

1. Auflage.
kartoniert , 36 Seiten
ISBN 3668275300
EAN 9783668275300
Veröffentlicht August 2016
Verlag/Hersteller GRIN Verlag
Leseprobe öffnen

Auch erhältlich als:

pdf eBook
15,99
17,95 inkl. MwSt.
Mit click & collect abholbar: - in 4-6 Werktagen in der Buchhandlung
Lieferbar innerhalb von 3-5 Tagen (Versand mit Deutscher Post/DHL)
Teilen
Beschreibung

Projektarbeit aus dem Jahr 2016 im Fachbereich Informatik - Programmierung, Note: 1, Hochschule Darmstadt (Fachbereich Media), Veranstaltung: Informationswissenschaftliches Kolloquium, Sprache: Deutsch, Abstract: Python ist eine sehr effiziente und einflussreiche Programmiersprache. In diesem Buch geht es um die Durchsuchung des World Wide Web. Kann man mit der Programmiersprache Python Linkquellen aus unterschiedlichen Webseiten analysieren? Mithilfe von Python, einem Python-Framework namens Scrapy und einer Datenbank namens MongoDB wird in diesem Buch der Versuch gestartet, Linkquellen zu untersuchen. Untersuchte Linkquellen sollen zunächst in einer Datenbank abgelegt werden und sobald der erste Durchlauf vollendet ist, soll der Crawler die nächste gespeicherte Linkquelle aus der Datenbank entnehmen und diese Linkquelle nach weiteren Linkquellen untersuchen.
Dabei ist es wichtig, dass bei den gespeicherten Linkquellen keine Duplikate enthalten sind und die bereits untersuchten Webseiten nicht erneut untersucht werden. Kann man mit Python als Programmiersprache einfach und schnell eine hohe Anzahl an Linkquellen unterschiedlicher Webseiten aufspüren?
Zuerst tauchen wir gemeinsam in die Theorie der beiden Suchalgorithmen: Breiten- und Tiefensuche. Im Anschluss wird auf Konzeption, Voraussetzungen und Installation eingegangen, die man für einen solchen Versuch braucht.

Hersteller
GRIN Verlag

-

E-Mail: info@bod.de

Das könnte Sie auch interessieren

Harald Zisler
Computer-Netzwerke
epub eBook
Download
29,90
Michael Kofler
Linux
epub eBook
Download
49,90
Download
21,99
Dirk Becker
Einstieg in Linux Mint 22
epub eBook
Download
29,90
Download
25,99
Andreas Eschbach
Hide*Out
epub eBook
Download
7,99
Gernot Starke
Software-Architektur kompakt
pdf eBook
Download
8,98
Paul Wilmott
Wie funktioniert eigentlich KI?
epub eBook
Download
13,52
Petra van Laak
Einfach klar!
epub eBook
Download
24,90

 

Rechte Egoshooter
epub eBook
Download
4,99