Web Crawler Methodik. Breitensuche in Python mit Scrapy Framework - Torun Ünver

Torun Ünver

Web Crawler Methodik. Breitensuche in Python mit Scrapy Framework

1. Auflage. Dateigröße in KByte: 827.
pdf eBook , 31 Seiten
ISBN 3668275297
EAN 9783668275294
Veröffentlicht August 2016
Verlag/Hersteller GRIN Verlag

Auch erhältlich als:

Taschenbuch
17,95
15,99 inkl. MwSt.
Sofort Lieferbar (Download)
Teilen
Beschreibung

Projektarbeit aus dem Jahr 2016 im Fachbereich Informatik - Programmierung, Note: 1, Hochschule Darmstadt (Fachbereich Media), Veranstaltung: Informationswissenschaftliches Kolloquium, Sprache: Deutsch, Abstract: Python ist eine sehr effiziente und einflussreiche Programmiersprache. In diesem Buch geht es um die Durchsuchung des World Wide Web. Kann man mit der Programmiersprache Python Linkquellen aus unterschiedlichen Webseiten analysieren? Mithilfe von Python, einem Python-Framework namens Scrapy und einer Datenbank namens MongoDB wird in diesem Buch der Versuch gestartet, Linkquellen zu untersuchen. Untersuchte Linkquellen sollen zunächst in einer Datenbank abgelegt werden und sobald der erste Durchlauf vollendet ist, soll der Crawler die nächste gespeicherte Linkquelle aus der Datenbank entnehmen und diese Linkquelle nach weiteren Linkquellen untersuchen.
Dabei ist es wichtig, dass bei den gespeicherten Linkquellen keine Duplikate enthalten sind und die bereits untersuchten Webseiten nicht erneut untersucht werden. Kann man mit Python als Programmiersprache einfach und schnell eine hohe Anzahl an Linkquellen unterschiedlicher Webseiten aufspüren?
Zuerst tauchen wir gemeinsam in die Theorie der beiden Suchalgorithmen: Breiten- und Tiefensuche. Im Anschluss wird auf Konzeption, Voraussetzungen und Installation eingegangen, die man für einen solchen Versuch braucht.

Technik
Sie können dieses eBook zum Beispiel mit den folgenden Geräten lesen:
• tolino Reader 
Laden Sie das eBook direkt über den Reader-Shop auf dem tolino herunter oder übertragen Sie das eBook auf Ihren tolino mit einer kostenlosen Software wie beispielsweise Adobe Digital Editions. 
• Sony Reader & andere eBook Reader 
Laden Sie das eBook direkt über den Reader-Shop herunter oder übertragen Sie das eBook mit der kostenlosen Software Sony READER FOR PC/Mac oder Adobe Digital Editions auf ein Standard-Lesegeräte. 
• Tablets & Smartphones 
Möchten Sie dieses eBook auf Ihrem Smartphone oder Tablet lesen, finden Sie hier unsere kostenlose Lese-App für iPhone/iPad und Android Smartphone/Tablets. 
• PC & Mac 
Lesen Sie das eBook direkt nach dem Herunterladen mit einer kostenlosen Lesesoftware, beispielsweise Adobe Digital Editions, Sony READER FOR PC/Mac oder direkt über Ihre eBook-Bibliothek in Ihrem Konto unter „Meine eBooks“ -  „online lesen“.
 
Bitte beachten Sie, dass die Kindle-Geräte das Format nicht unterstützen und dieses eBook somit nicht auf Kindle-Geräten lesbar ist.
Hersteller
GRIN Verlag
Trappentreustraße 1

DE - 80339 München

E-Mail: support@openpublishing.com

Das könnte Sie auch interessieren

Harald Zisler
Computer-Netzwerke
epub eBook
Download
29,90
Michael Kofler
Linux
epub eBook
Download
49,90
Download
21,99
Dirk Becker
Einstieg in Linux Mint 22
epub eBook
Download
29,90
Download
25,99
Andreas Eschbach
Hide*Out
epub eBook
Download
7,99
Gernot Starke
Software-Architektur kompakt
pdf eBook
Download
8,98
Paul Wilmott
Wie funktioniert eigentlich KI?
epub eBook
Download
13,52
Petra van Laak
Einfach klar!
epub eBook
Download
24,90

 

Rechte Egoshooter
epub eBook
Download
4,99