myGully.com Boerse.SH - BOERSE.AM - BOERSE.IO - BOERSE.IM Boerse.BZ .TO Nachfolger
Zurück   myGully.com > Computer & Technik > Programmierung
Seite neu laden

Suche Crawler für Amazon / Liste aller Amazonhändler

Antwort
Themen-Optionen Ansicht
Ungelesen 25.05.17, 09:49   #1
jamalschauen
Anfänger
 
Registriert seit: May 2017
Beiträge: 1
Bedankt: 0
jamalschauen ist noch neu hier! | 3 Respekt Punkte
Standard Suche Crawler für Amazon / Liste aller Amazonhändler

Hallo,

ich brauche die Mail Adressen aller Amazon Marktplatzhändler. Diese kann man sich beispielsweise einfach per Hand einfach aus den kompletten, öffentlich zugänglichen Listen herauskopieren. Da dies aber aufgrund der unglaublichen Masse sehr umständlich ist, würde ich das ganze gern automatisiert ablaufen lassen.

Meine frage ist ob hier evtl. jemand schonmal einen derartigen Crawler geschrieben hat, oder evtl. auch einfach eine Liste mit den Händlern inkl. Mailadressen besitzt und gegen eine Entlohnung zur Verfügung stellen würde.

Bei Interesse bitte ich um Kontaktaufnahme per eine PN.

LG
jamalschauen ist offline   Mit Zitat antworten
Ungelesen 30.05.17, 11:08   #2
Osiris1983
Chuck Norris
 
Benutzerbild von Osiris1983
 
Registriert seit: Jun 2010
Ort: /users/osiris
Beiträge: 3.703
Bedankt: 4.281
Osiris1983 leckt gerne myGully Deckel in der Kanalisation! | 1139965 Respekt PunkteOsiris1983 leckt gerne myGully Deckel in der Kanalisation! | 1139965 Respekt PunkteOsiris1983 leckt gerne myGully Deckel in der Kanalisation! | 1139965 Respekt PunkteOsiris1983 leckt gerne myGully Deckel in der Kanalisation! | 1139965 Respekt PunkteOsiris1983 leckt gerne myGully Deckel in der Kanalisation! | 1139965 Respekt PunkteOsiris1983 leckt gerne myGully Deckel in der Kanalisation! | 1139965 Respekt PunkteOsiris1983 leckt gerne myGully Deckel in der Kanalisation! | 1139965 Respekt PunkteOsiris1983 leckt gerne myGully Deckel in der Kanalisation! | 1139965 Respekt PunkteOsiris1983 leckt gerne myGully Deckel in der Kanalisation! | 1139965 Respekt PunkteOsiris1983 leckt gerne myGully Deckel in der Kanalisation! | 1139965 Respekt PunkteOsiris1983 leckt gerne myGully Deckel in der Kanalisation! | 1139965 Respekt Punkte
Standard

Wüsste gerne was du damit vorhast
__________________


Bitte keine Supportanfragen per PN! Dafür ist das Forum doch da.

[ Link nur für registrierte Mitglieder sichtbar. Bitte einloggen oder neu registrieren ]|[ Link nur für registrierte Mitglieder sichtbar. Bitte einloggen oder neu registrieren ]|[ Link nur für registrierte Mitglieder sichtbar. Bitte einloggen oder neu registrieren ][ Link nur für registrierte Mitglieder sichtbar. Bitte einloggen oder neu registrieren ]

Osiris1983 ist offline   Mit Zitat antworten
Ungelesen 04.06.17, 14:24   #3
Alex12222
Anfänger
 
Registriert seit: Mar 2010
Beiträge: 6
Bedankt: 4
Alex12222 leckt gerne myGully Deckel in der Kanalisation! | 28633460 Respekt PunkteAlex12222 leckt gerne myGully Deckel in der Kanalisation! | 28633460 Respekt PunkteAlex12222 leckt gerne myGully Deckel in der Kanalisation! | 28633460 Respekt PunkteAlex12222 leckt gerne myGully Deckel in der Kanalisation! | 28633460 Respekt PunkteAlex12222 leckt gerne myGully Deckel in der Kanalisation! | 28633460 Respekt PunkteAlex12222 leckt gerne myGully Deckel in der Kanalisation! | 28633460 Respekt PunkteAlex12222 leckt gerne myGully Deckel in der Kanalisation! | 28633460 Respekt PunkteAlex12222 leckt gerne myGully Deckel in der Kanalisation! | 28633460 Respekt PunkteAlex12222 leckt gerne myGully Deckel in der Kanalisation! | 28633460 Respekt PunkteAlex12222 leckt gerne myGully Deckel in der Kanalisation! | 28633460 Respekt PunkteAlex12222 leckt gerne myGully Deckel in der Kanalisation! | 28633460 Respekt Punkte
Standard

Hi,

hier mal ein Vorschlag umgesetzt in Ruby:
Code:
require 'open-uri'
require 'nokogiri'

qid = nil
100.times do |i|
  search_doc = Nokogiri::HTML(open(
    "https://www.startpage.com/do/search?query=host%3Aamazon.de+\"Amazon.de+Verk%C3%A4uferprofil\"&cat=web&startat=#{ i * 10 }&qid=#{ qid }"))
  qid = search_doc.css('input[name=qid]').first['value']
  search_doc.css('h3 a').
    each do |a|
      doc = Nokogiri::HTML(open(a['href'] ))
      seller_name = doc.css('#sellerName').text
      doc.css('ul.a-unordered-list.a-nostyle.a-vertical li').each do |list|
        if list.text =~ /Geschäftsadresse/
          puts "Name: #{ seller_name }, Adresse: #{ list.css('li').map { |li| li.text }.join(', ') }"
        end
      end 
    end
end
Grüße,
Alex.
Alex12222 ist offline   Mit Zitat antworten
Antwort

Themen-Optionen
Ansicht

Forumregeln
Du kannst keine neue Themen eröffnen
Du kannst keine Antworten verfassen
Du kannst keine Anhänge posten
Du kannst nicht deine Beiträge editieren

BB code is An
Smileys sind An.
[IMG] Code ist An.
HTML-Code ist Aus.

Gehe zu


Alle Zeitangaben in WEZ +1. Es ist jetzt 05:09 Uhr.


Sitemap

().