myGully.com Boerse.SH - BOERSE.AM - BOERSE.IO - BOERSE.IM Boerse.BZ .TO Nachfolger
Zurück   myGully.com > Computer & Technik > Programmierung
Seite neu laden

Suche Crawler für Amazon / Liste aller Amazonhändler

Willkommen

myGully

Links

Forum

 
 
 
Themen-Optionen Ansicht
Prev Vorheriger Beitrag   Nächster Beitrag Next
Ungelesen 04.06.17, 14:24   #3
Alex12222
Anfänger
 
Registriert seit: Mar 2010
Beiträge: 6
Bedankt: 5
Alex12222 leckt gerne myGully Deckel in der Kanalisation! | 28633460 Respekt PunkteAlex12222 leckt gerne myGully Deckel in der Kanalisation! | 28633460 Respekt PunkteAlex12222 leckt gerne myGully Deckel in der Kanalisation! | 28633460 Respekt PunkteAlex12222 leckt gerne myGully Deckel in der Kanalisation! | 28633460 Respekt PunkteAlex12222 leckt gerne myGully Deckel in der Kanalisation! | 28633460 Respekt PunkteAlex12222 leckt gerne myGully Deckel in der Kanalisation! | 28633460 Respekt PunkteAlex12222 leckt gerne myGully Deckel in der Kanalisation! | 28633460 Respekt PunkteAlex12222 leckt gerne myGully Deckel in der Kanalisation! | 28633460 Respekt PunkteAlex12222 leckt gerne myGully Deckel in der Kanalisation! | 28633460 Respekt PunkteAlex12222 leckt gerne myGully Deckel in der Kanalisation! | 28633460 Respekt PunkteAlex12222 leckt gerne myGully Deckel in der Kanalisation! | 28633460 Respekt Punkte
Standard

Hi,

hier mal ein Vorschlag umgesetzt in Ruby:
Code:
require 'open-uri'
require 'nokogiri'

qid = nil
100.times do |i|
  search_doc = Nokogiri::HTML(open(
    "https://www.startpage.com/do/search?query=host%3Aamazon.de+\"Amazon.de+Verk%C3%A4uferprofil\"&cat=web&startat=#{ i * 10 }&qid=#{ qid }"))
  qid = search_doc.css('input[name=qid]').first['value']
  search_doc.css('h3 a').
    each do |a|
      doc = Nokogiri::HTML(open(a['href'] ))
      seller_name = doc.css('#sellerName').text
      doc.css('ul.a-unordered-list.a-nostyle.a-vertical li').each do |list|
        if list.text =~ /Geschäftsadresse/
          puts "Name: #{ seller_name }, Adresse: #{ list.css('li').map { |li| li.text }.join(', ') }"
        end
      end 
    end
end
Grüße,
Alex.
Alex12222 ist offline   Mit Zitat antworten
Folgendes Mitglied bedankte sich bei Alex12222:
ducki70 (24.03.25)
 


Forumregeln
Du kannst keine neue Themen eröffnen
Du kannst keine Antworten verfassen
Du kannst keine Anhänge posten
Du kannst nicht deine Beiträge editieren

BB code is An
Smileys sind An.
[IMG] Code ist An.
HTML-Code ist Aus.

Gehe zu


Alle Zeitangaben in WEZ +1. Es ist jetzt 00:37 Uhr.


Sitemap

().