myGully.com Boerse.SH - BOERSE.AM - BOERSE.IO - BOERSE.IM Boerse.BZ .TO Nachfolger
Zurück   myGully.com > Computer & Technik > Programmierung
Seite neu laden

Suche Crawler für Amazon / Liste aller Amazonhändler

Willkommen

myGully

Links

Forum

 
Antwort
 
Themen-Optionen Ansicht
Ungelesen 04.06.17, 14:24   #1
Alex12222
Anfänger
 
Registriert seit: Mar 2010
Beiträge: 6
Bedankt: 5
Alex12222 leckt gerne myGully Deckel in der Kanalisation! | 28633460 Respekt PunkteAlex12222 leckt gerne myGully Deckel in der Kanalisation! | 28633460 Respekt PunkteAlex12222 leckt gerne myGully Deckel in der Kanalisation! | 28633460 Respekt PunkteAlex12222 leckt gerne myGully Deckel in der Kanalisation! | 28633460 Respekt PunkteAlex12222 leckt gerne myGully Deckel in der Kanalisation! | 28633460 Respekt PunkteAlex12222 leckt gerne myGully Deckel in der Kanalisation! | 28633460 Respekt PunkteAlex12222 leckt gerne myGully Deckel in der Kanalisation! | 28633460 Respekt PunkteAlex12222 leckt gerne myGully Deckel in der Kanalisation! | 28633460 Respekt PunkteAlex12222 leckt gerne myGully Deckel in der Kanalisation! | 28633460 Respekt PunkteAlex12222 leckt gerne myGully Deckel in der Kanalisation! | 28633460 Respekt PunkteAlex12222 leckt gerne myGully Deckel in der Kanalisation! | 28633460 Respekt Punkte
Standard

Hi,

hier mal ein Vorschlag umgesetzt in Ruby:
Code:
require 'open-uri'
require 'nokogiri'

qid = nil
100.times do |i|
  search_doc = Nokogiri::HTML(open(
    "https://www.startpage.com/do/search?query=host%3Aamazon.de+\"Amazon.de+Verk%C3%A4uferprofil\"&cat=web&startat=#{ i * 10 }&qid=#{ qid }"))
  qid = search_doc.css('input[name=qid]').first['value']
  search_doc.css('h3 a').
    each do |a|
      doc = Nokogiri::HTML(open(a['href'] ))
      seller_name = doc.css('#sellerName').text
      doc.css('ul.a-unordered-list.a-nostyle.a-vertical li').each do |list|
        if list.text =~ /Geschäftsadresse/
          puts "Name: #{ seller_name }, Adresse: #{ list.css('li').map { |li| li.text }.join(', ') }"
        end
      end 
    end
end
Grüße,
Alex.
Alex12222 ist offline   Mit Zitat antworten
Folgendes Mitglied bedankte sich bei Alex12222:
ducki70 (24.03.25)
Ungelesen 24.03.25, 22:15   #2
ducki70
Anfänger
 
Benutzerbild von ducki70
 
Registriert seit: Nov 2010
Beiträge: 5
Bedankt: 3
ducki70 ist noch neu hier! | 0 Respekt Punkte
Standard

Zitat:
Zitat von Alex12222 Beitrag anzeigen
Hi,

hier mal ein Vorschlag umgesetzt in Ruby:
Code:
require 'open-uri'
require 'nokogiri'

qid = nil
100.times do |i|
  search_doc = Nokogiri::HTML(open(
    "https://www.startpage.com/do/search?query=host%3Aamazon.de+\"Amazon.de+Verk%C3%A4uferprofil\"&cat=web&startat=#{ i * 10 }&qid=#{ qid }"))
  qid = search_doc.css('input[name=qid]').first['value']
  search_doc.css('h3 a').
    each do |a|
      doc = Nokogiri::HTML(open(a['href'] ))
      seller_name = doc.css('#sellerName').text
      doc.css('ul.a-unordered-list.a-nostyle.a-vertical li').each do |list|
        if list.text =~ /Geschäftsadresse/
          puts "Name: #{ seller_name }, Adresse: #{ list.css('li').map { |li| li.text }.join(', ') }"
        end
      end 
    end
end
Grüße,
Alex.
.... wie m?sste das Scipt, denn ausschauen wenn ich diese Daten alle "auslesen" wollen w?rde:

Code:
[ Link nur für registrierte Mitglieder sichtbar. Bitte einloggen oder neu registrieren ][adults]=2&pax[children]=0&pax[juveniles]=0&region=&ship=&ta=&to=
PS: Das AMAZON Skript hatte ich versucht mal hier zu starten: ttps://www.jdoodle.com/execute-ruby-online ...

Leider ohne Erfolg .... bin komplett neu in der Materie und w?rde mich da gerne mal rantasten. Danke Dir.
ducki70 ist offline   Mit Zitat antworten
Antwort


Forumregeln
Du kannst keine neue Themen eröffnen
Du kannst keine Antworten verfassen
Du kannst keine Anhänge posten
Du kannst nicht deine Beiträge editieren

BB code is An
Smileys sind An.
[IMG] Code ist An.
HTML-Code ist Aus.

Gehe zu


Alle Zeitangaben in WEZ +1. Es ist jetzt 09:30 Uhr.


Sitemap

().