Distributed web page scraper (preferably on EC2)

Lukket Opslået Aug 26, 2010 Betalt ved levering

$100-300 USD

Betalt ved levering

Lukket Betalt ved levering

As input to your script, I have a list of about 1M URLs. I want these URLs scraped, and inserted into a database. You do NOT need to recursively crawl the URLs. You just need to retrieve them.

I want a distributed scraper. In particular, I want to give a parameter N, and have the script automatically provision N scrapers, maybe N different Amazon EC2 instances, or some other cloud service. The N instances should avoid doing the same work.

I don't care you write a wrapper script around Scrapy, or another existing web scraper implementation. You can do this if you already know Scrapy or Bixo and want to use it.

The script should really require very little configuration. It should be convenient and one-click if possible. That way, the next time I have a batch of 1M URLs, I can easily run your script.

Amazon Web Services Ingeniørarbejde Java Linux Projekt Ledelse Python Script Installering Shell Script Software Arkitektur Software Testning

Projekt ID: #3680209

Om projektet

13 bud Remote projekt Aktiv Dec 16, 2010

Ønsker du at tjene nogle penge?

Fordele ved at byde på Freelancer

Bestem dit budget og din tidsramme

Bliv betalt for dit arbejde

Beskriv dit forslag

Det er gratis et tilmelde sig og byde på jobs

13 freelancere byder i gennemsnit $217 timen for dette job

ddemidenko

See private message.

$255 USD in 14 dage

(72 bedømmelser)

6.1

johnweavervw

See private message.

$170 USD in 14 dage

(55 bedømmelser)

5.3

mlys

See private message.

$254.15 USD in 14 dage

(31 bedømmelser)

5.4

happytron

See private message.

$212.5 USD in 14 dage

(9 bedømmelser)

4.8

happydotnet

See private message.

$235.45 USD in 14 dage

(17 bedømmelser)

4.3

app2technologies

See private message.

$255 USD in 14 dage

(16 bedømmelser)

3.9

readyfacts

See private message.

$212.5 USD in 14 dage

(32 bedømmelser)

4.2

kwovw

See private message.

$254.15 USD in 14 dage

(2 bedømmelser)

3.9

quintonwebz

See private message.

$204 USD in 14 dage

(6 bedømmelser)

3.6

napoleonmr

See private message.

$255 USD in 14 dage

(2 bedømmelser)

2.8

richmondcd

See private message.

$127.5 USD in 14 dage

(2 bedømmelser)

0.7

woolee

See private message.

$170 USD in 14 dage

(0 bedømmelser)

0.0

bryano

See private message.

$212.5 USD in 14 dage

(0 bedømmelser)

0.0

Slå et lignende projekt op

Distributed web page scraper (preferably on EC2)

Om projektet

Ønsker du at tjene nogle penge?

Fordele ved at byde på Freelancer

13 freelancere byder i gennemsnit $217 timen for dette job

Freelancer

Om

Vilkår

App's