Find Jobs
Hire Freelancers

Content Scrapper - Aggregator

$100-500 USD

Annullato
Pubblicato circa 15 anni fa

$100-500 USD

Pagato al completamento
We are a team of engeneers, specialized in SEO consulting. The goal is to **crawl** blogs and forums and **save** their content into a database. ## Deliverables ## Going to the data A list of blogs will be given. Each will need to be crawled throught it's archives, and every article taken. Also, sometimes a search result page will be given, and you have to open the results, as new blogs to crawl. A list of forums (phpBB mostly) will be given. With a login and password. You will need to get the topics and translate them as articles. The first post in the topic is the "content", the others are the "comments". A list of usenet newsgroups will be given. You will get their messages, through google group, or a news system (NNRP access) Each first post is an article, it's answers are comments. In all cases, an article that is less that X characters long won't be downloaded. ## ## Getting data Each article in a blog will be a new row in the main table. You may also create other tables as needed. If you think a table with a row for each blog can be useful, do it. Main table fields : * id primary key auto intrement <!-- --> * title * content <- whole article, not whole web page * date of release of article * source url <- also used as UNIQUE , so if we crawl the site again, don't take the same article 2 times * tags (if any) (<- separate table?) * categories (if any) (<- separate table?) * user comments (in separate table) : nickname, date, content * images if article got any. Will be put in a dir which name is the id field. Images can be taken with system("wget ...") ## ## Technical Name of table, of class(es) to use and some downloading functions are pre-defined or will be changed. Each blog , or blog platform will be different to parse obviously. You can decide to write parsing information in a table, or in the code, as you wish.
Rif. progetto: 3777884

Info sul progetto

7 proposte
Progetto a distanza
Attivo 15 anni fa

Hai voglia di guadagnare un po'?

I vantaggi delle offerte su Freelancer

Imposta il tuo budget e le scadenze
Fatti pagare per il lavoro svolto
Delinea la tua proposta
La registrazione e le offerte sui lavori sono gratuite
7 freelance hanno fatto un'offerta media di $288 USD
Avatar dell'utente
See private message.
$382,50 USD in 20 giorni
4,9 (367 valutazioni)
7,0
7,0
Avatar dell'utente
See private message.
$425 USD in 20 giorni
4,9 (91 valutazioni)
6,1
6,1
Avatar dell'utente
See private message.
$289 USD in 20 giorni
4,9 (28 valutazioni)
4,8
4,8
Avatar dell'utente
See private message.
$408 USD in 20 giorni
4,7 (25 valutazioni)
4,5
4,5
Avatar dell'utente
See private message.
$255 USD in 20 giorni
4,9 (4 valutazioni)
3,1
3,1
Avatar dell'utente
See private message.
$170 USD in 20 giorni
0,0 (3 valutazioni)
0,0
0,0
Avatar dell'utente
See private message.
$85 USD in 20 giorni
0,0 (0 valutazioni)
0,0
0,0

Info sul cliente

Bandiera: BULGARIA
SOFIA, Bulgaria
5,0
5
Membro dal gen 17, 2008

Verifica del cliente

Grazie! Ti abbiamo inviato tramite email il link per richiedere il tuo bonus gratuito.
Non è stato possibile inviarti l'email. Riprova per piacere.
di utenti registrati di lavori pubblicati
Freelancer ® is a registered Trademark of Freelancer Technology Pty Limited (ACN 142 189 759)
Copyright © 2024 Freelancer Technology Pty Limited (ACN 142 189 759)
Caricamento anteprima
Autorizzazione per la geolocalizzazione concessa.
La tua sessione è scaduta ed è stato effettuato il log out. Accedi nuovamente per piacere.