Witaj gościu! Zaloguj się lub Zarejestruj aby móc korzystać ze wszystkich funkcjonalności jakie oferuje to forum! Rozpocznij zarabianie przez internet, poznaj korzysci pracy w domu! Rejestracja i korzystanie z forum jest całkowicie darmowe!
Polska społeczność o zarabianiu przez internet, pracy w domu i dodatkowej pracy online
Zobacz dzisiejsze dyskusje →
[POMOCY] C# Scrapowanie z wielu stron jednocześnie
Sprawdź:
Cześć,
Szukam sposobu na wydobycie pewnych danych z wielu stron na raz. Na każdej stronie potrzebne dane są z tych samych wyrażeń XPATH. Używam HtmlAgilityPack.
Jakieś propozycje?
Dodam, że tych stron będzie koło 500 i baza będzie się zwiększać więc ręczne wpisywanie adresów odpada (odczytywanie adresów z pliku txt lub xls lub bezpośrednio z richTextBox'a będzie spoko).
Może jakieś wykonywanie skryptu w pętli ze zmianą adresu? Jak to zadeklarować?
(Ten post był ostatnio modyfikowany: 06-05-2017 21:55 przez Ando.)
if (request is HttpWebRequest)
{
(request as HttpWebRequest).CookieContainer = cookie;
//(request as HttpWebRequest).AllowAutoRedirect = false;
}
return request;
}
}
}
Potem
Kod:
NetConnection connect = new NetConnection();
connect.DownloadString("adres");
Przecież on nic nie pisał o tym, że ciasteczka muszą też być zaktualizowane..
To jest cały kod potrzebny do zrobienia tego, co zrobić chce autor. Jeśli faktycznie żeby scrapować musi być gdzieś zalogowany, lub aktualizować ciasteczka to można wykorzystać proste biblioteki np. RestSharp.
Kod:
HtmlWeb web = new HtmlWeb();
HtmlDocument doc = new HtmlDocument();
string[] urls = File.ReadAllLines("linki.txt");
string xPath = "//input[@type='foo']";