Posts tagged with “SCRAPING

15. 07. 2012

fap x 2

Poslední dny jsem trošku máknul na dvou zombie, který se mi valej na disku a o kterejch si myslim, že by se někomu mohly i hodit. VIRBL

Emery

Hloupoučká knihovna na takovýto základní domácí scrapování — příklady a zdroják na GitHubu. Je to jen takovej lehkej obal nad pyquery, lxml a tablib.

Webmentpyne

Jednoduchý webový rozhraní pro přehrávače podporujicí MPRIS2 — testoval jsem to zatim jen na Clementine a Rhythmboxu, ale nebude problem zřejmě ani s Amarokem, Banshee apod.

Zdroják taky na GitHubu.

webmentpyne

Pull requesty nebo feature requesty vítaný. KTHXBYE

no comments yet
07. 08. 2011

pyquery

Co používáte na takovýto domácí scrapovaní (nebo screapování)? Jasně, každej zná lxml nebo BeautifulSoup. BeautifulSoup je vůbec super, pokud potřebujete třeba ještě opravit zacukanej dokument, vyhodit nějaký nepřístojný tagy, převézt entity apod. Pak je tady další klasika — Mechanize — ten je ale už spíš na emulaci browseru a hraní si s formulářema. Na stejnou notu je strašně funky Twill. Na něco se daji použít i XPath selektory ve Scrapy, ale to už je zase tahání kanónu na vrabce.

no comments yet