Scrape-a Vínbúðina.is


Höfundur
gosi
Græningi
Póstar: 38
Skráði sig: Mán 02. Maí 2011 15:31
Reputation: 0
Staða: Ótengdur

Scrape-a Vínbúðina.is

Pósturaf gosi » Lau 04. Okt 2014 17:20

Er einhver góður í python og kann að búa til forrit sem scrapar Vínbúðina.
Var að reyna með scrapy en síðan þeirra er svo flókin að ég skildi það ekki almennilega.



Skjámynd

Frantic
FanBoy
Póstar: 797
Skráði sig: Mið 04. Mar 2009 17:43
Reputation: 6
Staða: Ótengdur

Re: Scrape-a Vínbúðina.is

Pósturaf Frantic » Lau 04. Okt 2014 17:54

Ég myndi byrja að prófa að lúppa í gegnum id dótið hjá þeim.
http://www.vinbudin.is/DesktopDefault.a ... ID=????????

Athuga hvort þú getir ekki náð öllu með því að byrja á 0 og enda á 100000.
Þarf þá að passa að scrape-a ekki þegar engar upplýsingar koma fram.
Hef sama og ekkert gert í python þannig ég get ekki hjálpað þér með hvaða tól þú gætir notað.
Vonandi einhver annar sem getur svarað því.



Skjámynd

dori
Besserwisser
Póstar: 3605
Skráði sig: Fim 12. Feb 2009 10:46
Reputation: 142
Staða: Ótengdur

Re: Scrape-a Vínbúðina.is

Pósturaf dori » Lau 04. Okt 2014 18:42

Skoðaðu beautiful soup ef þú vilt parsa html með python. Þetta scripy virkar samt rosa einfalt líka (þarft basically bara að skilgreina hvernig þetta liggur en lítið sem ekkert boilerplate). Getur prófað að nota https://www.kimonolabs.com/, það er voða fínt svona hýst lausn til að skrapa hluti af vefnum.

Hvað er það sem þú ert að reyna að gera nákvæmlega?




Höfundur
gosi
Græningi
Póstar: 38
Skráði sig: Mán 02. Maí 2011 15:31
Reputation: 0
Staða: Ótengdur

Re: Scrape-a Vínbúðina.is

Pósturaf gosi » Lau 04. Okt 2014 19:48

Mig langar bara að prófa að scrapa þessa síðu því mér finnst hún svo óaðgengileg eitthvað. Ýmislegt sem hægt væri að laga hjá þeim.
Langar þá að tengja nokkra hluti saman um hina ýmsu drykki en síðan er svo illa gerð að það verður eitthvað flókið




Höfundur
gosi
Græningi
Póstar: 38
Skráði sig: Mán 02. Maí 2011 15:31
Reputation: 0
Staða: Ótengdur

Re: Scrape-a Vínbúðina.is

Pósturaf gosi » Lau 04. Okt 2014 20:49

Það þarf annars ekkert að vera í python, jafnvel nodes eða einhverju öðru sem keyrist á linux



Skjámynd

dori
Besserwisser
Póstar: 3605
Skráði sig: Fim 12. Feb 2009 10:46
Reputation: 142
Staða: Ótengdur

Re: Scrape-a Vínbúðina.is

Pósturaf dori » Lau 04. Okt 2014 21:17

Ég á samt við hvað þú ætlar að gera. Nánari útlistun á því hvað þetta forrit sem þú ætlar að gera gerir.

Viltu bara betra yfirlit yfir hvað er til og hvað það kostar? Eitthvað annað og hvað þá? Eru upplýsingarnar í listanum nóg eða er eitthvað sem er bara á "detail síðunni" sem þig vantar?

Ertu bara að hugsa um eitthvað til heimanota eða eitthvað sem fleiri en þú myndir nota? Skiptir allt máli upp á hvað borgar sig að eyða miklu tíma í þetta.




Höfundur
gosi
Græningi
Póstar: 38
Skráði sig: Mán 02. Maí 2011 15:31
Reputation: 0
Staða: Ótengdur

Re: Scrape-a Vínbúðina.is

Pósturaf gosi » Lau 04. Okt 2014 21:35

Já ég myndi vilja betra yfirlit. Þetta ætti nú að vera til heimanota. T.d. að leita og fletta finnst mér vera lélegt.
Stundum þegar ég er að skoða og fletti á næstu síðu, as in númerin neðst, þá vill stundum síðan fara á heildaryfirlit yfir drykki.
Það pirrar mig þegar mig vantar upplýsingar. Líka sendir síðan javascript í númerunum neðst.

Þessi kimonolabs.com er helvíti góð. Þakka þér fyrir þær upplýsingar :D



Skjámynd

hagur
Besserwisser
Póstar: 3095
Skráði sig: Mið 17. Des 2003 16:11
Reputation: 443
Hafðu samband:
Staða: Ótengdur

Re: Scrape-a Vínbúðina.is

Pósturaf hagur » Lau 04. Okt 2014 21:52

Ef þú ert að fara að smíða scraper fyrir þetta, þá auðvitað býrðu til apis.is scraper og gerir þetta svo aðgengilegt fyrir alla þar ;-)

https://github.com/kristjanmik/apis#add ... w-endpoint




Höfundur
gosi
Græningi
Póstar: 38
Skráði sig: Mán 02. Maí 2011 15:31
Reputation: 0
Staða: Ótengdur

Re: Scrape-a Vínbúðina.is

Pósturaf gosi » Lau 04. Okt 2014 22:19

Nauh þetta er sniðugt. Já ég kannski geri það.




starionturbo
Gúrú
Póstar: 542
Skráði sig: Mán 24. Des 2007 11:23
Reputation: 8
Staðsetning: localhost
Staða: Ótengdur

Re: Scrape-a Vínbúðina.is

Pósturaf starionturbo » Fim 23. Okt 2014 14:57

Eins mikið og ég elska að scrape-a, þá er hræðilega leiðinlegt að skrapa .NET doPostBackOjbara virkni með __VIEWSTATE.


Foobar


davida
Fiktari
Póstar: 63
Skráði sig: Mið 20. Jan 2010 20:49
Reputation: 16
Staða: Ótengdur

Re: Scrape-a Vínbúðina.is

Pósturaf davida » Fim 23. Okt 2014 15:28

Heyheyhey, my time to shine! Ég skrifaði litla skriftu til að gera akkúrat þetta og notaði til þess CasperJS og phantomJS. Þetta er allt á github og er að sjálfsögðu alveg mega nastí "þarf bara að fá þetta til að virka einu sinni" skriftukóði , engin ábyrgð tekin etcetc :).

Þú getur tékkað á þessu á https://github.com/davidarnarsson/boozefind . Eflaust pínu hausverkur að fá þetta til að virka. Þetta er líka + árs gamalt svo það getur vel verið að þetta brotni á móti síðunni í dag, ef einhverjar breytingar hafa orðið á henni.

Leitarvélin sjálf er uppsett á booze.axlabond.in . Þetta var nú bara smá parser flipp.



Skjámynd

rango
FanBoy
Póstar: 785
Skráði sig: Lau 14. Júl 2012 22:36
Reputation: 3
Staðsetning: 404 - Location Not found.
Staða: Ótengdur

Re: Scrape-a Vínbúðina.is

Pósturaf rango » Fim 23. Okt 2014 19:59





Höfundur
gosi
Græningi
Póstar: 38
Skráði sig: Mán 02. Maí 2011 15:31
Reputation: 0
Staða: Ótengdur

Re: Scrape-a Vínbúðina.is

Pósturaf gosi » Fös 31. Okt 2014 16:51

Já!!! Svakalegt. Fer þetta semsagt á leitarsíðuna og kannar allar product og fer svo á næstu síðu?




davida
Fiktari
Póstar: 63
Skráði sig: Mið 20. Jan 2010 20:49
Reputation: 16
Staða: Ótengdur

Re: Scrape-a Vínbúðina.is

Pósturaf davida » Sun 02. Nóv 2014 22:18

gosi skrifaði:Já!!! Svakalegt. Fer þetta semsagt á leitarsíðuna og kannar allar product og fer svo á næstu síðu?


Jebb, ef ég man rétt þá eru þetta 2 skriftur, ein til þess að taka inn vörurnar, og svo önnur til að scrapea details fyrir hverja vöru fyrir sig.