c5game
本来想今天接着复习计算机网络的,结果晚饭后看到有人写抓取steam的数据,然后、、、手就痒痒起来。最近正好在igxe和C++5game上倒卖饰品,平时一个个点开,真的巨麻烦
简单的写了下csgo的,只爬取了c5game的饰品的名称,最低价,周销量以及总销量,顺便把steam上该饰品的市场url也抓了出来
下面便是代码:
# -*- coding: utf-8 -*-
"""
Created on Mon Dec 04 22:38:17 2017
@author: dala_da
"""
import urllib2
import re
p=re.compile(r'''<p class="name">
<a href="(.+?)"><span class=" text-unique ">(.+?)</span></a>
</p>
<p class="info">
<span class="pull-left">
.+<span class="price">¥(.+?)</span> .+ </span>
<span class="num">
(.+) </span>''')
for i in range(10):
target=('HTTPs://www.c5game.com/csgo/default/result.HTML?locale=zh&page=%d') %i
url1=urllib2.urlopen(target)
result_csgo_menu=url1.read()
match_csgo_menu=p.findall(result_csgo_menu)
for row in match_csgo_menu:
address=row[0]
name=row[1]
c5game_price=row[2]
count=row[3]
print name, c5game_price,count
运行结果:
2017-12-06更
好像正则表达式写的很low,重新改了下,顺便把c5game上给出的steam预测价也抓了出来,比对c5game售价和steam预测价,差价狠狠赚一波
import urllib2
import re
p=re.compile(r'''<p class="name">\s+<a href="(.+?)"><span class=" text-unique ">(.+?)</span></a>\s+</p>\s+<p class="info">\s+<span class="pull-left">\s+.+<span class="price">¥(.+?)</span> .+\s+</span>\s+<span class="num">\s+(.+)\s+</span>''')
q=re.compile(r'''<p class="hero">\s+<span>Reference: .+\( about ¥ (.+?) \)</span>''')
for i in range(10):
target=('https://www.c5game.com/csgo/default/result.html?locale=zh&page=%d') %i
url1=urllib2.urlopen(target)
result_csgo_menu=url1.read()
match_csgo_menu=p.findall(result_csgo_menu)
for row in match_csgo_menu:
address=row[0]
name=row[1]
c5game_price=float(row[2])
count=row[3]
c5game_address='https://www.c5game.com/'+address
url_c5game_thing=urllib2.urlopen(c5game_address)
result_c5game_thing=url_c5game_thing.read()
match_thing=q.findall(result_c5game_thing)
predict_price=float(match_thing[0])
print '%s\t%s' %(name,count)
print 'c5最低价:%f\t\tsteam预测价:%f' %(c5game_price,predict_price)
不过好像c5给出的预测价不太准,我尝试抓了一下steam市场的数据,发现货币种类不同,我只能够抓取我大天朝玩家出售的饰品,而天朝玩家饰品占的总数不算太多,差不多1/5,好像没什么参考性,等以后研究出怎么统一货币再更新一下
相关阅读
哈夫曼树 给定n个权值作为n个叶子结点,构造一棵二叉树,若带权路径长度达到最小,称这样的二叉树为最优二叉树,也称为哈夫曼树(Huffma
使用Sina API获取新浪财经的证券股票数据接口(时价 K
从网上找到的Sina API的财经API说,Mark一下,以供以后参考http://market.finance.sina.com.cn/downxls.php?date=2011-07-08&symbol=
【补充K线图引用】 虽然可以通过下面的json方式获取期货信息,自己处理形成K线图,不过可以直接采到sina的K线,可以让搬砖工可以脱离UI
最近,很多运营微信公众号、微博或头条号的小伙伴都被这样一个问题困扰着:为啥我新媒体账号有时推送的阅读量很高,有时却是极低,甚至最
随着大数据蕴涵价值的逐步释放,使其成为IT信息产业中最具潜力的蓝海。大数据正以一种革命风暴的姿态闯入人们视野,其技术和市场在快