必威体育Betway必威体育官网
当前位置:首页 > IT技术

爬虫抓取c5game饰品交易数据

时间:2019-06-30 06:43:24来源:IT技术作者:seo实验室小编阅读:71次「手机版」
 

c5game

本来想今天接着复习计算机网络的,结果晚饭后看到有人写抓取steam的数据,然后、、、手就痒痒起来。最近正好在igxe和C++5game上倒卖饰品,平时一个个点开,真的巨麻烦

简单的写了下csgo的,只爬取了c5game的饰品的名称,最低价,周销量以及总销量,顺便把steam上该饰品的市场url也抓了出来

下面便是代码

# -*- coding: utf-8 -*-
"""
Created on Mon Dec 04 22:38:17 2017

@author: dala_da
"""

import urllib2
import re

p=re.compile(r'''<p class="name">
                                <a href="(.+?)"><span class=" text-unique ">(.+?)</span></a>
                            </p>

                            <p class="info">
                                                                    <span class="pull-left">
                                    .+<span class="price">¥(.+?)</span> .+                                </span>
                                    <span class="num">
                                    (.+)                                </span>''')


for i in range(10):                    
    target=('HTTPs://www.c5game.com/csgo/default/result.HTML?locale=zh&page=%d') %i
    url1=urllib2.urlopen(target)
    result_csgo_menu=url1.read()
    match_csgo_menu=p.findall(result_csgo_menu)

    for row in match_csgo_menu:
        address=row[0]
        name=row[1]
        c5game_price=row[2]
        count=row[3]
        print name, c5game_price,count

运行结果:

2017-12-06更

好像正则表达式写的很low,重新改了下,顺便把c5game上给出的steam预测价也抓了出来,比对c5game售价和steam预测价,差价狠狠赚一波大笑

import urllib2
import re

p=re.compile(r'''<p class="name">\s+<a href="(.+?)"><span class=" text-unique ">(.+?)</span></a>\s+</p>\s+<p class="info">\s+<span class="pull-left">\s+.+<span class="price">¥(.+?)</span> .+\s+</span>\s+<span class="num">\s+(.+)\s+</span>''')

q=re.compile(r'''<p class="hero">\s+<span>Reference: .+\( about ¥ (.+?) \)</span>''')

for i in range(10):                    
    target=('https://www.c5game.com/csgo/default/result.html?locale=zh&page=%d') %i
    url1=urllib2.urlopen(target)
    result_csgo_menu=url1.read()
    match_csgo_menu=p.findall(result_csgo_menu)

    for row in match_csgo_menu:
        address=row[0]
        name=row[1]
        c5game_price=float(row[2])
        count=row[3]
        
        c5game_address='https://www.c5game.com/'+address
        url_c5game_thing=urllib2.urlopen(c5game_address)
        result_c5game_thing=url_c5game_thing.read()
        match_thing=q.findall(result_c5game_thing)
        
        predict_price=float(match_thing[0])
        
        print '%s\t%s' %(name,count)
        print 'c5最低价:%f\t\tsteam预测价:%f' %(c5game_price,predict_price)

不过好像c5给出的预测价不太准,我尝试抓了一下steam市场的数据,发现货币种类不同,我只能够抓取我大天朝玩家出售的饰品,而天朝玩家饰品占的总数不算太多,差不多1/5,好像没什么参考性,等以后研究出怎么统一货币再更新一下

相关阅读

【数据结构】哈夫曼树及哈夫曼编码

哈夫曼树 给定n个权值作为n个叶子结点,构造一棵二叉树,若带权路径长度达到最小,称这样的二叉树为最优二叉树,也称为哈夫曼树(Huffma

使用Sina API获取新浪财经的证券股票数据接口(时价 K

从网上找到的Sina API的财经API说,Mark一下,以供以后参考http://market.finance.sina.com.cn/downxls.php?date=2011-07-08&symbol=

新浪期货数据接口(转)

【补充K线图引用】 虽然可以通过下面的json方式获取期货信息,自己处理形成K线图,不过可以直接采到sina的K线,可以让搬砖工可以脱离UI

如何用数据分析,搞定新媒体运营的定位和内容初始化?

最近,很多运营微信公众号、微博或头条号的小伙伴都被这样一个问题困扰着:为啥我新媒体账号有时推送的阅读量很高,有时却是极低,甚至最

大数据投资人必读:中国大数据发展与投资分析报告

随着大数据蕴涵价值的逐步释放,使其成为IT信息产业中最具潜力的蓝海。大数据正以一种革命风暴的姿态闯入人们视野,其技术和市场在快

分享到:

栏目导航

推荐阅读

热门阅读