皮皮书屋
(欢迎转载,转载请注明出处:http://blog.csdn.net/hcbbt/article/details/42072545)
写在前面的扯皮
为什么标题的”皮皮书屋”加上了引号,因为皮皮书屋(http://www.ppurl.com/)由于各种原因已经远离我们而去了…在今年光棍节那天…
所以这里顺便缅怀一下已经不在的皮皮书屋,我也在那里下过很多书(虽然没看多少),我还上传过书上去呢。
而且,我这博客在刚创建的不久过一篇 分析皮皮书屋的注册验证码的文章,让我体会到编程的乐趣,因此我对这个网站十分偏爱,而且它也没让我失望过,书非常多 :-),几乎有求必应。
感谢陪伴。
不扯了,我可不想长篇大论。
下面是正文。
本文的主题是:怎么下载这再也见不到的皮皮书屋里面的书。
正文之方法1
在皮皮书屋宣布要停止服务后,一些大牛就开始行动来挽救它了,他们上面把所有书都爬下来了,然后再开了一个Tor 的隐藏服务,为了避免它们再被和谐,我就简单截图一下,地址见截图:
(PS:貌似需要fq,虽然搜索效果不错,但是很慢…推荐先试后面的方法)
正文之方法2
这才是本文的重点!
我们需要使用一个大牛整理出来的 excel 表格,里面有一万两千多个 ed2k 链接,以 ed2k 形式存在的资源,这样就会一直存在在网络中了,而且九成的 ed2k 都可以用迅雷离线秒杀。大牛实在是高。
1. 表格下载:
- 度盘/s/1pJx8Raz 密码pt9t
- 度盘/s/1pJnz4Dl 密码jmkw
- 保险起见: 度盘/s/1pJ0qH7t 密码32s5
- 备胎: 度盘/s/1dDrND7r 密码qk04
里面有 .xls 和 .xlsx,两份内容一样,如果是压缩包,密码是 ppurl,都是用 7zip 压缩的。
2. 从链接里面提取信息
刚拿到这份表格会让人感觉无从下手,怎么从里面找自己想要的书呢。
其实链接里面已经有你想要的信息了。
我们随便从里面拿出一个链接来看看:
ed2k://|file|Sun%20Certified%20Enterprise%20Architect%20for%20java%20EE%20Study%20Guide%2C%202nd%20Edition%20%5BPrentice%20Hall%5D%282010-01-29%29.pdf|2384144|7e2be401bcb122684cae052f6cf61e8f|h=cqbtsc5iOSjesbrolx5ykq3br724ti4h|/
这里面从 file|
开始,到下一个 |
结束,就是这个文件的文件名,我们把它提取出来看看:
Sun%20Certified%20Enterprise%20Architect%20for%20Java%20EE%20Study%20Guide%2C%202nd%20Edition%20%5BPrentice%20Hall%5D%282010-01-29%29.pdf
是不是感觉很像一个文件名,里面也有些单词什么的。其实这是 URL 编码过的,接下来我们要把它转回去,找一个在线转码的转下就行了,这里随便找了 http://tool.oschina.net/encode?type=4 来用。把东西复制到网页里面右边的方框,选择 encodeURIcomponent
然后点下 URL解码 就行了,如图:
解码结果是:
Sun Certified Enterprise Architect for Java EE Study Guide, 2nd Edition [Prentice Hall](2010-01-29).pdf
这样我们就可以从一个链接中读取信息了。
3. 搜自己要找的书
现在知道链接中信息的存储方式,那么我们就可以据此来从表格里面找我们要的东西了。
比如你要搜 <Professional JavaScript for Web Developeers 3rd edition>
这本书。
截取一块作为关键字:JavaScript for Web
,然后到 http://tool.oschina.net/encode?type=4 转码,粘贴到左边选择 encodeURIComponent
然后点
URL编码,如图:
得到:JavaScript%20for%20Web
就是在 ed2k 链接中的关键字了,现在打开表格,按Ctrl+F
,输入这串字符,回车搜索就行了。
找到一个链接:
ed2k://|file|Professional%20JavaScript%20for%20Web%20Developers%20%5BWrox%20Press%5D%282020-05%29.pdf|9710833|35c1ad5883f630b217baba47c7bfbbe9|h=jt4ysbokgccycqy6clsjtncmfrj2t6eq|
根据刚才说的,把这本书的书名解码,发现是 Professional JavaScript for Web Developers [Wrox Press](2020-05).pdf
,这本是第一版的,不是我们要找的第三版,那就再在表格里找看看。
我找了几次,分别找到第一版、第二版、第三版的书,都是文字版的 :-)。
你也可以这样找看看,希望你能找到你所想要的书 :-P。
PS: 其实每次都要打开网页去转码很麻烦,我都是直接拿出一段作为关键字,然后把里面的空格换成%20去搜的。
本文只提供如何从皮皮书屋的表格中提取自己感兴趣的内容,并没有希望大家去下载盗版电子书,请大家支持正版。:-)
相关阅读
python爬虫-利用Scrapy框架完成天天书屋内容爬取并保
首先创建项目,代码操作参照我之前的博客https://blog.csdn.net/zhouchen1998/article/details/81328858 这里强调一下,由于scrapy