求逆战5字名字，格式是 ❌❌❌猫咪名字大全

中央处理器(cpu) | AutoCAD | 人生 | 硬盘 | 投资 | 梦幻西游电脑版 | 院校信息 | QQ飞车（游戏） | 魔兽争霸3混乱之治 | PHP | 总决赛 | solidworks | 产品经理 | 机器学习 | 塞尔达传说（游戏） | 卡牌游戏 | 休闲游戏 | 经济 | 刷单 | Xbox One | 游戏开发 | 任天堂 | C4D | 部落冲突（游戏） | 建筑 | HTML | 办公室 | 游戏策划 | 网络直播 | 扫地机器人 | 电源 | centos | 水浒传 | 陶渊明 | 高德地图（amap） | 少数民族 | 女性主义 | ios游戏 | 健身教练 | 尧山 | 移民 | 正则表达式 | 游戏手柄 | 植保无人机 | Spss数据分析 | 婚姻 | 鱼类 | 云主机 | 极限挑战(综艺节目) | 电学 | pdf | ICEY（游戏） | 显卡 | 教育 | 虚拟机 | 率土之滨 | 中国 | 魔兽争霸3冰封王座 | 社会 | 外国人 | CSS | Adobe After Effects | iPad | 航拍 | 智能手环 | 舰队 collection | 化妆 | 炉石传说 | 热血传奇（游戏） | 办公软件 | 职业规划 | 法律咨询 | 哔哩哔哩 | mysql | 书法 | 生辰八字 | 运载火箭 | 网盘 | 环境保护 | 洗发水 | 对联 | 心理咨询 | 家庭 | 金庸小说 | 3D Max | 怪物猎人：世界 | 广告 | 拼多多 | 遗传学 | 义乌市 | 星系 | 计算机专业 | 机械 | 钢铁雄心4 | 恐怖游戏 | 街机游戏 | 地图应用 | 食品 | 谷歌（Google） | 飞机 | 名言 | 艺术 | 社会学 | 央视 | 植物种植 | matlab | OneNote | 任天堂3ds | 护肤品 | 细胞生物学 | 古剑奇谭ol | 美团 | 著作权 | 最终幻想（游戏） | 分子生物学 | galgame | 香港特别行政区 | 300英雄 | 超级机器人大战 | 徐州市 | 刀塔（dota2） | 哈尔滨市 | 按键精灵 | 金庸 | 球球大作战 | 电脑游戏 | 爬虫（计算机网络） | 心理 | 校服 | 马克思主义 | 电视 | Microsoft SQL Server | 道教 | 应届毕业生 | 完美世界（游戏） | 赚钱 | 游戏直播 | 智商 | 声音 | 眼镜 | 创业 | 春节联欢晚会 | 汽车保险 | 洛克王国 | 天涯明月刀 | 乌海市 | 汉服 | 奶茶 | 动画 | 命令与征服：红色警戒2（游戏） | 广州 | 中药 | 演员 | 电气工程及其自动化专业 | 建筑设计 | 日本漫画 | 恐怖黎明 | 软件开发 | 黑洞 | 空调 | 进化论 | 杨紫 | C#编程 | 星座爱情 | 新浪微博 | 超级战队 | 网站建设 | 食物 | 眼睛 | 蓄电池 | 直播 | 天下贰 | 摩托车 | 医疗保险 | 历史人物 | 史莱姆 | 陌陌 | 经济学 | 姓氏 | 英雄传说：闪之轨迹（游戏） | 天下2（游戏） | 烹饪 | 中国历史 | Microsoft Visual Studio | 星际 | 快捷键 | 街头霸王（游戏） | 生存游戏 | 恐龙 | 输入法 | 滑雪 | 上海市 | 勇者斗恶龙（游戏） | 飞船 | 手机游戏开发 | 充电器 | 刺客信条2 | 格斗游戏（ftg） | 火影忍者 | 减肥方法 |

你的位置：网站首页 >> 频道首页 >>腾讯游戏 >>求逆战5字名字，格式是 ❌❌❌猫咪名字大全

求逆战5字名字，格式是 ❌❌❌猫咪名字大全

来源：蜘蛛抓取(WebSpider) 时间：2015-02-21 12:06 标签：好听的猫咪名字

1032人阅读
技术干货（54）
相信做过网站爬虫工作的同学都知道，python的urllib2用起来很方便，使用以下几行代码就可以轻松拿到某个网站的源码：
#coding=utf-8
import urllib
import urllib2
request = urllib2.Request(url)
page = urllib2.urlopen(url)
html = page.read()
print html
最后通过一定的正则匹配，解析返回的响应内容即可拿到你想要的东东。
但这样的方式在办公网和开发网下，处理部分外网站点时则会行不通。
比如：，执行时一直报10060的错误码，提示连接失败。
#coding=utf-8
import urllib
import urllib2
url = &/p/&
request = urllib2.Request(url)
page = urllib2.urlopen(url)
html = page.read()
print html
执行后，错误提示截图如下：
为了分析这一问题的原因，撸主采用了如下过程：
1、在浏览器里输入，可以正常打开，说明该站点是可以访问的。
2、同样的脚本放在公司的体验网上运行OK，说明脚本本身没有问题。
& & & &通过以上两个步骤，初步判断是公司对于外网的访问策略限制导致的。于是查找了下如何给urllib2设置ProxyHandler代理，将代码修改为如下：
#coding=utf-8
import urllib
import urllib2
# The proxy address and port:
proxy_info = { 'host' : 'web-','port' : 8080 }
# We create a handler for the proxy
proxy_support = urllib2.ProxyHandler({&http& : &http://%(host)s:%(port)d& % proxy_info})
# We create an opener which uses this handler:
opener = urllib2.build_opener(proxy_support)
# Then we install this opener as the default opener for urllib2:
urllib2.install_opener(opener)
url = &/p/&
request = urllib2.Request(url)
page = urllib2.urlopen(url)
html = page.read()
print html
再次运行，可以拿到所要的Html页面了。
到这里就完了么？没有啊！撸主想拿到贴吧里的各种美图，保存在本地，上代码吧：
#coding=utf-8
import urllib
import urllib2
# The proxy address and port:
proxy_info = { 'host' : 'web-','port' : 8080 }
# We create a handler for the proxy
proxy_support = urllib2.ProxyHandler({&http& : &http://%(host)s:%(port)d& % proxy_info})
# We create an opener which uses this handler:
opener = urllib2.build_opener(proxy_support)
# Then we install this opener as the default opener for urllib2:
urllib2.install_opener(opener)
url = &/p/&
request = urllib2.Request(url)
page = urllib2.urlopen(url)
html = page.read()
reg = r'src=&(.+?\.jpg)& pic_ext'
imgre = re.compile(reg)
imglist = re.findall(imgre,html)
print 'start dowload pic'
for imgurl in imglist:
urllib.urlretrieve(imgurl,'pic\\%s.jpg' % x)
再次运行，发现还是有报错！尼玛！又是10060报错，我设置了urllib2的代理了啊，为啥还是报错！
于是撸主继续想办法，一定要想拿到贴吧里的各种美图。既然通过正则匹配可以拿到贴吧里的图片的url，为何不手动去调用urllib2.urlopen去打开对应的url，获得对应的response，然后read出对应的图片二进制数据，然后保存图片到本地文件。于是有了下面的代码：
#coding=utf-8
import urllib
import urllib2
# The proxy address and port:
proxy_info = { 'host' : 'web-','port' : 8080 }
# We create a handler for the proxy
proxy_support = urllib2.ProxyHandler({&http& : &http://%(host)s:%(port)d& % proxy_info})
# We create an opener which uses this handler:
opener = urllib2.build_opener(proxy_support)
# Then we install this opener as the default opener for urllib2:
urllib2.install_opener(opener)
url = &/p/&
request = urllib2.Request(url)
page = urllib2.urlopen(url)
html = page.read()
reg = r'src=&(.+?\.jpg)& pic_ext'
imgre = re.compile(reg)
imglist = re.findall(imgre,html)
print 'start'
for imgurl in imglist:
print imgurl
resp = urllib2.urlopen(imgurl)
respHtml = resp.read()
picFile = open('%s.jpg' % x, &wb&)
picFile.write(respHtml)
picFile.close()
print 'done'
再次运行，发现还是图片的url按预期的打印出来，并且图片也被保存下来了：
& 至此，已完成撸主原先要做的目的。哈哈，希望总结的东东对其他小伙伴也有用。
& 本文由腾讯WeTest团队提供，更多资讯可直接戳链接查看：
& 微信号：TencentWeTest
&&相关文章推荐
参考知识库
* 以上用户言论只代表其个人观点，不代表CSDN网站的观点或立场
访问：107869次
积分：1592
积分：1592
排名：千里之外
原创：60篇
评论：16条
文章：21篇
阅读：49489
(5)(5)(4)(4)(3)(4)(7)(3)(4)(4)(4)(5)(3)(7)(1)(2)(1)

求逆战5字名字，格式是 ❌❌❌猫咪名字大全

我要回帖

更多关于好听的猫咪名字的文章

随机推荐

求逆战5字名字，格式是 &#10060;&#10060;&#10060;猫咪名字大全

我要回帖

更多关于 好听的猫咪名字 的文章

随机推荐

求逆战5字名字，格式是 ❌❌❌猫咪名字大全

更多关于好听的猫咪名字的文章