python简单爬虫笔记

python模拟游览器爬取相关页面

创新互联公司2013年成立，是专业互联网技术服务公司，拥有项目网站建设、网站制作网站策划，项目实施与项目整合能力。我们以让每一个梦想脱颖而出为使命，1280元西宁做网站,已为上家服务,为西宁各地企业和个人服务,联系电话:18982081108

import urllib.request

url="https://blog.51cto.com/itstyle/2146899"

#模拟浏览器
headers=("User-Agent","Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.87 Safari/537.36")
opener=urllib.request.build_opener()
opener.addheaders=[headers]
data=opener.open(url).read()

fh=open("D:/5.html","wb")
fh.write(data)
fh.close()

python爬取新闻网站并将文章下载到本地

import urllib.request
import urllib.error
import re
data=urllib.request.urlopen("http://news.sina.com.cn/").read()
data2=data.decode("utf-8","ignore")
pat='href="(http://news.sina.com.cn/.*?)">'
allurl=re.compile(pat).findall(data2)
for i in range(0,len(allurl)):
    try:
        print("第"+str(i+1)+"次爬取")
        thisurl=allurl[i]
        file="D:/pac/sinanews/"+str(i)+".html"
        urllib.request.urlretrieve(thisurl,file)
        print("-----成功-----")
    except urllib.error.URLError as e:
        if hasattr(e,"code"):
            print(e.code)
        if hasattr(e,"reason"):
            print(e.reason)

python爬取月光博客文章下载到本地

import re
import urllib.request
import urllib.error

data=urllib.request.urlopen("http://www.williamlong.info/").read()
pat='rel="bookmark">(.*?)'
pat_url='class="post-title">

                    

                    当前标题：python简单爬虫笔记                    

                    当前地址：http://csdahua.cn/article/jodseg.html


                
                    
                    
                        扫二维码与项目经理沟通
                        我们在微信上24小时期待你的声音
                        解答本文疑问/技术咨询/运营咨询/技术建议/互联网交流
                    
                
                
                    其他资讯
                    
                        上传用户名我想让我的主机可以支持
优化SEO文章编写技巧：如何利用C语言的goto语句提高代码效率
edge插件白名单怎么加入？（这个网站打不开白名单已经添加了）
pom是什么意思
MSSQL数据如何导出？（mssql的数据怎么导出）


        
            
                
                    行业动态
                    企业网站建设的重要性！
                    现在虽然是移动互联网时代，但企业网站依然重要，包含PC站点，移动站。可以说企业网站关系企业的未来发展和前途，尤其对中小企业更是如此，一些中小企业老板，对自己的名片很在乎，因为这是个门面。...
                
            
            
                服务项目
                
                    
                        
                            网站建设
                            
                            查看详情
                        
                    
                    
                        
                            移动端/APP
                            
                            查看详情
                        
                    
                    
                        
                            微信/小程序
                            
                            查看详情
                        
                    
                    
                        
                            技术支持
                            
                            查看详情
                        
                    
                    
                        
                            其它服务
                            
                            查看详情
                        
                    
                    
                        
                            更多服务项目
                             用我们的专业和诚信赢得您的信赖，从PC到移动互联网均有您想要的服务！
                            获取更多
                        
                    
                
            
            
                 联系吧 在百度地图上找到我们 
                电话：13518219792
                如遇占线或暂未接听请拨：136xxx98888
                 业务咨询 技术咨询 售后服务


    
        
            
                
                    网站制作
                    梓潼网站制作公司
手机网站制作
网站制作
手机网站制作
                
                
                    网站建设
                    网站建设
梓潼网站建设
都江堰网站建设
网站建设方案
                
                
                    网站设计
                    成都网站设计
高端定制网站设计
宜宾网站设计
成都网站设计
                
                
                    联系我们
                    电话：13518219792
                    邮箱：631063699@qq.com
                    地址：成都青羊区锦天国际1002号
                    网址：www.csdahua.cn
                
                
                    
                    
                         
                            微信二维码
                        
                    
                
            
        
        
            
                友情链接
                金堂柴油发电机维修
叉车销售公司
全网整合营销推广
网站设计制作
温江做网站
成都网站建设
成都企业ISO认证
微信小程序开发
云服务器
阿坝柴油发电机租赁
            
        
    
    
        
             Copyright © 2002-2023 www.csdahua.cn 快上网建站品牌 QQ：244261566 版权所有 备案号：蜀ICP备19037934号
            
             
        
    
    
        
            在线咨询
            
            13518219792
             
                 
                    微信二维码
                
            
             
                 
                    移动版官网

python简单爬虫笔记

扫二维码与项目经理沟通

其他资讯

行业动态

企业网站建设的重要性！

服务项目

网站建设

移动端/APP

微信/小程序

技术支持

其它服务

更多服务项目

联系吧 在百度地图上找到我们

电话：13518219792

联系吧在百度地图上找到我们