python requests库通过get()获取网页内容

Black Python, xpath 10 次浏览
#get()是获取网页最常见的方式 import requests ########################################################################## #在调用requests.get()函数之后,返回的网页内容会保存为一个Response对象 #get()函数的参数URL...

innerHTML和outerHTML区别

Black xpath 9 次浏览
 1.innerHTML   <body> <p>你好</p> <div id="test"><h5>就是喜欢你</h5></div> <script type="text/javascript"> var hj=document.getElementById("test").innerHTM...

xpath contains 函数的用法

Black xpath 10 次浏览 ,
//input[contains(@name,’na’)] 查找name属性中包含na关键字的页面元素 .//*[@class=’Navbar__navbar-lists___3Zvfm’]/a[contains(text(),’服务管理’)] 查找文本包含服务管理的页面元素 //ul[@class=’DataList__ul___oMSe’]/li[...

Scrapy

Black Python, 采集 10 次浏览
一、整体原理图   二、工作流程图 三、创建项目 四、项目架构文件简述 五、功能实现步骤 1、分析网站 chrome 打开网站,ctr+shift+i 打开开发者工具,按F5刷新网站 2、items.py...

火车浏览器设置代理翻墙上网采集的方法

Black 采集 24 次浏览
1、首先是查看端口 有的网址是需要设置浏览器代理 ,和window窗口认证,才可以登录采集 比如设置如下 那么采集器里 需要在这里设置下 就可以了   2、给火车浏览器设置代理的方法 这里支持http以及...
Go