Python爬虫从爪巴到爬 - SiKi学院|SiKi学堂 - unity|u3d|虚幻|ue4/5|java|python|人工智能|视频教程|在线课程

1092人加入学习

(20人评价)

Python爬虫从爪巴到爬

制作完成于2020-3-14

价格 ¥ 388.00

学习有效期永久有效

扫一扫扫二维码继续学习二维码时效为半小时
分享
已收藏
收藏

购买《Python人工智能 - A计划（永久有效期）》学习

排序：最新笔记
- 最新笔记
- 点赞最多

python3的版本在写入文件时，编码当时如果用的utf - 8，中文其实是可以读得。用普通的文本编译器就行比如notepad + +，但是用
excel打开csv文件会出现中文乱码得情况，是因为python编码方式为utf - 8，但是是无BOM格式的，excel软件，其对于utf - 8编程
方式，只支持有BOM格式的，所以会出现中文乱码得问题。设置成utf - 8_sig就代表着有BOM格式的utf - 8的编程，excel就可以正常
显示中文了。

GODMRX · 2020-09-29 · 711 - 查看多出来的数据 1

response = requests.get(url)

response.status_code (状态码）

状态码的开头：1为正在查看；2为成功获取；3为重定向；4为网页不存在；5为服务器内部错误

response.content.decode('utf-8')

将代码转化为utf-8格式（中文正常显示）

abcdebbie · 2020-06-04 · 201 - 使用Requests获得网页源代码 0

可以用home键

迎风看客 · 2020-05-16 · 230 - 模拟百度登录 0

这里的访问方式现在不适用，使用第二个网址更换参数不能达到获取json文件的目的

xnxsgjgf · 2020-05-15 · 515 - 完成一个歌单中所有歌的爬取 0

fixme 高亮

Lincoln32 · 2020-05-11 · 303 - BS4中find_all的使用 0

1.发起请求（HTTP）------>得到响应（HTML）

2.解析HTML，得到我们想要的数据

向阳而笑 · 2020-05-09 · 002 - Python爬虫课程介绍 0

strip去掉空字符串

xnxsgjgf · 2020-05-08 · 413 - 保存公司名称与职位名称 0

gb2312 decode 采用gbk

Lincoln32 · 2020-05-02 · 210 - 作业3爬取网站中所有的图片路径并且下载 0

user-agent：用户代理，用户浏览器的表示

默认是python-requests，大部分网站访问不到

http://httpbin.org/get

Lincoln32 · 2020-05-02 · 204 - 使用爬虫伪装成浏览器 0

decode哪个编码，可以看网页的charset

知乎反爬虫

header

User-Agent

Lincoln32 · 2020-05-02 · 202 - 使用Requests访问知乎 0

content.decode('utf-8')

Lincoln32 · 2020-05-02 · 201 - 使用Requests获得网页源代码 0

Anaconda Prompt

切换环境

activate python_3.6_siki

pip

使用其他镜像

Lincoln32 · 2020-05-02 · 200 - 使用Requests包发起请求 0

1)发起请求（HTTP指平时输入的网址）->得到响应（HTML指网页源代码信息）

1）resquest

2)解析HTML，得到我们想要的数据

1）正则

2）BS4 Beautiful Soup(重点讲解)

3）lxml

3）静态请求，动态请求

4）案例分析

LYRu · 2020-05-02 · 002 - Python爬虫课程介绍 0

youtube 不就是404网站吗？

WANTED · 2020-04-26 · 106 - 状态码 0

proxies = {

'http':'128.199.81.100:44321'

}

永远的朋友 · 2020-03-31 · 218 - 设置超时时间与代理 0

https：//www.52pojie.cn/thread-961836-1-1.html

wenye · 2020-03-28 · 101 - PyCharm激活 0

3.静态请求，动态请求

4.案例

爬取同城约会

爬取siki学院上所有的图片

一些找

wenye · 2020-03-28 · 002 - Python爬虫课程介绍 0

#请求

Get

网址直接显示在地址栏里

post

请求的时候会隐藏参数，一般用于登录和注册，或者填写内容提交

雪狐 · 2020-03-26 · 105 - Get请求和Post请求的区别 0

import

FZ我都是 · 2020-03-25 · 207 - 下载图片信息 0

activate

Angarry · 2020-03-23 · 200 - 使用Requests包发起请求 0

华为OJ在线刷刷刷

华为OJ在线刷刷刷

74 0

TensorFlow2.X API详解增加先验知识的改进算法

TensorFlow2.X API详解增加先验知识的改进算法

0 0

入门精选：从零搭建语音识别引擎 - 基于Kaldi

入门精选：从零搭建语音识别引擎 - 基于Kaldi

851 7

TensorFlow2.X API详解（一）常用函数与深度学习

TensorFlow2.X API详解（一）常用函数与深度学习

98 8

授课教师

SiKi学院老师007

课程特色

下载资料(1)

视频(207)

最新学员

学员动态

wangdi. 开始学习 219 - 模拟Post请求

wangdi. 完成了 218 - 设置超时时间与代理

wangdi. 开始学习 218 - 设置超时时间与代理

wangdi. 完成了 217 - 设置代理爬虫

wangdi. 开始学习 217 - 设置代理爬虫

UnityA计划

Unity学习路线

虚幻A计划

虚幻学习路线

JavaA计划

Java学习路线

PythonA计划

Python学习路线

微信小程序A计划

小程序学习路线