爬虫整理(一)使用re和urllib
发表于
|
分类于
python练习
完整代码123456789101112131415161718192021from urllib.request import urlopenhtml = urlopen( "https://morvanzhou.github.io/static/scraping/basic-str
...
爬虫整理(三)Requests
发表于
|
分类于
python练习
Requests 是一个 Python 的外部模块, 需要手动安装. 使用 pip 安装就好了.
1234567import requestsimport webbrowser # 使用浏览器打开param = {"wd": "itswl.github&q
...
爬虫整理(二)BeautifulSoup
发表于
|
分类于
python练习
BeautifulSoup 解析:基础本段完整代码
具体安装过程可自行搜索。beautifulSoup使用过程
选择要爬的网址 (url)
使用 python 打开这个网址 (urlopen等)
读取网页信息 (read() 出来)
将读取的信息放入 BeautifulSoup
使用 Beauti
...
(18) python异常
发表于
|
分类于
python基础
异常异常的概念
程序在运行时,如果 Python 解释器 遇到 到一个错误,会停止程序的执行,并且提示一些错误信息,这就是 异常
程序停止执行并且提示错误信息 这个动作,我们通常称之为:抛出(raise)异常
程序开发时,很难将 所有的特殊情况 都处理的面面俱到,通过 异常捕获 可以针对突发事件
...
(17) python文件操作
发表于
|
分类于
python基础
文件文件####文件的概念
计算机的 文件,就是存储在某种 长期储存设备 上的一段 数据
长期存储设备包括:硬盘、U 盘、移动硬盘、光盘…
文件的作用:将数据长期保存下来,在需要的时候使用文件的存储方式:在计算机中,文件是以 二进制 的方式保存在磁盘上的文本文件:可以使用 文本编辑软件 查看,本
...
(13) python中用字典代替switch
发表于
|
分类于
python基础
switch语句类型12345678910111213'''switch(n){case 1: 执行代码块 1 break;case 2: 执行代码块 2 break;default: n 与 case 1 和 case 2 不同时执行的代码
...
(14) python中的列表推导式
发表于
|
分类于
python基础
#####列表推导式
#####集合字典也可
#####元组也可
1234a=[1,2,3,4,5,6,7,8,9]b=[i**3 for i in a if i <=5]print(b) #b={....}为集合,b(...)为元组,与a{[(...)]
...
(15) python中的None
发表于
|
分类于
python基础
None 表示空 不同于 空字符串 空的列表 0 False
类型不同,值不同1234567print(type(None)) <class 'NoneType'>None是None类a=''b=Falsec=[]print(a==None)
...