当前位置:首页 > 技术分析 > 正文内容

Python第十节—爬虫前正则模块学习

陆陆续续给大家讲了不少课,基础的内容可以关注小编,查看往期的内容,每期的内容不多,希望大家多多加油!

今天给大家讲的是Python中的爬虫内容,讲爬虫之前先给大家讲一下正则模块,正则表一般用来检索替换那些符合某些规则的文本,白话就是,你要查找A中的有没有“男孩”这个词,然后需要你自己在程序中设定规则(正则表达式)为“男孩”,然后利用正则模块来查找,或者某些英文语句,E-mail地址,命令或者你想搞定的东西

正则表达式是一段文本或者一个公式,由普通字符以及特殊字符组成的文字模式,它是用来描述某种特征,用某种特征去进行匹配

匹配 描述正则表达式动作的结果,给定一段文本或者字符串,使用正则表达式从文本或者字符串中查找符合正则表达式的字符串

字符匹配

—普通字符,例如a,b,c,d,e,f,g,h.......

—元字符,例如[ ] 常用来指定一个字符集:[abc];[a-z]

[^ ]指定不再区间范围内

^,匹配行首,它只能匹配字符串的开始

$,匹配行尾,

听不懂不要着急,且让小编给你举几个简单例子

1.先导入re模块,利用import re

2.输入一段内容s

3.输入正则表达式res=r‘ ’(加上r是为了和上面内容做区分,这里查找的元字符是com)

4.利用re.findall函数,查找

当用[]来指定一个字符集时,比如下面的例子,我要搜索出tap tqp,可以写成res=r‘t[aq]p',可以直接查找

如果res=r‘[h]’,意思就是查找s中是否存在含有h的字符串,有几个含有h就显示几个字符串

import re

s='hello world hello'

res=r'[h]'

print re.findall(res,s)

输出的是‘ h’,‘h’(因为s中有两个hello)

当利用$符号时,代表定位在尾部

import re

s='hilp halp hblp hclp hdlp hilp'

res=r'hilp

print re.findall(res,s)

输出只会输出一个hilp

当利用^时,只会定位在行首

import re

s='hilp halp hblp hclp hdlp hilp'

res=r'^hilp'

print re.findall(res,s)

只能输出行首一个‘hilp’



扫描二维码推送至手机访问。

版权声明:本文由ruisui88发布,如需转载请注明出处。

本文链接:http://www.ruisui88.com/post/4581.html

标签: 正则 ?=
分享给朋友:

“Python第十节—爬虫前正则模块学习” 的相关文章

Deepin Linux正式引入AI功能,成为第一个正式加入AI潮流的Linux发行版

Deepin Linux是一个基于Debian的Linux发行版,以美观和实用性而闻名。现在为了达到人工智能发展趋势的前沿,Deepin Linux的开发人员宣布,他们已经开始将AI功能集成到桌面环境及其随附的应用程序中。AI集成包含了两种风格——AI驱动的图像编辑插件和AI编码助手。其中图像编辑插...

vue 3 学习笔记 (八)——provide 和 inject 用法及原理

在父子组件传递数据时,通常使用的是 props 和 emit,父传子时,使用的是 props,如果是父组件传孙组件时,就需要先传给子组件,子组件再传给孙组件,如果多个子组件或多个孙组件使用时,就需要传很多次,会很麻烦。像这种情况,可以使用 provide 和 inject 解决这种问题,不论组件嵌套...

K8S NFS 共享存储

NFS 共享存储前面我们学习了 hostPath 与 Local PV 两种本地存储方式,但是平时我们的应用更多的是无状态服务,可能会同时发布在不同的节点上,这个时候本地存储就不适用了,往往就需要使用到共享存储了,比如最简单常用的网络共享存储 NFS,本节课我们就来介绍下如何在 Kubernetes...

vue打开新窗口并且实现传参,有图有真相

我要实现的功能是打开一个新窗口用来展示新页面,而且需要传参数,并且参数不能显示在地址栏里面,而且当我刷新页面的时候,传过来的参数不能丢失,要一直存在,除非我手动关闭这个新窗口,即浏览器的标签页。通过面向百度编程,发现网上的根本达不到这个效果,而且还都是坑,明明实现不了,还若有其事的写出来,于是我在标...

SpringCloudalibaba+Vue开发仿社交小程序-青牛白马七香车

Spring Cloud Alibaba和Vue是当今开发领域中最为流行的技术组合之一。本文将介绍如何使用Spring Cloud Alibaba和Vue开发仿社交小程序。download: https://www.97yrbl.com/t-1632.html项目概述本项目是一个仿社交小程序,包括用...

能者多劳!让NVMe固态硬盘做系统盘的同时,加速SATA数据盘

不知不觉当中,固态硬盘已经取代机械硬盘成为主流。越来越多的玩家已经淘汰机械盘,使用NVMe+SATA的固态硬盘高低搭配。既然是高低搭配,就一定会有性能差距,是否能从NVMe固态硬盘中划分出一小部分空间来给SATA固态硬盘加速,实现更好地整机性能呢?答案是肯定的,而且这一功能早已隐藏在英特尔Z170、...