python如何实现网络爬虫(Python如何从网上爬取数据)

第一步：爬取

使用request库中的get方法，请求url的网页内容

编写代码


[root@localhost demo]# touch demo.py
[root@localhost demo]# vim demo.py

登录后复制


#web爬虫学习 -- 分析
#获取页面信息
 
#输入：url
#处理：request库函数获取页面信息，并将网页内容转换成为人能看懂的编码格式
#输出：爬取到的内容
 
import requests
 
def getHTMLText(url):
    try:
        r = requests.get( url, timeout=30 )
        r.raise_for_status()    #如果状态码不是200，产生异常
        r.encoding = 'utf-8'    #字符编码格式改成 utf-8
        return r.text
    except:
        #异常处理
        return " error "
 
url = "http://www.baidu.com"
print( getHTMLText(url) )

登录后复制


[root@localhost demo]# python3 demo.py

登录后复制

第二步：分析

使用bs4库中BeautifulSoup类，生成一个对象。find()和find_all()方法可以遍历这个html文件，提取指定信息。

编写代码


[root@localhost demo]# touch demo1.py
[root@localhost demo]# vim demo1.py
#web爬虫学习 -- 分析
#获取页面信息
 
#输入：url
#处理：request库获取页面信息，并从爬取到的内容中提取关键信息
#输出：打印输出提取到的关键信息
 
import requests
from bs4 import BeautifulSoup
import re
 
def getHTMLText(url):
    try:
        r = requests.get( url, timeout=30 )
        r.raise_for_status()    #如果状态码不是200，产生异常
        r.encoding = 'utf-8'    #字符编码格式改成 utf-8
        return r.text
    except:
        #异常处理
        return " error "
 
def findHTMLText(text):
    soup = BeautifulSoup( text, "html.parser" )    #返回BeautifulSoup对象
    return soup.find_all(string=re.compile( '百度' )) #结合正则表达式，实现字符串片段匹配
 
url = "http://www.baidu.com"
text = getHTMLText(url)        #获取html文本内容
res = findHTMLText(text)    #匹配结果
 
print(res)        #打印输出

登录后复制


[root@localhost demo]# python3 demo1.py

登录后复制

以上就是python如何实现网络爬虫的详细内容，更多请关注风君子博客其它相关文章！

python如何实现网络爬虫(Python如何从网上爬取数据)

板载内存是什么意思(鼠标板载内存是什么)

艾德证券出金容易吗艾德证券好出金吗

最新文章

谷歌 DeepMind 优化 AI 模型新思路，计算效率与推理能力兼得

Karma 新跨界车现身，预计为 Ivara 概念车量产版

盘点2024年车圈大佬：谁是“雷军模仿比赛”最佳选手

拥有航母的国家（世界航母排名2021）

如何选购数码相机（如何选择相机？）

天河怎么样(天河一号)

胸部保养话术（带你了解女性这4个时期，乳房保养的技巧）

童年歌曲（15首童年歌曲）

手机相册在哪个文件夹（手机相册在电脑哪个文件夹）

微博会员有什么好处（微博上线“专属会员”，大V变现新利器）

最新评论

标签

关注我们么么哒！

python如何实现网络爬虫(Python如何从网上爬取数据)

板载内存是什么意思(鼠标板载内存是什么)

艾德证券出金容易吗 艾德证券好出金吗

最新文章

谷歌 DeepMind 优化 AI 模型新思路，计算效率与推理能力兼得

最新评论

标签

关注我们 么么哒！

关注我们的公众号

艾德证券出金容易吗艾德证券好出金吗

关注我们么么哒！