衡阳派盒市场营销有限公司

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

python多線程和多進(jìn)程的對(duì)比

python爬蟲(chóng)知識(shí)分享 ? 來(lái)源:python爬蟲(chóng)知識(shí)分享 ? 作者:python爬蟲(chóng)知識(shí)分享 ? 2022-03-15 16:42 ? 次閱讀

1. 基本概念

在開(kāi)始講解理論知識(shí)之前,先過(guò)一下幾個(gè)基本概念。雖然咱是進(jìn)階教程,但我也希望寫得更小白,更通俗易懂。

串行:一個(gè)人在同一時(shí)間段只能干一件事,譬如吃完飯才能看電視;

并行:一個(gè)人在同一時(shí)間段可以干多件事,譬如可以邊吃飯邊看電視;

Python中,多線程協(xié)程 雖然是嚴(yán)格上來(lái)說(shuō)是串行,但卻比一般的串行程序執(zhí)行效率高得很。 一般的串行程序,在程序阻塞的時(shí)候,只能干等著,不能去做其他事。就好像,電視上播完正劇,進(jìn)入廣告時(shí)間,我們卻不能去趁廣告時(shí)間是吃個(gè)飯。對(duì)于程序來(lái)說(shuō),這樣做顯然是效率極低的,是不合理的。

雖然 多線程協(xié)程 已經(jīng)相當(dāng)智能了。但還是不夠高效,最高效的應(yīng)該是一心多用,邊看電視邊吃飯邊聊天。這就是我們的 多進(jìn)程 才能做的事了。

2. 單線程VS多線程VS多進(jìn)程

文字總是蒼白無(wú)力的,不如用代碼直接來(lái)測(cè)試一下。

開(kāi)始對(duì)比之前,首先定義四種類型的場(chǎng)景

- CPU計(jì)算密集型

- 磁盤IO密集型

- 網(wǎng)絡(luò)IO密集型

- 【模擬】IO密集型

為什么是這幾種場(chǎng)景,這和多線程 多進(jìn)程的適用場(chǎng)景有關(guān)。結(jié)論里,我再說(shuō)明。

# CPU計(jì)算密集型
def count(x=1, y=1):
    # 使程序完成150萬(wàn)計(jì)算
    c = 0
    while c < 500000:
        c += 1
        x += x
        y += y


# 磁盤讀寫IO密集型
def io_disk():
    with open("file.txt", "w") as f:
        for x in range(5000000):
            f.write("python-learning\n")


# 網(wǎng)絡(luò)IO密集型
header = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/66.0.3359.139 Safari/537.36'}
url = "https://www.tieba.com/"

def io_request():
    try:
        webPage = requests.get(url, headers=header)
        html = webPage.text
        return
    except Exception as e:
        return {"error": e}


# 【模擬】IO密集型
def io_simulation():
    time.sleep(2)

比拼的指標(biāo),我們用時(shí)間來(lái)考量。時(shí)間耗費(fèi)得越少,說(shuō)明效率越高。

為了方便,使得代碼看起來(lái),更加簡(jiǎn)潔,我這里先定義是一個(gè)簡(jiǎn)單的 時(shí)間計(jì)時(shí)器 的裝飾器。 如果你對(duì)裝飾器還不是很了解,也沒(méi)關(guān)系,你只要知道它是用于 計(jì)算函數(shù)運(yùn)行時(shí)間的東西就可以了。

def timer(mode):
    def wrapper(func):
        def deco(*args, **kw):
            type = kw.setdefault('type', None)
            t1=time.time()
            func(*args, **kw)
            t2=time.time()
            cost_time = t2-t1
            print("{}-{}花費(fèi)時(shí)間:{}秒".format(mode, type,cost_time))
        return deco
    return wrapper

第一步,先來(lái)看看單線程的
@timer("【單線程】")
def single_thread(func, type=""):
    for i in range(10):
              func()

# 單線程
single_thread(count, type="CPU計(jì)算密集型")
single_thread(io_disk, type="磁盤IO密集型")
single_thread(io_request,type="網(wǎng)絡(luò)IO密集型")
single_thread(io_simulation,type="模擬IO密集型")

看看結(jié)果

【單線程】-CPU計(jì)算密集型花費(fèi)時(shí)間:83.42633867263794秒
【單線程】-磁盤IO密集型花費(fèi)時(shí)間:15.641993284225464秒
【單線程】-網(wǎng)絡(luò)IO密集型花費(fèi)時(shí)間:1.1397218704223633秒
【單線程】-模擬IO密集型花費(fèi)時(shí)間:20.020972728729248秒

第二步,再來(lái)看看多線程的

@timer("【多線程】")
def multi_thread(func, type=""):
    thread_list = []
    for i in range(10):
        t=Thread(target=func, args=())
        thread_list.append(t)
        t.start()
    e = len(thread_list)

    while True:
        for th in thread_list:
            if not th.is_alive():
                e -= 1
        if e <= 0:
            break

# 多線程
multi_thread(count, type="CPU計(jì)算密集型")
multi_thread(io_disk, type="磁盤IO密集型")
multi_thread(io_request, type="網(wǎng)絡(luò)IO密集型")
multi_thread(io_simulation, type="模擬IO密集型")

看看結(jié)果

【多線程】-CPU計(jì)算密集型花費(fèi)時(shí)間:93.82986998558044秒
【多線程】-磁盤IO密集型花費(fèi)時(shí)間:13.270896911621094秒
【多線程】-網(wǎng)絡(luò)IO密集型花費(fèi)時(shí)間:0.1828296184539795秒
【多線程】-模擬IO密集型花費(fèi)時(shí)間:2.0288875102996826秒

第三步,最后來(lái)看看多進(jìn)程

@timer("【多進(jìn)程】")
def multi_process(func, type=""):
    process_list = []
    for x in range(10):
        p = Process(target=func, args=())
        process_list.append(p)
        p.start()
    e = process_list.__len__()

    while True:
        for pr in process_list:
            if not pr.is_alive():
                e -= 1
        if e <= 0:
            break

# 多進(jìn)程
multi_process(count, type="CPU計(jì)算密集型")
multi_process(io_disk, type="磁盤IO密集型")
multi_process(io_request, type="網(wǎng)絡(luò)IO密集型")
multi_process(io_simulation, type="模擬IO密集型")

看看結(jié)果

【多進(jìn)程】-CPU計(jì)算密集型花費(fèi)時(shí)間:9.082211017608643秒
【多進(jìn)程】-磁盤IO密集型花費(fèi)時(shí)間:1.287339448928833秒
【多進(jìn)程】-網(wǎng)絡(luò)IO密集型花費(fèi)時(shí)間:0.13074755668640137秒
【多進(jìn)程】-模擬IO密集型花費(fèi)時(shí)間:2.0076842308044434秒

3. 性能對(duì)比成果總結(jié)

將結(jié)果匯總一下,制成表格。

https://file.elecfans.com//web2/M00/36/11/poYBAGIwUWCALmJbAADPTR8eNVs753.png

我們來(lái)分析下這個(gè)表格。

首先是CPU密集型,多線程以對(duì)比單線程,不僅沒(méi)有優(yōu)勢(shì),顯然還由于要不斷的加鎖釋放GIL全局鎖,切換線程而耗費(fèi)大量時(shí)間,效率低下,而多進(jìn)程,由于是多個(gè)CPU同時(shí)進(jìn)行計(jì)算工作,相當(dāng)于十個(gè)人做一個(gè)人的作業(yè),顯然效率是成倍增長(zhǎng)的。

然后是IO密集型,IO密集型可以是磁盤IO網(wǎng)絡(luò)IO數(shù)據(jù)庫(kù)IO等,都屬于同一類,計(jì)算量很小,主要是IO等待時(shí)間的浪費(fèi)。通過(guò)觀察,可以發(fā)現(xiàn),我們磁盤IO,網(wǎng)絡(luò)IO的數(shù)據(jù),多線程對(duì)比單線程也沒(méi)體現(xiàn)出很大的優(yōu)勢(shì)來(lái)。這是由于我們程序的的IO任務(wù)不夠繁重,所以優(yōu)勢(shì)不夠明顯。

所以我還加了一個(gè)「模擬IO密集型」,用sleep來(lái)模擬IO等待時(shí)間,就是為了體現(xiàn)出多線程的優(yōu)勢(shì),也能讓大家更加直觀的理解多線程的工作過(guò)程。單線程需要每個(gè)線程都要sleep(2),10個(gè)線程就是20s,而多線程,在sleep(2)的時(shí)候,會(huì)切換到其他線程,使得10個(gè)線程同時(shí)sleep(2),最終10個(gè)線程也就只有2s.

可以得出以下幾點(diǎn)結(jié)論

單線程總是最慢的,多進(jìn)程總是最快的。

多線程適合在IO密集場(chǎng)景下使用,譬如爬蟲(chóng),網(wǎng)站開(kāi)發(fā)等

多進(jìn)程適合在對(duì)CPU計(jì)算運(yùn)算要求較高的場(chǎng)景下使用,譬如大數(shù)據(jù)分析,機(jī)器學(xué)習(xí)

多進(jìn)程雖然總是最快的,但是不一定是最優(yōu)的選擇,因?yàn)樗枰狢PU資源支持下才能體現(xiàn)優(yōu)勢(shì)

審核編輯:符乾江

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 多線程
    +關(guān)注

    關(guān)注

    0

    文章

    278

    瀏覽量

    20075
  • python
    +關(guān)注

    關(guān)注

    56

    文章

    4807

    瀏覽量

    85039
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    socket 多線程編程實(shí)現(xiàn)方法

    是指在同一個(gè)進(jìn)程中運(yùn)行多個(gè)線程,每個(gè)線程可以獨(dú)立執(zhí)行任務(wù)。線程共享進(jìn)程的資源,如內(nèi)存空間和文件句柄,但每個(gè)
    的頭像 發(fā)表于 11-12 14:16 ?467次閱讀

    一文搞懂Linux進(jìn)程的睡眠和喚醒

    機(jī)制 1)信號(hào)(Signal): 進(jìn)程可以通過(guò)接受特定信號(hào)被喚醒。 2)條件變量(Condition Variable): 多線程編程中用于同步多個(gè)線程的工具,可以讓一個(gè)線程在某些
    發(fā)表于 11-04 15:15

    Python多線程多進(jìn)程的區(qū)別

    Python作為一種高級(jí)編程語(yǔ)言,提供了多種并發(fā)編程的方式,其中多線程多進(jìn)程是最常見(jiàn)的兩種方式之一。在本文中,我們將探討Python多線程
    的頭像 發(fā)表于 10-23 11:48 ?495次閱讀
    <b class='flag-5'>Python</b>中<b class='flag-5'>多線程</b>和<b class='flag-5'>多進(jìn)程</b>的區(qū)別

    一文掌握Python多線程

    使用線程可以把占據(jù)長(zhǎng)時(shí)間的程序中的任務(wù)放到后臺(tái)去處理。
    的頭像 發(fā)表于 08-05 15:46 ?921次閱讀

    ESP32會(huì)不會(huì)有多線程問(wèn)題,需要加鎖嗎?

    ESP32會(huì)不會(huì)有多線程問(wèn)題,需要加鎖嗎
    發(fā)表于 07-19 08:05

    多線程設(shè)計(jì)模式到對(duì) CompletableFuture 的應(yīng)用

    最近在開(kāi)發(fā) 延保服務(wù) 頻道頁(yè)時(shí),為了提高查詢效率,使用到了多線程技術(shù)。為了對(duì)多線程方案設(shè)計(jì)有更加充分的了解,在業(yè)余時(shí)間讀完了《圖解 Java 多線程設(shè)計(jì)模式》這本書,覺(jué)得收獲良多。本篇文章將介紹其中
    的頭像 發(fā)表于 06-26 14:18 ?431次閱讀
    從<b class='flag-5'>多線程</b>設(shè)計(jì)模式到對(duì) CompletableFuture 的應(yīng)用

    一句話讓你理解線程進(jìn)程

    今天給大家分享一下線程進(jìn)程,主要包含以下幾部分內(nèi)容:一句話說(shuō)明線程進(jìn)程操作系統(tǒng)為什么需要進(jìn)程為什么要引入
    的頭像 發(fā)表于 06-04 08:04 ?1300次閱讀
    一句話讓你理解<b class='flag-5'>線程</b>和<b class='flag-5'>進(jìn)程</b>

    bootloader開(kāi)多線程做引導(dǎo)程序,跳app初始化后直接進(jìn)hardfualt,為什么?

    如標(biāo)題,想做一個(gè)遠(yuǎn)程升級(jí)的項(xiàng)目,bootloader引導(dǎo)區(qū)域和app都是開(kāi)多線程跑的,就是自己寫了個(gè)小的任務(wù)調(diào)度器,沒(méi)什么功能主要是想讓程序快速的響應(yīng),延時(shí)不會(huì)對(duì)其他程序造成堵塞,程序測(cè)試
    發(fā)表于 04-18 06:07

    鴻蒙APP開(kāi)發(fā):【ArkTS類庫(kù)多線程】TaskPool和Worker的對(duì)比(2)

    創(chuàng)建Worker的線程稱為宿主線程(不一定是主線程,工作線程也支持創(chuàng)建Worker子線程),Worker自身的
    的頭像 發(fā)表于 03-27 15:44 ?578次閱讀
    鴻蒙APP開(kāi)發(fā):【ArkTS類庫(kù)<b class='flag-5'>多線程</b>】TaskPool和Worker的<b class='flag-5'>對(duì)比</b>(2)

    鴻蒙APP開(kāi)發(fā):【ArkTS類庫(kù)多線程】TaskPool和Worker的對(duì)比

    TaskPool(任務(wù)池)和Worker的作用是為應(yīng)用程序提供一個(gè)多線程的運(yùn)行環(huán)境,用于處理耗時(shí)的計(jì)算任務(wù)或其他密集型任務(wù)。可以有效地避免這些任務(wù)阻塞主線程,從而最大化系統(tǒng)的利用率,降低整體資源消耗,并提高系統(tǒng)的整體性能。
    的頭像 發(fā)表于 03-26 22:09 ?708次閱讀
    鴻蒙APP開(kāi)發(fā):【ArkTS類庫(kù)<b class='flag-5'>多線程</b>】TaskPool和Worker的<b class='flag-5'>對(duì)比</b>

    鴻蒙原生應(yīng)用開(kāi)發(fā)-ArkTS語(yǔ)言基礎(chǔ)類庫(kù)多線程TaskPool和Worker的對(duì)比(一)

    TaskPool(任務(wù)池)和Worker的作用是為應(yīng)用程序提供一個(gè)多線程的運(yùn)行環(huán)境,用于處理耗時(shí)的計(jì)算任務(wù)或其他密集型任務(wù)。可以有效地避免這些任務(wù)阻塞主線程,從而最大化系統(tǒng)的利用率,降低整體資源消耗
    發(fā)表于 03-25 14:11

    java實(shí)現(xiàn)多線程的幾種方式

    Java實(shí)現(xiàn)多線程的幾種方式 多線程是指程序中包含了兩個(gè)或以上的線程,每個(gè)線程都可以并行執(zhí)行不同的任務(wù)或操作。Java中的多線程可以提高程序
    的頭像 發(fā)表于 03-14 16:55 ?782次閱讀

    python中5種線程鎖盤點(diǎn)

    線程安全是多線程多進(jìn)程編程中的一個(gè)概念,在擁有共享數(shù)據(jù)的多條線程并行執(zhí)行的程序中,線程安全的代碼會(huì)通過(guò)同步機(jī)制保證各個(gè)
    發(fā)表于 03-07 11:08 ?1671次閱讀
    <b class='flag-5'>python</b>中5種<b class='flag-5'>線程</b>鎖盤點(diǎn)

    AT socket可以多線程調(diào)用嗎?

    請(qǐng)問(wèn)AT socket 可以多線程調(diào)用嗎? 有互鎖機(jī)制嗎,還是要自己做互鎖。
    發(fā)表于 03-01 08:22

    linux多線程編程實(shí)例

    linux線程
    的頭像 發(fā)表于 02-15 21:16 ?529次閱讀
    linux<b class='flag-5'>多線程</b>編程實(shí)例
    百家乐室系统软件| 足球百家乐官网投注计算| 百威百家乐的玩法技巧和规则| 百家乐官网一拖三| 太阳城娱乐城官方网| 武汉百家乐赌具| 百家乐官网大赌场娱乐网规则| 镇安县| 十三张百家乐的玩法技巧和规则| 百家乐官网皇室百家乐官网的玩法技巧和规则| 皇朝娱乐城| 威尼斯人娱乐场 五星| 百家乐破解的办法| 百家乐官网推饼| 环球娱乐城| 天博百家乐娱乐城| 百家乐网投开户| 可以玩百家乐官网的博彩公司| 足球直播| 金都百家乐的玩法技巧和规则 | 神农架林区| 大发8880| 百家乐水浒传| 在线百家乐官网策略| 百家乐官网学院教学视频| 娱乐城去澳门| 百家乐棋| 百家乐六合彩3535| 利来百家乐官网的玩法技巧和规则| 百家乐官网规则好学吗| 太阳城官网| 威尼斯人娱乐场门票| 百家乐百家乐视频游戏世界| 百合百家乐官网的玩法技巧和规则| 百家乐官网赌缆注码运用| 皇冠比分| 大发888游戏平台 46| 马德里百家乐的玩法技巧和规则 | 折式百家乐官网赌台| 正规棋牌游戏| 百家乐娱乐网送68元|