衡阳派盒市场营销有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

正則表達式是什么 如何能導致拒絕服務攻擊

馬哥Linux運維 ? 來源:馬哥Linux運維 ? 作者:子沐愛掃地 ? 2022-05-13 16:38 ? 次閱讀

介紹

當您想到拒絕服務攻擊時,您會想到什么?可能是一大群機器人試圖訪問 Web 服務器的資源以使其癱瘓。好吧,這肯定是導致拒絕服務攻擊的一種方式。但是,還有一種您可能沒有聽說過的方式。它被稱為 ReDoS,是由正則表達式引起的。

正則表達式?但這怎么可能呢?那不是通過使用過濾器來匹配字符串、將字符串列入白名單和黑名單,從而使我們的工作更輕松嗎?是的,但是攻擊者也可以利用它來使應用程序(服務器)屈服。讓我們了解如何!

正則表達式是什么?

021448ee-d067-11ec-bce3-dac502259ad0.png

簡而言之,正則表達式是一種用于匹配(編程語言中)字符串的模式。讓我們通過一個示例來理解它吧,該示例是“用正則表達式在服務器端驗證電子郵件地址”。

letregex=newRegExp('[a-z0-9]+@[a-z]+.[a-z]{2,3}');
lettestEmails=["notanemail.com","workingexample@email.com","another_working@somethingelse.org","notworking@1.com"];
testEmails.forEach((address)=>{
console.log(regex.test(address))
});

上面是一段 JavaScript 代碼(譯者注:不會 JS 也無妨,對閱讀本文的影響不大,請繼續閱讀)。我們在這里使用的正則表達式是 [a-z0–9]+@[a-z]+.[a-z]{2,3}。我們提供了幾個電子郵件地址,然后我們需要檢查它們是否遵循電子郵件地址的一般模式。讓我們分解一下正則表達式。

  • [a-z0–9]+:表示此處的字符串可以是任何小寫字母和數字。末尾的加號 (+) 表示必須至少有一個字符(無論是小寫字母還是數字)。

  • @:表示此處應該有 AT(@)符。

  • [a-z]+:表示此處字符串應該包含(一個或多個)小寫字母的字符

  • .:表示此處應該有一個點(.)

  • [a-z]{2,3}:表示此處字符串是由小寫字母組成的,但其長度只能是 2 或 3。

讓我們將其與我們選擇的電子郵件 ID 進行比較。讓電子郵件 ID 為 yourremail12@yahooemail.com

  • youremail12@ 對應于 [a-z0-9]+@
  • yahooemail 對應于 [a-z]+
  • .com 對應于 .[a-z]{2,3}

這通常是正則表達式的工作方式。但這不是會按預期工作嗎?這如何能導致拒絕服務攻擊呢?讓我們了解一下。

正則表達式由正則表達式運算器處理。在 ReDoS 攻擊期間,攻擊者通過提供輸入字符串強制正則表達式運算器陷入循環。當它處于循環中時,正則表達式運算器可能會花費大量時間,并消耗大量資源。這會導致其他合法客戶端無法使用資源,并可能導致 Web 服務器和應用程序無響應并最終崩潰。

另一種情況可能是設計不良的正則表達式模式,這可能導致輸入驗證失敗,在正則表達式運算器解析時會消耗大量時間等。

有害正則表達式(Evil Regex)

有害正則表達式模式是攻擊者可以利用的正則表達式。根據 Wikipedia,這些是有害正則表達式模式的特征。

  • 正則表達式將重復(+*)應用于復雜的子表達式。
  • 對于重復的子表達式,存在一個匹配,同時該匹配也是另一個有效匹配的后綴。

這說明了如果已經有一個復雜的子表達式,并且應用一些像 +* 這樣的貪婪運算符,可能會導致一個有害的正則表達式。

例如,

我們考慮以下正則表達式:^(a+)+$

^$ 定義了字符串必須分別以 a 開頭和結尾。

如果我們提供 aaaaaaaaaaaaaaaaaaaaaaaaaaaaaa,正則表達式運算器將在幾毫秒內處理它并返回 True

如果我提供 aaaaaaaaaaaaaaaaaaaaaaaaaaaaaa!,你覺得會發生什么!

如果您運行它,則對于所提供的正則表達式,(在返回 False 之前)需要花費大約 2 秒的時間來處理。只是通過添加一個額外的感嘆號會導致這么長的時間嗎?

讓我們從正則表達式運算器的角度來看看它是如何工作的。正則表達式運算器直到達到感嘆號之前將會正常工作。由于我們沒有指定查找 (!) 標記,因此它會回溯到前面的字母,并查看是否有另一種方法來解析先前的字符,以便可以驗證整個字符串。在它最終發現絕不會返回 True 之前,這樣的回溯將會一直持續下去

如您所知,回溯會導致大量時間消耗。攻擊者可以使用它來利用有害正則表達式模式。


譯者注

看完上述內容后,有些讀者可能仍對剛才的示例(回溯)表示不解。為了讓讀者能夠更加清晰地了解其原理,我將上例中正則表達式運算器可能將執行的步驟進行了分解演示。

下列演示的過程只是存在的一種可能(實際情況取決于正則表達式引擎的實現)

回溯次數 解析結果
0 {aaaaaaaaaaaaaaaaaaaaaaaaaaaaaa}
1 {aaaaaaaaaaaaaaaaaaaaaaaaaaaaa}, {a}
2 {aaaaaaaaaaaaaaaaaaaaaaaaaaaa}, {aa}
3 {aaaaaaaaaaaaaaaaaaaaaaaaaaaa}, {a}, {a}
4 {aaaaaaaaaaaaaaaaaaaaaaaaaaa}, {aaa}
5 {aaaaaaaaaaaaaaaaaaaaaaaaaaa}, {aa}, {a}
6 {aaaaaaaaaaaaaaaaaaaaaaaaaaa}, {a}, {aa}
7 {aaaaaaaaaaaaaaaaaaaaaaaaaaa}, {a}, {a}, {a}
8 {aaaaaaaaaaaaaaaaaaaaaaaaaa}, {aaaa}
... ...
2147483647 {a}, {a}, {a}, {a}, {a}, {a}, {a}, {a}, {a}, {a}, {a}, {a}, {a}, {a}, {a}, {a}, {a}, {a}, {a}, {a}, {a}, {a}, {a}, {a}, {a}, {a}, {a}, {a}, {a}, {a}

從上面的表格可以看出,正則引擎可能會做出 (近 20 億)種解析結果。

也就是,對于示例給出的有害正則表達式和惡意字符串。如果按照我們的演示進行,設有效最長子串的長度為 ,那么回溯時間復雜度為(證明過程略,感興趣的讀者可去探究帕斯卡三角形)。該時間復雜度是指數級別,多么可怕的時間復雜度級別啊!

對于 30 個 a,僅多出一個感嘆號,執行時間竟然多出約 20 億倍。當然了,這里僅是一種可能的演示,在作者示例中的時間僅多了千倍左右。這可以從很多方面解釋,例如正則引擎的某些優化,或比例受某些較長固定執行時間的支配等。

譯者注結束


可利用性

開發人員和我們一樣都是人類,因此都會出錯。他們創建的許多應用程序可能會包含可利用的正則表達式模式。對于有經驗的黑客或安全專家來說,正則表達式模式很容易被猜到,而在有些情況下,源代碼是可以在線獲得的。攻擊者可以利用這一點來謀取利益,并可能降低被攻擊者的利益。

糟糕的正則表達式模式也可能會導致繞過許多安全控制,無論是在 Web 應用程序還是網絡防火墻上。

因此,始終建議在將應用程序部署到生產環境之前正確測試正則表達式模式。

緩解措施

  • 緩解這種情況的最佳方法是根本不去使用它。尤其當你是新手時。

  • 如有必要,請使用安全的正則表達式。這樣只需尋找另一種替換方法來完成相同的輸出。

  • 在使用正則表達式之前,請在 regex101.com 或其他在線資源等網站上測試它們。

  • 安全掃描用戶輸入永遠不會過時。

  • 現在存在著很多正則表達式運算器。我建議您使用更高效的正則表達式引擎。你可以看看 https://github.com/google/re2

  • 測試您是否正在使用易受攻擊的正則表達式引擎或運算器。例如,url-regex 是一個用于測試匹配 URL 的正則表達式的包。

結論

我們忽視的諸如此類的小事可能會給安全增加了很大的風險。在這篇文章中,我們了解了可能由有害正則表達式模式引起的 DoS 攻擊、主要原因、以及我們應如何緩解它們。有必要緩解這種情況,因為它們會影響網站的可用性,并且可能會花費您很多資金。

原文標題:正則表達式也會導致拒絕服務?探討 ReDos(可能會中招哦)

文章出處:【微信公眾號:馬哥Linux運維】歡迎添加關注!文章轉載請注明出處。

審核編輯:湯梓紅
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 服務器
    +關注

    關注

    12

    文章

    9304

    瀏覽量

    86062
  • 拒絕服務
    +關注

    關注

    0

    文章

    3

    瀏覽量

    8025
  • 正則表達式
    +關注

    關注

    0

    文章

    27

    瀏覽量

    3538

原文標題:正則表達式也會導致拒絕服務?探討 ReDos(可能會中招哦)

文章出處:【微信號:magedu-Linux,微信公眾號:馬哥Linux運維】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    什么是正則表達式正則表達式如何工作?哪些語法規則適用正則表達式

    正則表達式又稱規則表達式(Regular Expression,在代碼中常簡寫為 regex、regexp 或 RE),是一種用于匹配、查找、替換文本的強大工具。它能夠以特定的模式匹配字符串,從而
    的頭像 發表于 11-03 14:41 ?3950次閱讀
    什么是<b class='flag-5'>正則表達式</b>?<b class='flag-5'>正則表達式</b>如何工作?哪些語法規則適用<b class='flag-5'>正則表達式</b>?

    shell正則表達式學習

    正則表達式在計算機科學中,是指一個用來描述或者匹配一系列符合某個句法規則的字符串的單個字符串。在很多文本編輯器或其他工具里,正則表達式通常被用來檢索和/或替換那些符合某個模式的文本內容。許多
    發表于 07-25 17:18

    深入淺出boost正則表達式

    什么是正則表達式正則表達式是一種用來描述一定數量文本的模式。Regex代表Regular Express. 如果您不知道什么是正則表達式,請看這篇文章:深入淺出之正則表達式
    發表于 09-08 18:09 ?9次下載

    PHP正則表達式

    PHP正則表達式,PHP建設必備的的工具,初學者簡單易懂快速入門,高手進階手冊。
    發表于 04-18 10:46 ?0次下載

    精通正則表達式

    詳細的快速正則表達式的查詢電子書,簡單而豐富
    發表于 05-16 18:04 ?5次下載

    關于java正則表達式的用法詳解

    正則表達式 一個正則表達式是一個用于文本搜索的文本模式。換句話說,在文本中搜索出現的模式。例如,你可以用正則表達式搜索網頁中的郵箱地址或超鏈接。 正則表達式示例 下面是一個簡單的Jav
    發表于 09-27 14:24 ?0次下載

    快速入門IPv6和正則表達式

    對于日常開發中只接觸IPv4,并沒有深入研究過正則表達式的開發者,面對IPv6和正則表達式,容易產生畏懼心理,覺得是兩座難以翻越的大山。本文通過一些表格整理對IPv6的表示方法,以及正則表達式的特殊符號進行了分類和說明,帶領大家
    的頭像 發表于 03-30 09:31 ?9069次閱讀
    快速入門IPv6和<b class='flag-5'>正則表達式</b>

    Python正則表達式教程之標準庫的完整介紹及使用示例說明

    本文介紹了Python對于正則表達式的支持,包括正則表達式基礎以及Python正則表達式標準庫的完整介紹及使用示例。本文的內容不包括如何編寫高效的正則表達式、如何優化
    發表于 01-23 16:00 ?3次下載
    Python<b class='flag-5'>正則表達式</b>教程之標準庫的完整介紹及使用示例說明

    Python正則表達式的學習指南

    本文介紹了Python對于正則表達式的支持,包括正則表達式基礎以及Python正則表達式標準庫的完整介紹及使用示例。本文的內容不包括如何編寫高效的正則表達式、如何優化
    發表于 09-15 08:00 ?0次下載
    Python<b class='flag-5'>正則表達式</b>的學習指南

    Python正則表達式指南

    本文介紹了Python對于正則表達式的支持,包括正則表達式基礎以及Python正則表達式標準庫的完整介紹及使用示例。本文的內容不包括如何編寫高效的正則表達式、如何優化
    發表于 03-26 09:13 ?10次下載
    Python<b class='flag-5'>正則表達式</b>指南

    C語言如何使用正則表達式

    C語言的正則表達式規則,特此跟大家分享。
    的頭像 發表于 03-16 08:41 ?5015次閱讀

    python正則表達式中的常用函數

    編譯正則表達式模式,返回一個正則對象的模式。(可以把那些常用的正則表達式編譯成正則表達式對象,這樣可以提高一點效率。)
    的頭像 發表于 03-18 16:12 ?1848次閱讀

    Linux入門之正則表達式

    正則表達式是用來表達字符串匹配模式的方法,利用正則表達式,可以讓我們輕易地實現對目標字符串的**查找**、**刪除**、**替換**等操作。 正則表達式并不復雜,它并不包含難以理
    的頭像 發表于 05-12 15:31 ?938次閱讀
    Linux入門之<b class='flag-5'>正則表達式</b>

    shell腳本基礎:正則表達式grep

    在Linux上有許多命令可以使用正則表達式,其中最常見的是grep命令和sed命令。正則表達式有多種類型,每種類型中可以使用的元字符類型不同。最常見的是基本正則表達式和擴展正則表達式
    的頭像 發表于 05-29 09:29 ?1312次閱讀
    shell腳本基礎:<b class='flag-5'>正則表達式</b>grep

    Python中的正則表達式

    哈嘍大家好,我是了不起,今天給大家講Python中的正則表達式 在Python中,正則表達式是一種強大的文本處理工具,它可以用來匹配、搜索、替換文本。正則表達式是一個特殊的字符序列,它可以描述一類
    的頭像 發表于 06-21 16:52 ?1031次閱讀
    临汾玩百家乐的人在那里找| 澳门百家乐打法百家乐破解方法| 机器百家乐软件| bet365后备网址| 保时捷百家乐官网娱乐城| 三国百家乐官网的玩法技巧和规则 | 百家乐赌场技巧论坛| 蒙特卡罗国际娱乐| 太阳城娱乐城管理网| 百家乐官网娱乐平台真人娱乐平台| 百家乐巴厘岛上海在线| 现金斗地主| 百家乐官网下注技术| 澳门百家乐娱乐城网址| 博彩通3333| 跨国际百家乐官网的玩法技巧和规则 | 菲彩百家乐的玩法技巧和规则 | 世界顶级赌场酒店| 百家乐官网五种路单规| 百家乐平玩法几副牌| 至尊百家乐官网停播| 百家乐园36bol在线| 百家乐官网游戏算牌| 百家乐折叠桌| 娱乐论坛| 博E百百家乐现金网| 威尼斯人娱乐场55556| 百家乐官网娱乐城官方网| 百家乐高手技巧| 龙博娱乐城| 现金百家乐人气最高| E世博开户| 百家乐官网红桌布| 六合彩开奖查询| 百家乐官网多少钱| 大发888在线下载| 百家乐官网缩水软件| bet365怎么上不去| 七胜百家乐官网赌场娱乐网规则| 碧桂园太阳城怎么样| 百家乐官网平台信誉|