衡阳派盒市场营销有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

vLLM項目加入PyTorch生態系統,引領LLM推理新紀元

jf_23871869 ? 來源:jf_23871869 ? 作者:jf_23871869 ? 2024-12-18 17:06 ? 次閱讀

近日,vLLM項目宣布正式成為PyTorch生態系統的一部分,標志著該項目與PyTorch的合作進入了一個全新的階段。本文將從以下幾個方面進行介紹,特別提醒:安裝方案在第四個部分,可選擇性閱讀。

vLLM項目概述

vLLM的成就與實際應用

支持流行模型

安裝與使用vLLM

總結

一,vLLM項目概述

vLLM是一個為大型語言模型(LLMs)設計的高吞吐量、內存高效的推理和服務引擎。該項目最初基于創新的PagedAttention算法構建,如今已經發展成為一個全面的、最先進的推理引擎。vLLM社區不斷為其添加新功能和優化,包括流水線并行處理、分塊預填充、推測性解碼和分離服務。

wKgZPGdikGaARrC8AAMapEZDw_Y377.png

二,vLLM的成就與實際應用

自發布以來,vLLM獲得了超過31,000個GitHub星標,這一成就證明了其受歡迎程度和社區的活力。vLLM與PyTorch的深度集成,使其能夠支持包括NVIDIA GPUAMD GPU、Google Cloud TPU在內的多種硬件后端,確保了跨平臺的兼容性和性能優化。

在今年的亞馬遜Prime Day,vLLM在向數百萬用戶提供快速響應中發揮了關鍵作用。它在三個區域的80,000個Trainium和Inferentia芯片上,每分鐘處理了300萬個令牌,同時保持了P99延遲在1秒以內的首次響應。這意味著,當客戶與亞馬遜應用中的Rufus聊天時,他們實際上是在與vLLM互動。

三,支持流行模型

vLLM與領先的模型供應商緊密合作,支持包括Meta LLAMA、Mistral、QWen和DeepSeek在內的流行模型。特別值得一提的是,vLLM作為首發合作伙伴,首次啟用了LLAMA 3.1(405B)模型,展示了其處理復雜和資源密集型語言模型的能力。

wKgZPGdikH2APXfvAAAutVrtNXY766.png

四,安裝與使用vLLM

安裝vLLM非常簡單,用戶只需在命令行中運行:

pip install vllm

vLLM既可以作為OpenAI API兼容服務器運行,也可以作為一個簡單的函數使用。以下是如何使用vLLM生成文本的示例代碼:

vllm serve meta-llama/Llama-3.1-8B

將vLLM作為簡單函數運行:

from vllm import LLM, SamplingParams

五,總結

隨著vLLM的加入,PyTorch生態系統更加強大,為LLM服務帶來了便捷和高效。期待vLLM在未來解鎖更多創新,推動AI技術的普及和發展

如果你有更好的文章,歡迎投稿!

稿件接收郵箱:nami.liu@pasuntech.com

更多精彩內容請關注“算力魔方?”!

審核編輯 黃宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 英特爾
    +關注

    關注

    61

    文章

    10007

    瀏覽量

    172335
  • pytorch
    +關注

    關注

    2

    文章

    808

    瀏覽量

    13361
  • LLM
    LLM
    +關注

    關注

    0

    文章

    299

    瀏覽量

    400
收藏 人收藏

    評論

    相關推薦

    Arm KleidiAI助力提升PyTorchLLM推理性能

    生成式人工智能 (AI) 正在科技領域發揮關鍵作用,許多企業已經開始將大語言模型 (LLM) 集成到云端和邊緣側的應用中。生成式 AI 的引入也使得許多框架和庫得以發展。其中,PyTorch 作為
    的頭像 發表于 12-03 17:05 ?927次閱讀
    Arm KleidiAI助力提升<b class='flag-5'>PyTorch</b>上<b class='flag-5'>LLM</b><b class='flag-5'>推理</b>性能

    對三星而言開放生態系統是什么

    在過去的五年里,三星投入了大量精力來建立團隊、文化和流程,成為開放生態系統的積極貢獻者。那么,為什么一家硬件公司會進行這樣的投資?其價值何在?我們如何將硬件差異化與開源和標準結合起來?
    的頭像 發表于 11-13 15:58 ?451次閱讀

    倒計時1天 | 第三屆OpenHarmony技術大會——明天,上海見!

    技術引領生態,萬物智聯創未來 OpenHarmony 開源生態 繁榮于各方共建,又賦能于千行百業 開創了萬物智聯的新紀元,開源盛事,亦是開源盛世!
    發表于 10-11 23:29

    跨越地理限制:動態海外住宅IP技術引領全球化網絡新紀元

    跨越地理限制:動態海外住宅IP技術引領全球化網絡新紀元這一主題,凸顯了動態海外住宅IP技術在全球化網絡環境中的重要作用。
    的頭像 發表于 09-27 08:30 ?361次閱讀

    能耗管理系統新紀元:智能科技引領綠色生活風尚

    能耗管理系統新紀元:智能科技引領綠色生活風尚 在科技日新月異的今天,我們的生活正經歷著前所未有的變革,而能耗管理系統作為連接環保與可持續發展的橋梁,正步入一個由智能科技
    的頭像 發表于 08-15 18:17 ?576次閱讀

    LLM大模型推理加速的關鍵技術

    LLM(大型語言模型)大模型推理加速是當前人工智能領域的一個研究熱點,旨在提高模型在處理復雜任務時的效率和響應速度。以下是對LLM大模型推理加速關鍵技術的詳細探討,內容將涵蓋模型壓縮、
    的頭像 發表于 07-24 11:38 ?1013次閱讀

    OpenAI草莓項目:引領人工智能向類人推理新紀元邁進

    在人工智能技術的浩瀚星海中,OpenAI正以其獨特的“草莓”項目引領著一場前所未有的智能革命。據權威媒體路透社的最新揭秘,這家由微軟鼎力支持的初創企業,正秘密醞釀一項旨在極大提升人工智能推理能力的革命性技術,其代號——“草莓”
    的頭像 發表于 07-16 14:37 ?473次閱讀

    tensorflow和pytorch哪個更簡單?

    工業界廣泛使用、具有豐富生態系統和跨平臺支持的框架,TensorFlow可能更適合您。以下是tensorflow和pytorch的介紹: TensorFlow和PyTorch的基本概念
    的頭像 發表于 07-05 09:45 ?977次閱讀

    蘋果硬件生態系統豐富,用戶黏性大

     蘋果以其豐富多元的硬件生態系統,涵蓋了從 iPhone 至 Mac 電腦等多種設備,每個設備都有其獨特的用戶群體。
    的頭像 發表于 04-18 11:03 ?579次閱讀

    淺談AMD Ryzen AI PC生態系統

    AMD與OEM合作伙伴聯想和華碩,以及生態系統合作伙伴百川智能、有道、游戲加加、生數、始智AI等共同努力,共慶龍年,并在大中華區擴展了Ryzen AI生態系統
    的頭像 發表于 04-11 11:05 ?818次閱讀

    萊迪思舉辦2024萊迪思技術峰會展示其強大的FPGA合作生態系統

    萊迪思半導體近日在上海舉辦的2024年萊迪思技術峰會上展示了其強大且不斷增長的全球生態系統,該生態系統由客戶、IP和參考平臺合作伙伴以及致力于推動FPGA創新的開發人員組成。
    的頭像 發表于 03-14 15:10 ?624次閱讀

    Meta欲打造巨型AI覆蓋視頻推薦生態系統

    Meta正計劃打造一款巨型AI系統,以全面覆蓋其視頻推薦生態系統,為旗下產品提供統一的視頻推薦引擎。
    的頭像 發表于 03-11 11:14 ?733次閱讀

    HTX DAO生態系統加入19個重要建設者,共同為HTX DAO生態做出貢獻

    HTX DAO生態系統加入19個重要建設者,共同為HTX DAO生態做出貢獻 隨著2月2日第十一批HTX DAO生態建設者的加入,目前,H
    的頭像 發表于 02-21 16:46 ?377次閱讀
    HTX DAO<b class='flag-5'>生態系統</b>已<b class='flag-5'>加入</b>19個重要建設者,共同為HTX DAO<b class='flag-5'>生態</b>做出貢獻

    Renesas Ready生態系統合作伙伴解決方案介紹

    電子發燒友網站提供《Renesas Ready生態系統合作伙伴解決方案介紹.pdf》資料免費下載
    發表于 02-21 09:38 ?0次下載
    Renesas Ready<b class='flag-5'>生態系統</b>合作伙伴解決方案介紹

    RA生態系統合作伙伴解決方案提供卓越的平面航向和6軸IMU性能

    電子發燒友網站提供《RA生態系統合作伙伴解決方案提供卓越的平面航向和6軸IMU性能.pdf》資料免費下載
    發表于 02-19 09:46 ?0次下載
    RA<b class='flag-5'>生態系統</b>合作伙伴解決方案提供卓越的平面航向和6軸IMU性能
    百家乐交流群号| 百家乐技术论坛| 上市百家乐.评论| 大发888真钱娱乐场| 星子县| 百家乐官网2号技术| 百家乐另类投注法| 全讯网新宝2| 百家乐官网庄闲几率| 宝龙百家乐官网的玩法技巧和规则| AG百家乐大转轮| 百利宫娱乐城官方网| 网上百家乐官网开户送现金| 百家乐闲拉长龙| 大发888为什么卡| 百家乐官网优博u2bet| 3U百家乐娱乐城| 大发888账号注册| 澳门百家乐官网才能| 百家乐论坛香港马会| 乐众娱乐| 豪享博百家乐官网的玩法技巧和规则 | 西充县| 国际娱百家乐官网的玩法技巧和规则| 粤港澳百家乐娱乐| 百家乐官网闲拉长龙| 风水学坐向24山| 大发888的概述| 中国百家乐官网技巧| 百家乐园蒙| 澳门百家乐官网什么规则| 百家乐官网3宜3忌| 百家乐官网投注| 大发888认识的见解| 百家乐官网的出千手法| 威尼斯人娱乐城筹码| 赌博百家乐官网趋势把握| 兰桂坊百家乐的玩法技巧和规则 | 百家乐官网电子作弊器| 百家乐l路单| 美高梅百家乐官网娱乐城|