衡阳派盒市场营销有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

RISC-V 跑大模型(二):LLaMA零基礎移植教程

澎峰科技PerfXLab ? 來源:澎峰科技PerfXLab ? 作者:澎峰科技PerfXLab ? 2023-07-17 16:16 ? 次閱讀

這是RISC-V跑大模型系列的第二篇文章,主要教大家如何將LLaMA移植到RISC-V環境里。

1. 環境準備

1)最新版Python

2)確保機器有足夠的內存加載完整模型(7B模型需要13~15G

3)下載原版LLaMA模型和擴展了的中文模型

LLaMA原版模型:

https://ipfs.io/ipfs/Qmb9y5GCkTG7ZzbBWMu2BXwMkzyCKcUjtEKPpgdZ7GEFKm/

2. 模型下載

從LLaMA原版模型地址上下載下述文件(我們使用的是7B):

wKgaomS097WAaxKzAABR0Iv83Lk708.png

最后文件下載完成后的結果如下:

wKgZomS09-GAdTAMAABac0MziDc336.png

3. 加載并啟動

1)這一步需要下載llama.cpp,請輸入以下命令進行下載和編譯:

git clone https://github.com/ggerganov/llama.cpp && cd llama.cpp && make

2)將第二步下載的文件移到llama.cpp/models/下,使用命令:

python3 convert-pth-to-ggml.py models/7B/ 0

3)將.pth模型權重轉換為ggml的FP32格式,生成文件路徑為models/7B/ggml-model-f32.bin。

wKgaomS0-H-AEYU2AAPRdhm-gs8988.png

4)運行./main二進制文件,-m命令指定Q4量化模型(也可加載ggml-FP16的模型)。以下是解碼參數

./main models/7B/ggml-model-f32.bin --color -f prompts/alpaca.txt -ins -c 256 --temp 0.2 -n 128 --repeat_penalty 1.3

參數解釋:

-ins 啟動類ChatGPT對話交流的運行模式
-f 指定prompt模板,alpaca模型請加載prompts/alpaca.txt
-c 控制上下文的長度,值越大越能參考更長的對話歷史(默認:512)
-n 控制回復生成的最大長度(默認:128)
-t 控制batch size(默認:8),可適當增加
--repeat_penalty 控制線程數量(默認:4),可適當增加
--temp 控制線程數量(默認:4),可適當增加
--top_p, top_k

控制解碼采樣的相關數據

4.結束

本篇教程到這里就結束了。是不是覺得LLaMA的速度比較慢而且不支持中文,沒關系,在下一期中,我們會為LLaMA擴充中文,并優化加速LLaMA,記得繼續關注我們哦。

另外,RISC -V跑大模型系列文章計劃分為四期:

1.RISC -V跑大模型(一)
2. RISC-V 跑大模型(二):LLaMA零基礎移植教程(本篇)
3.LLaMA擴充中文+優化加速(計劃)
4. 更多性能優化策略。(計劃)

審核編輯 黃宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • RISC-V
    +關注

    關注

    45

    文章

    2324

    瀏覽量

    46604
  • 大模型
    +關注

    關注

    2

    文章

    2551

    瀏覽量

    3174
  • LLM
    LLM
    +關注

    關注

    0

    文章

    299

    瀏覽量

    400
收藏 人收藏

    評論

    相關推薦

    RISC-V 模型(三):LLaMA中文擴展

    這是RISC-V模型系列的第三篇文章,前面我們為大家介紹了如何在RISC-V下運行LLaMA,本篇我們將會介紹如何為
    的頭像 發表于 07-17 17:15 ?874次閱讀
    <b class='flag-5'>RISC-V</b> <b class='flag-5'>跑</b>大<b class='flag-5'>模型</b>(三):<b class='flag-5'>LLaMA</b>中文擴展

    開發板上玩GTA,RISC-V多項移植項目成功運作中

    開發板上玩GTA ,RISC-V 多項移植項目成功運作中 ? RISC-V近期再度掀起了不小的熱度,蘋果招募RISC-V程序員負責其操作系統的嵌入式子系統,用于機器學習、視覺算法和信號
    的頭像 發表于 09-15 09:47 ?5105次閱讀

    安卓上RISC-V移植成最大阻礙

    安卓上RISC-V移植成最大阻礙 ? RISC-V作為一個開源架構,目前已經被諸多主流開源軟件、系統所支持,不少RISC-V廠商都以支持Linux為宣傳點。照理說同為開源的安卓系統
    的頭像 發表于 10-14 09:47 ?5828次閱讀

    有用risc-v芯片系統的嗎?

    risc-v芯片系統有什么需要注意的呢?
    發表于 03-29 21:52

    每日推薦 | HarmonyOS 從入門到大神資料,從開始寫RISC-V處理器經驗連載

    各位開發者們豐富的學習資源。為了方便大家獲取資料,現在只需掃描下面海報維碼并回復關鍵字 “教程” 即可獲取大神資料,趕快掃碼領取吧!2、從開始寫RISC-V處理器之四 實踐篇推薦理由:這里只介紹
    發表于 08-23 10:08

    目前國內RISC-V架構的MCU從程序從arm移植RISC-V難度大嗎?

    目前國內RISC-V架構的MCU從程序從arm移植RISC-V難度大嗎?
    發表于 03-09 10:00

    RISC-VuCLinux或者NO MMU的Linux的項目嗎?

    RISC-VuCLinux或者NO MMU的Linux的項目嗎?
    發表于 04-03 17:54

    RISC-V規范的演進 RISC-V何時爆發?

    的規范會有怎樣的演進?生態建設又會有什么大動作? RISC-V規范的演進 RISC-V基金會CTO Mark I.Himelstein在本周舉行的第RISC-V國際開源論壇上分享了
    的頭像 發表于 02-11 10:10 ?3251次閱讀

    ?開發板上玩GTA RISC-V多項移植項目成功運作中

    也宣布將以RISC-V架構再度進入CPU市場。 這么多大廠紛紛在RISC-V上展開動作,但RISC-V的軟件生態尚未正式進入爆發期。不過近期RISC-V軟件社區出現了多個
    的頭像 發表于 09-16 11:59 ?1882次閱讀
    ?開發板上玩GTA <b class='flag-5'>RISC-V</b>多項<b class='flag-5'>移植</b>項目成功運作中

    開始寫RISC-V處理器

    RISC-V是這兩年才開始迅速發展的,因此關于RISC-V的學習參考資料目前還很少,特別是適合入門的資料,因此學習起來進度很緩慢,于是萌生了自己從開始寫RISC-V處理器核的想法。
    發表于 03-17 09:46 ?104次下載

    RISC-V處理器的優勢是什么

    本文探討了 RISC-V 的開源硬件模型背后的好處,討論了它的壽命、可移植性和可靠性。
    的頭像 發表于 05-07 16:43 ?3681次閱讀
    <b class='flag-5'>RISC-V</b>處理器的優勢是什么

    基于RISC-V內核單片機移植RTOS實時操作系統(一)

      ARM上移植實時操作系統大家可能比較熟悉,且例程較多,對于RISC-V內核的單片機,可能相對比較陌生。下面結合WCH沁恒微電子的赤菟V103(CH32V103)和赤菟
    的頭像 發表于 01-31 12:08 ?2826次閱讀
    基于<b class='flag-5'>RISC-V</b>內核單片機<b class='flag-5'>移植</b>RTOS實時操作系統(一)

    基于RISC-V內核單片機移植RTOS實時操作系統()

      今天聊下移植RTOS時RISC-V內核時單片機任務棧保存哪些內容。
    的頭像 發表于 01-31 13:50 ?1700次閱讀
    基于<b class='flag-5'>RISC-V</b>內核單片機<b class='flag-5'>移植</b>RTOS實時操作系統(<b class='flag-5'>二</b>)

    RISC-V模型):LLaMA零基移植教程

    這是RISC-V模型系列的第篇文章,主要教大家如何將LLaMA移植
    的頭像 發表于 07-10 10:10 ?1133次閱讀
    <b class='flag-5'>RISC-V</b><b class='flag-5'>跑</b>大<b class='flag-5'>模型</b>(<b class='flag-5'>二</b>):<b class='flag-5'>LLaMA</b><b class='flag-5'>零基</b>礎<b class='flag-5'>移植</b>教程

    解鎖RISC-V技術力量丨曹英杰:RISC-V與大模型探索

    4月12日,第期“大家來談芯|解鎖RISC-V技術力量”在上海臨港新片區頂科永久會址舉辦,本期沙龍聚焦RISC-V技術,圍繞AI時代的RISC-V市場機會、
    的頭像 發表于 04-16 08:16 ?803次閱讀
    解鎖<b class='flag-5'>RISC-V</b>技術力量丨曹英杰:<b class='flag-5'>RISC-V</b>與大<b class='flag-5'>模型</b>探索
    去澳门百家乐娱乐城| 百家乐官网网站新全讯网| 百家乐棋牌游戏皇冠网| 余干县| 百家乐官网打立了| 东京太阳城王子酒店| 手机百家乐官网的玩法技巧和规则| 大发888游戏下载| 养狗对做生意风水好吗| 昌吉市| 真人百家乐玩法| 百家乐官网视频中国象棋| 金牌百家乐的玩法技巧和规则| 免佣百家乐官网的玩法| 大发888官网 平台| 邯郸百家乐园真钱区| 新手百家乐官网指点迷津| 威尼斯人娱乐场是真的吗| 太子百家乐官网娱乐城| 宁晋县| 百家乐赌台| 百家乐官网群dmwd| 百家乐官网怎么才会赢| 威尼斯人娱乐场 赌场网址| 有钱人百家乐官网的玩法技巧和规则| 99真人娱乐城| 时时博百家乐的玩法技巧和规则| 兰桂坊百家乐官网的玩法技巧和规则 | 小孟百家乐官网的玩法技巧和规则| 二八杠下载| 百家乐娱乐城网址| qq百家乐官网网络平台| 顶级赌场官方下载| 百家乐海滨网现场| 蓝盾百家乐官网娱乐场开户注册| 秭归县| 申博太阳城娱乐城| 百家乐21点游戏| 澳门玩百家乐官网的玩法技巧和规则| 宁陕县| 大发888真钱娱乐平台|