5 月 28 日,微軟在 Build 2024 大會上推出了最新的 Phi-3 系列成員——Phi-3-vision。這一工具主打視覺應用,能有效處理圖片文字信息,且在移動設備上也能運行自如。
Phi-3-vision 是一種小型多模式語言模型(SLM),主要適用于本地人工智能場景。其模型參數高達 42 億,上下文序列包含 128k 個符號,可滿足各種視覺推理和其他任務需求。
Microsoft 通過一篇新發表的論文[PDF]展示了 Phi-3-vision 的強大實力。與其他模型如 Claude 3-haiku、Gemini 1.0 Pro 相比,Phi-3-vision 毫不遜色。
此外,Microsoft 還對 Phi-3-vision 進行了多項測試,并將其與其他競品模型進行了比較,包括字節跳動的 Llama3-Llava-Next(8B)、微軟研究院與威斯康星大學、哥倫比亞大學聯合開發的 LlaVA-1.6(7B)以及阿里巴巴通義千問 QWEN-VL-Chat 模型等。結果表明,Phi-3-vision 在多個項目中的表現均十分出色。
-
微軟
+關注
關注
4文章
6630瀏覽量
104473 -
人工智能
+關注
關注
1796文章
47683瀏覽量
240307 -
語言模型
+關注
關注
0文章
538瀏覽量
10342
發布評論請先 登錄
相關推薦
字節跳動發布豆包大模型1.5 Pro
虹軟AI視覺賦能雷鳥V3 AI拍攝眼鏡發布
Meta發布新AI模型Meta Motivo,旨在提升元宇宙體驗
微軟預覽版Copilot Vision AI功能上線
微軟發布Azure AI Foundry,推動云服務增長
在英特爾酷睿Ultra7處理器上優化和部署Phi-3-min模型
![在英特爾酷睿Ultra7處理器上優化和部署<b class='flag-5'>Phi-3</b>-min<b class='flag-5'>模型</b>](https://file1.elecfans.com/web2/M00/04/BA/wKgZombRieSATC6qAAHyCwYRvAE098.jpg)
英特爾聯手微軟,推動移動設備低功耗計算及AI解決方案
微軟發布視覺型AI新模型:Phi-3-vision
英特爾優化AI產品組合,助力微軟Phi-3家族模型
英特爾與微軟合作在其AI PC及邊緣解決方案中支持多種Phi-3模型
NVIDIA加速微軟最新的Phi-3 Mini開源語言模型
微軟發布phi-3AI模型,性能超越GPT-3.5
潞晨科技Colossal-AI + 浪潮信息AIStation,大模型開發效率提升10倍
![潞晨科技Colossal-<b class='flag-5'>AI</b> + 浪潮信息AIStation,大<b class='flag-5'>模型</b>開發<b class='flag-5'>效率</b><b class='flag-5'>提升</b>10倍](https://file1.elecfans.com//web2/M00/C3/20/wKgaomXgh7iAagsqAACRdd6hhXQ904.jpg)
評論