锦利国际线路检测中心招聘,卡塔尔世界杯期间中超暂停吗,百家乐玩法守则(中国)·官方网站

演講嘉賓 | 彭鑫

回顧整理 | 廖濤

排版校對 | 李萍萍

嘉賓簡介

彭鑫，復旦大學計算機科學技術學院副院長、軟件學院副院長、教授、博士生導師，中國計算機學會軟件工程專委會副主任，主要研究方向包括軟件智能化開發與運維、泛在計算軟件系統、智能網聯汽車等。獲得2016年NAS AC青年軟件創新獎，多次獲得IEEE Transactions on Software Engineering年度最佳論文獎、ACM SIGSOFT杰出論文獎、IEEE TCSE杰出論文獎等論文獎項。

內容來源

第一屆開放原子開源基金會OpenHarmony技術峰會——開發者工具分論壇

視頻回顧

打開嗶哩嗶哩APP 搜索 OpenHarmony-TSC 視頻更清晰

正文內容

軟件開發是一個知識密集型活動，涉及API、算法、業務知識、樣例代碼以及可復用庫等開發資源。然而，這些軟件開發知識和資源缺乏統一的規范化描述，難以被方便地獲取和復用。ChatGPT問世之前，學術界與工業界在智能輔助開發領域有哪些研究成果？ChatGPT爆火以后，我們又有哪些認識和思考呢？復旦大學計算機科學技術學院副院長、軟件學院副院長，中國計算機學會軟件工程專委會副主任彭鑫在第一屆OpenHarmony技術峰會上分享了精彩觀點。

智能輔助開發的一個典型場景是基于深度學習的代碼智能化推薦。以代碼大數據作為輸入，通過深度大模型訓練，再基于訓練結果進行微調或提示，最終在端側實現代碼搜索、代碼推薦、代碼生成、注釋生成、缺陷預測和修復等能力。在ChatGPT火出圈之前，主要的代碼智能化推薦產品有Copilot和AlphaCode。其中，Copilot已經實現了整函數和整方法的代碼推薦，AlphaCode在編程競賽中能夠達到人類能力的普遍水平。盡管ChatGPT的強大推薦和人機交互能力讓我們對AI和大數據深度學習產生了很多聯想，但目前大數據深度學習的思路仍存在一定的局限性。

Copilot

目前，大數據深度學習的主要思路是追求更多的數據、更大的模型、更強的算力、更好的代碼表示方法、更多元的學習范式，以此獲得更好的學習效果。而針對軟件開發的本質性困難（如：需求與設計的開放性和創造性問題、領域的多樣性和差異性問題等本質困難），以及開發人員的理解和決策問題（如：開發人員如何針對推薦內容進行選擇、判斷、理解和消化，如何開展長期維護）等方面，大數據深度學習可能并不是萬能的。大數據深度學習思路探討的根本問題，源于不同路線的選擇：（1）AI領域的端到端思路：根據輸入（功能描述）直接產生推薦結果（代碼片段或線性的代碼補全）；（2）軟件工程領域的人機協作思路：適應程序員的思考過程，從需求澄清到解決方案逐步精化，以交互的方式融入人的需求理解和經驗判斷。

軟件開發最大的浪費是知識的浪費、重復思考的浪費。在實際的軟件開發過程中，我們經常遇到如下場景：重復編寫的代碼、反復揣摩的設計意圖、重復犯過的錯誤；它們（代碼）曾經在腦海中浮現過、在交談討論和聊天記錄中出現過，甚至曾經被記錄過，但是無法在需要的時候出現；文檔基本不可靠，要么過時要么從來沒有存在過等。從長期來看，如何深層次、系統性地解決智能化軟件開發問題呢？建立共建、共享，與代碼持續協同演化的軟件開發知識平臺，能夠大幅提升軟件開發效率，保障代碼質量，促進軟件開發項目成員間的相互協作。例如，工業界“活文檔”的實踐上，實現了文檔知識和項目始終保持同步、文檔內容簡短可理解以及文檔知識集體所有等功能；在學術界，也提出了按需生成文檔的思考，即基于各種結構化和非結構化軟件制品，通過知識抽取按需生成高質量文檔。

軟件開發知識共享平臺實踐與思考

在ChatGPT問世之前，彭鑫教授所在團隊基于知識思路的智能軟件開發已經有相關嘗試和產品：

（1）API/軟件知識圖譜構建：通過API文檔中的API功能、特性、使用指南與約束等，并輸入軟件代碼庫的API樣例、軟件開發問答網站的API討論等資源，結合通用知識圖譜的概念關系進行語義標注，形成API知識圖譜或軟件開發知識圖譜，開發端側軟件開發問答機器人等，以此輔助軟件開發，提高開發效率；

API知識以及API知識圖譜

（2）基于知識圖譜的代碼概念鏈接：通過將代碼段中的關鍵內容建立概念鏈接，使開發者在軟件開發過程中，能夠便捷地了解到相關代碼的背景知識；此外，基于概念鏈接，對搜索出的代碼列表提供多方面解釋，如概念解釋、概念關聯路徑以及補充建議等，還能夠幫助開發者理解和篩選所需的代碼片段；

代碼概念鏈接

（3）基于事理圖譜的代碼異常修復：通常代碼異常可能由多種原因造成，基于開發者在開源社區上求助的代碼異常案例，抽取其求助目的、環境、代碼片段、異常癥狀以及報錯棧等內容，基于預訓練語言模型進行提示學習，構建事理圖譜，進而實現通過交互式問答獲取異常報錯相關信息，給出推薦的異常解決方案。

事理知識圖譜

在智能軟件開發領域，ChatGPT具備代碼解釋、代碼生成以及代碼修復等能力，以人機對話的形式實現了多種智能化開發輔助功能，效果已經超過了現有手段。ChatGPT的強大能力背后，是否存在一些問題和可能的改進方向呢？彭鑫教授認為有以下幾點：

通過提供相關真實項目代碼、技術文檔、人類問答等論據，增強推薦內容的可信性

結合一些專用模型或“小數據”方法改進，提高長尾及冷啟動問題回答的準確性

將大模型與搜索引擎、知識圖譜等傳統信息和知識獲取方法相結合，緩解知識更新問題

在大模型的基礎上有機融入特定領域的軟件知識和代碼，從而支持特定領域軟件開發問題

在大模型的基礎上實現智能化的開發工具集成和反饋融合，讓工具具有面向軟件開發任務現場的“具身智能”

其中，特點領域/項目軟件開發知識平臺的開發是目前學術界和工業界的研究熱點。如何協同機器智能、代碼知識和專家知識呢？需要基于專家知識和代碼規范管理，建立與代碼雙向追蹤并同步演進的代碼知識平臺，探索以代碼為核心、適應軟件開發特點的知識眾包模式。通過覆蓋實現、設計、需求等不同層面的代碼知識平臺實現系統性開發知識復用。此外，在軟件研發階段，通過建立基于DevOps流水線的軟件研發知識圖譜，能夠實現特性、缺陷、測試用例等開發制品與代碼及其變更過程的全程追溯和基于知識的描述。

特定領域 / 項目軟件開發知識平臺

得益于軟件代碼及開發數據的大量積累和人工智能技術的發展，以及近期大模型和預訓練模型方面取得的進展，使智能化軟件工程研究與實踐成為熱點。但同時，智能化軟件工程實踐落地需要充分考慮軟件工程實踐以及特定領域的特點。未來，大模型將成為智能化軟件開發的重要基礎設施，改變現有的知識獲取、抽取和利用方式；智能化輔助開發的主要問題變為如何在開發任務現場與大模型之間建立高效的雙向交互管道；下一代IDE將成為融合軟件開發項目和任務上下文及開發工具的智能化軟件開發統一門戶。期待與大家一起關注人工智能和軟件工程領域相關進展，共同貢獻國產化力量。

E N D

點擊下方閱讀原文獲取演講PPT。

關注我們，獲取更多精彩。

審核編輯黃宇

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

OpenHarmony

OpenHarmony

+關注

關注
25

文章
3747

瀏覽量
16588

明晚開播 |開源芯片系列講座第26期：奕斯偉RISC-V GCC工具鏈實踐分享

鷺島論壇開源芯片系列講座第26期「奕斯偉RISC-VGCC工具鏈實踐分享」明晚（22日）20：00精彩開播期待與您云相聚，共襄學術盛宴！|直播信息報告題目奕斯偉RISC-VGCC工具鏈

發表于 01-21 08:04 ?95次閱讀

明晚開播 |開源芯片系列講座<b class='flag-5'>第</b><b class='flag-5'>26</b><b class='flag-5'>期</b>：奕斯偉RISC-V GCC工具鏈<b class='flag-5'>實踐</b>分享

直播預約 |開源芯片系列講座第26期：奕斯偉RISC-V GCC工具鏈實踐分享

鷺島論壇開源芯片系列講座第26期「奕斯偉RISC-VGCC工具鏈實踐分享」1月22日（周三）20：00精彩開播期待與您云相聚，共襄學術盛宴！|直播信息報告題目奕斯偉RISC-VGCC工

發表于 01-14 09:52 ?198次閱讀

直播預約 |開源芯片系列講座<b class='flag-5'>第</b><b class='flag-5'>26</b><b class='flag-5'>期</b>：奕斯偉RISC-V GCC工具鏈<b class='flag-5'>實踐</b>分享

【「具身智能機器人系統」閱讀體驗】1.初步理解具身智能

重要。書中還詳細介紹了支持具身智能機器人的核心技術系統，包括自主機器人計算系統、感知系統、定位系統及規劃和控制系統。本書共分5個部分。第1部分(第1章和第2章)介紹具身

發表于 12-28 21:12

迅為iTOP-RK3568開發板驅動開發指南-第十八篇 PWM

期_SPI 第十七期_串口第十八期_PWM 第十九期_RTC 第二十期_看門狗未完待續，持續更新中... 更新內容 ◆教程更新《iTOP-RK3568開發板驅動

發表于 10-29 10:13

AI for Science：人工智能驅動科學創新》第4章-AI與生命科學讀后感

很幸運社區給我一個閱讀此書的機會，感謝平臺。《AI for Science：人工智能驅動科學創新》第4章關于AI與生命科學的部分，為我們揭示了人工智能技術在生命科學領域中的廣泛應用和

發表于 10-14 09:21

名單公布！【書籍評測活動NO.44】AI for Science：人工智能驅動科學創新

材料基因組工程的推動下，人工智能如何與材料科學結合，加快傳統材料和新型材料的開發過程。第4章介紹了人工智能在加快藥物研發、輔助基因

發表于 09-09 13:54

2024 RISC-V 中國峰會：華秋電子助力RISC-V生態！

百家業界領先企業及頂尖研究機構的專家學者，吸引了約3000名開發者、學者及行業精英親臨現場。在峰會前后，還策劃了超過20場豐富多彩的同期活動，為全球開發者提供了一個深入交流、碰撞思想、

發表于 08-26 16:46

名單公布！【書籍評測活動NO.38】OpenHarmony開發與實踐 | 基于紅莓RK2206開發板

移植，包括板級支持包（BSP）的開發和適配，以及外設驅動的開發和移植；第5章介紹了OpenHarmony操作系統的IoT組件開發，包括GPI

發表于 07-19 10:57

第二屆大會回顧第22期軟件缺陷漏洞分析

演講嘉賓 | 梁洪亮回顧整理 | 廖? ?濤排版校對 | 宋夕明嘉賓介紹 OS安全分論壇? 梁洪亮，博士，北京郵電大學副教授，博士生導師。研究興趣為可信軟件與智能系統。視頻回顧

發表于 06-27 08:42 ?409次閱讀

【大語言模型：原理與工程實踐】探索《大語言模型原理與工程實踐》2.0

《大語言模型“原理與工程實踐”》是關于大語言模型內在機理和應用實踐的一次深入探索。作者不僅深入討論了理論，還提供了豐富的實踐案例，幫助讀者理解如何將理論知識應用于解決實際問題。書中的案

發表于 05-07 10:30

第二屆大會回顧第13期 | 以架構為中心的開發者工具的核心技術與應用

演講嘉賓 | 晉武俠回顧整理 | 廖? ?濤排版校對 | 李萍萍嘉賓介紹 ?開發者工具分論壇? 晉武俠，西安交通大學軟件學院副教授。研究領域包括：代碼分析、軟件架構治理、智能軟

發表于 02-25 17:59 ?822次閱讀

第二屆大會回顧第12期 | ClarifyGPT: 基于交互式需求澄清的大模型代碼生成框架

演講嘉賓 | 石? ?琳回顧整理 | 廖? ?濤排版校對 | 李萍萍 ? 嘉賓介紹 ?開發者工具分論壇? 石琳，北京航空航天大學軟件學院教授，CCF高級會員，2022年度中國科學院軟件研究

發表于 02-25 17:58 ?1323次閱讀

第二屆大會回顧第10期 | 低時延分布式共享設備研究與探索

演講嘉賓 | 杜? ?東回顧整理 | 廖? ?濤排版校對 | 李萍萍 ? 嘉賓介紹 ?OS內核及視窗分論壇? 杜東，上海交通大學助理研究員，OpenHarmony項目群技術指導委員會并發與協同

發表于 02-25 17:52 ?600次閱讀

第二屆大會回顧第14期 | 矢量圖的高質量重建與高效繪制

訪問學者，中國計算機學會高級會員。主要從事計算機輔助設計與圖形學研究，已發表學術論文60余篇，主持參與多項國家自然科學基金項目、重點研發項目等。擔任CCF計算機輔助設計與圖形學專委會執行委員，CSIAM幾何設計與計算專委會委員，

發表于 02-23 16:24 ?417次閱讀

第二屆大會回顧第8期 | 智能終端OS的個人數據處理與保護

CCF杰出會員。主要研究領域是操作系統與系統結構，研究興趣為通過軟硬協同設計增強計算機系統的安全性、隔離性與性能。與團隊開發的系統包括：RISC-V平臺的可信執行環境系統“蓬萊”，直通式進程間調用硬件

發表于 02-21 11:52 ?471次閱讀