大模型結果“真假難辨”如何解決?對話天壤創始人、CEO薛貴榮:用這個技術丨WAIC 2023
2023-07-11 12:28:37 來源:每日經濟新聞
(相關資料圖)
7月7日下午,天壤創始人、CEO薛貴榮接受了《每日經濟新聞》記者的專訪。在2023世界人工智能大會上,該公司發布了一種大模型產品生態——“天壤小白”。其中包含最高1860億參數的通用大語言模型、語義搜索引擎和開發平臺。
目前,國內已是“百?;鞈稹保烊劳瞥龅拇竽P蜕鷳B有何別致之處呢?薛貴榮首先向記者介紹了大模型存在的四大挑戰,即大模型產生真假難辨的“幻覺”,所謂“一本正經的胡說八道”;政企私有數據的保密性要求,不能對外公開;缺少可靠的企業級中文大模型;大模型存在封閉性,無法自動更新信息。
關于天壤如何解決大模型“一本正經的胡說八道”,薛貴榮表示:“用‘提示詞’去控制大模型,大模型還是會胡說八道。后來,有人嘗試輸入一些簡單的上下文,以及對大模型進行fine-tune,但這個也不夠。我們為了解決‘幻覺’問題,做了一個語義搜索引擎。先把需要的所有文檔,放到語義引擎里面,比如法律書、知識庫或者企業內部各種數據。該引擎使用了一個核心技術,即embedding?!?/p>
薛貴榮進一步解釋:“生成式模型,最大的特點就是結果的不確定性?!蹦敲矗绾翁岣呱墒侥P偷臏蚀_性呢?
薛貴榮認為:“現在給你100個字,你的答案就在這100個字里面總結。”那么是否為了提高準確性,限定生成(內容)的范圍?薛貴榮回答稱:“你只能用這里面的內容,做一次理解上的修飾?!?/p>
據其介紹,上述限制是放在推理端。簡而言之,就是訓練好大模型,為了得出一個精確值,在推理端限定一個范圍。
薛貴榮介紹稱,目前公司主要有三個團隊,一個專門訓練大模型;第二個是Fine-tune,做行業專用模型;第三個是做應用提示。
對于天壤小白大模型通過什么算力訓練的?薛貴榮表示:“我們(基礎)大模型的算力是租的,比如租用蘇州超算(的算力),上海像商湯(的算力)我們也租。它們(商湯)有1萬多張A100。另外,我們家里也有大概300張卡,以3090為主?!?/p>
封面圖片來源:視覺中國
最近更新
- 大模型結果“真假難辨”如何解決?對話天壤2023-07-11
- 合肥誕生“可計算的數字地球”2023-07-11
- 產業 | 從家庭作坊到智慧廠房 看鳳凰嶺2023-07-11
- 福特勇猛者F力150(猛禽)邁巴特版七座豪華2023-07-11
- 海水養殖行業發展分析:我國海水養殖發展的2023-07-11
- 中國西式火腿行業市場全景調研與發展前景預2023-07-11
- 擴容提質釋放電商消費潛力 電商平臺行業市2023-07-11
- 從零售量角度分析 中國除螨儀零售量也呈現2023-07-11
- 中國煙草生產行業發展前景及投資風險預測分2023-07-11
- 我國首次實現二氧化碳長距離密相管輸2023-07-11
- 紫色康乃馨代表什么2023-07-11
- 動力有所提升!新款名爵家轎更新 8萬預算2023-07-11
- 舌華錄·清語第九·282023-07-11
- 恒生科技指數漲超2%2023-07-11
- 重大工程助力高質量發展2023-07-11
- 國家藥監局:我國成為全球第二大醫療器械市2023-07-11
- 自媒體視頻中撕律師函獲5萬多贊,律所:涉2023-07-11
- 財務核算不規范、信息披露不準確、內部控制2023-07-11
- 一手出口,一手新能源!車市“半年考”交卷2023-07-11
- 齊家網總裁邱振毅:中小家裝企業運營模式還2023-07-11
- 電池回收企業吉銳科技擬IPO 保薦機構相關2023-07-11
- 性情中人項樂宏 是160萬粉絲主播,也是樂2023-07-11
- 物聯網板塊走強 物聯網50ETF漲超2%2023-07-11
- 杰尼斯性丑聞余震,木村拓哉資生堂廣告代言2023-07-11
- 多家上市公司因在互動平臺“蹭熱點”收到關2023-07-11
- 正在直播 | 辦實事解民憂!新民晚報夏令2023-07-11
- 50多萬博士生分布地圖:近8成在省會 我國高2023-07-11
- 2023煙草生產行業發展分析 煙草生產行業發2023-07-11
- 加多寶回應被判賠廣藥集團3.17億元 資本巨2023-07-11
- 訂單激增 冰生意非?;鸨?有工廠日產50噸2023-07-11