近日,科大訊飛發布了當前全國產算力平臺上唯一的深度推理大模型——訊飛星火X1,并率先應用于教育、醫療等剛需場景。
同時,訊飛星火4.0 Turbo底座能力再次迎來全新升級,圖文、數學和長文本能力顯著提升,并首發混域知識搜索技術,進一步解決行業、企業痛點。
此外,作為國內智能翻譯領域的佼佼者,科大訊飛還推出了業界首個具備端到端語音到語音同傳能力的大模型——星火語音同傳大模型,最快語音同傳時延小于5秒。
01訊飛星火X1發布,多項指標國內第一
一直以來,訊飛堅信“唯有自主可控才有通用人工智能的大未來”。面對全國產算力平臺上訓練深度推理模型遭遇的諸多挑戰,訊飛攜手華為,成功攻克了訓練推理強交互、高吞吐推理優化等一系列難題,最終成功訓練出我國首個基于全國產算力訓練的具備深度思考和推理能力的大模型——訊飛星火X1。
新發布的訊飛星火X1面對各種類型的數學問題,不僅能夠化繁為簡,模擬人類思考過程把復雜問題拆解成多個步驟進行推理,還可以根據答案正確與否進行強化訓練。
現場實機演示中,從國內的高考真題、高中奧賽題,到難度級別僅次于數學奧林匹克競賽的AIME數學競賽題,訊飛星火X1都可以準確解答。在分步驟給出準確答案的同時,清晰展示出了解題思考的過程,包括對題目中涉及到的各種概念進行理解、分析、計算,讓用戶“知其然,更知其所以然”。
近期,訊飛星火X1也參加了小初高(含競賽)、大學(含競賽)、AIME、MATH等500多項考試,取得了亮眼的成績,用更少的算力,達到業界一流的效果,多項指標國內第一。
訊飛星火X1在多個測試集中,成績亮眼
大模型的發展,應用才是硬道理。訊飛星火X1已率先在教育和醫療領域實現應用落地。
教育場景:讓教師教學更輕松,學習指導更精準
訊飛星火X1已成為北京、上海、合肥等地的教研員和老師的PLUS助手,受到老師們的表揚。搭載了訊飛星火X1的訊飛AI學習機,可以更精準的為孩子進行學習診斷和推薦指導,真正實現“因材施教”。
醫療場景:高水平輔助醫生處理疑難雜癥
基于知識反思和思維鏈技術,結合醫療循證推理技術,構建醫療復雜推理能力的X1模型,??戚o助診斷和復雜病例內涵質控目前都達到了90%。同時,訊飛已經聯合華西發布了醫學大模型“華西黌醫”,顯著提升了復雜病歷內涵質控效果;聯合北京安貞醫院發布了心臟診斷大模型,為心血管疾病的輔診推理帶來了技術突破。訊飛將在今年上半年正式發布基于X1的醫療大模型升級版,在更大范圍為醫生提供更專業更高水平的輔助。
02訊飛星火4.0 Turbo全新升級,更懂行業的大模型
此次發布,訊飛星火4.0 Turbo的底座能力也迎來了全新升級,七大能力全面提升,全面對標OpenAI 最新版的GPT-4o。
并圍繞企業客戶的落地訴求和2億+C端用戶的真實反饋,在行業知識、圖文識別、長文本等能力上進行了重點升級。
訊飛星火4.0 Turbo 七大能力提升
高價值數據訓練 行業能力全面提升
得益于行業龍頭企業合作收集整理的海量高價值文本訓練數據,及針對行業應用落地打磨的數十萬高質量行業場景的SFT數據,訊飛星火4.0 Turbo持續學習能源、金融、汽車、運營商等領域知識,成為更懂行業的大模型。
根據第三方數據,2024年,訊飛星火在大模型中標數量和中標金額上取得“雙第一”,尤其是在能源、金融、汽車、運營商等行業,與客戶共同打磨了近百個智能體應用。
訊飛星火4.0 Turbo行業能力全面提升
長文本能力提升 知識回復錯誤率下降40%
為解決企業知識問答出現的“幻覺”問題,訊飛星火4.0 Turbo研發了基于智能體的全新長文本框架,并行業首發了句子級溯源功能。這一新框架優化了超長注意力機制,同時利用大規模網頁和書籍數據進行知識關聯式合成,使得知識回復的錯誤率降低了40%,句子級溯源效果更是超越了GPT-4o,顯著緩解了問答搜索服務中因大模型幻覺而需要反復溯源確認的應用落地難題。
全新長文本框架,整體效果已超GPT-4o
圖文識別能力提升 2分鐘解析500頁文件
此次升級,訊飛星火4.0 Turbo強化了復雜場景的圖文識別能力,可以看懂各類行業文檔的復雜版面,幫助企業用戶充分利用大量的高價值數據。
比如,醫療的體檢報告、法院的文書、學術論文、企業合同、復雜產品說明書這些,里面經常有復雜長表格、雜亂板式、手寫公式、印章手寫合同、傾斜少線等等情況,星火不僅能夠準確識別,還能進行合理排版,大大降低人力成本。
訊飛星火圖文識別大模型識別效果展示
新發布的掃描文檔解析的極速版本,讓文檔理解速度提升10倍,極大縮短了處理大量行業文檔、構建私域知識庫的時間。一份500頁的項目文件,加上掃描、識別、解析的時間,只要2分鐘就能全部搞定!
掃描文檔解析極速版,大幅提升文檔掃描識別解析效率
基于行業、圖文、長文本等能力的提升,科大訊飛還行業首發了混域知識搜索技術,實現對個人知識、企業知識、業務系統數據、精品行業數據以及互聯網信息的綜合搜索,句子知識溯源準確率達90%。用戶只需一次提問,即可獲得綜合搜索后的結果,大大提升信息搜索效率。
首發混域知識搜索技術
全新升級的能力除了在訊飛星火體驗之外,也已上線在訊飛繪文、訊飛智文兩款星火原生應用。
03首發星火語音同傳大模型,媲美人類同聲傳譯
在今天的升級發布會上,針對國際交流中的高難度同傳翻譯需求,訊飛發布了國內首個具備端到端語音同傳能力的大模型——星火語音同傳大模型。
星火語音同傳大模型應用在行業展會場景
星火語音同傳大模型深度模擬人類同傳譯員的思維過程,可以聽到聲音后進行實時意群理解和切分,結合上下文語境精準選詞,并進行碎片化信息的重組,確保整個翻譯過程更加流暢。
例如,I went to iFLYTEK for a seminar at 10 o'clock yesterday 這句話的意思是“昨天十點,我去訊飛參加了一場研討會”。星火語音同傳大模型是這樣翻譯的:
首先對句子進行意群切分:I went to iFLYTEK// for a seminar// at 10 o'clock // yesterday.這句話機器直譯為“我去訊飛,為了一場研討會,在10點,昨天”現在有了大模型的生成能力做信息重組,最終就能翻譯成“我去了訊飛,去參加一場研討會,時間是昨天上午十點”
在長達5H的音視頻測試中,星火語音同傳大模型與Gemini2.0、GPT-4o等國外主流大模型相比,在內容完整度、信息準確度以及語言質量等評價維度具有領先優勢。
星火語音同傳大模型效果對比
基于星火語音同傳大模型的發布,在日常對話、醫療等專業領域,訊飛全系產品的翻譯能力得到進一步提升。
事實上,在機器翻譯和語音識別領域,訊飛有著深厚的技術積累,早在2018年科大訊飛就成功通過了全國翻譯專業資格考試,且在最近連續3屆IWSLT國際口語機器翻譯比賽都獲得了冠軍。由科大訊飛作為第一完成單位的“多語種智能語音關鍵技術及產業化”項目獲得2023年國家科學技術進步獎一等獎。這是深度學習引發全球人工智能浪潮以來,過去十年人工智能領域首個國家科學技術進步獎一等獎。
伴隨著大模型在處理復雜問題、執行多步驟任務方面展現出的潛力,未來生成式AI的應用將更加智能化,為各行各業帶來前所未有的效率提升和創新機會。
堅持自主可控的國產化路線,隨著飛星二號的算力持續到位,以及行業落地帶來的飛輪效應,訊飛將加快深度推理模型的優化迭代,推動AGI邁向新紀元。
目前,用戶可以在最新版訊飛星火App和星火網頁端上搜索“深度推理模型X1”智能體,體驗訊飛星火X1強大的數學解題能力。
-
科大訊飛
+關注
關注
19文章
818瀏覽量
61487 -
大模型
+關注
關注
2文章
2543瀏覽量
3111
原文標題:深度推理模型X1發布!訊飛星火再升級
文章出處:【微信號:訊飛開放平臺,微信公眾號:訊飛開放平臺】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論