Stability AI推出Stable audio的文本到音頻生成人工智能平臺

Stability AI是一家主要以人工智能生成的視覺效果而聞名的公司，它推出了一個名為Stable audio的文本到音頻生成人工智能平臺。

Stable Audio使用擴散模型，與該公司更受歡迎的圖像平臺Stable diffusion的AI模型相同，但使用音頻而非圖像進行訓練。用戶可以使用它為任何項目生成歌曲或背景音頻。

音頻擴散模型傾向于生成固定長度的音頻，這對音樂制作來說很糟糕，因為歌曲的長度可能不同。Stability AI的新平臺允許用戶發(fā)出不同長度的聲音，要求公司對音樂進行訓練，并在歌曲的開始和結(jié)束時間周圍添加文本元數(shù)據(jù)。

同時，它可以實現(xiàn)實時的音頻生成，無需等待長時間的渲染過程。Stability AI 宣稱，Stable Audio 模型可以在一秒內(nèi)渲染出 95 秒的立體聲音頻，并且只需要一個 NVIDIA A100 GPU。

并且，Stable Audio是一個開源的項目，任何人都可以免費使用和修改。Stability AI 希望通過開源的方式促進 AI 領(lǐng)域的創(chuàng)新和發(fā)展，并讓更多人享受到 AI 技術(shù)帶來的便利和樂趣。

該公司在一份聲明中表示：“Stable Audio代表了Stability AI生成音頻研究實驗室Harmonai的尖端音頻生成研究。我們會繼續(xù)改進我們的模型架構(gòu)、數(shù)據(jù)集和訓練程序，以提高輸出質(zhì)量、可控性、推理速度和輸出長度。”

文本到音頻的生成并不是什么新鮮事，因為生成人工智能領(lǐng)域的其他大牌一直在玩弄這個概念。Meta于8月發(fā)布了AudioCraft，這是一套生成的人工智能模型，有助于根據(jù)提示創(chuàng)建聽起來自然的ERM、聲音和音樂。到目前為止，它只提供給研究人員和一些音頻專業(yè)人士。谷歌的MusicLM也可以讓人們產(chǎn)生聲音，但只對研究人員開放。

審核編輯：彭菁

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

音頻

音頻

+關(guān)注

關(guān)注
29

文章
2884

瀏覽量
81670
AI

AI

+關(guān)注

關(guān)注
87

文章
31155

瀏覽量
269481
人工智能

人工智能

+關(guān)注

關(guān)注
1792

文章
47442

瀏覽量
238991
模型

模型

+關(guān)注

關(guān)注
1

文章
3268

瀏覽量
48926
數(shù)據(jù)集

數(shù)據(jù)集

+關(guān)注

關(guān)注
4

文章
1208

瀏覽量
24739

原文標題：Stability AI發(fā)布AI音頻平臺Stable Audio

文章出處：【微信號：IEEE_China，微信公眾號：IEEE電氣電子工程師】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

生成式AI工具作用

生成式AI工具是指那些能夠自動生成文本、圖像、音頻、視頻等多種類型數(shù)據(jù)的人工智能技術(shù)。在此，petacloud.

發(fā)表于 10-28 11:19 ?264次閱讀

《AI for Science：人工智能驅(qū)動科學創(chuàng)新》第6章人AI與能源科學讀后感

幸得一好書，特此來分享。感謝平臺，感謝作者。受益匪淺。在閱讀《AI for Science：人工智能驅(qū)動科學創(chuàng)新》的第6章后，我深刻感受到人工智能在能源科學領(lǐng)域中的巨大潛力和廣泛應(yīng)

發(fā)表于 10-14 09:27

AI for Science：人工智能驅(qū)動科學創(chuàng)新》第4章-AI與生命科學讀后感

很幸運社區(qū)給我一個閱讀此書的機會，感謝平臺。《AI for Science：人工智能驅(qū)動科學創(chuàng)新》第4章關(guān)于AI與生命科學的部分，為我們揭示了人工

發(fā)表于 10-14 09:21

《AI for Science：人工智能驅(qū)動科學創(chuàng)新》第一章人工智能驅(qū)動的科學創(chuàng)新學習心得

周末收到一本新書，非常高興，也非常感謝平臺提供閱讀機會。這是一本挺好的書，包裝精美，內(nèi)容詳實，干活滿滿。《AI for Science：人工智能驅(qū)動科學創(chuàng)新》這本書的第一章，作為整個著作的開篇

發(fā)表于 10-14 09:12

人工智能ai4s試讀申請

目前人工智能在繪畫對話等大模型領(lǐng)域應(yīng)用廣闊，ai4s也是方興未艾。但是如何有效利用ai4s工具助力科研是個需要研究的課題，本書對ai4s基本原理和原則，方法進行描訴，有利于總結(jié)經(jīng)驗，擬

發(fā)表于 09-09 15:36

名單公布！【書籍評測活動NO.44】AI for Science：人工智能驅(qū)動科學創(chuàng)新

、污染治理、碳減排三個方面介紹了人工智能為環(huán)境科學引入的新價值和新機遇。第8章探討了AI for Science在快速發(fā)展過程中面臨的機遇和挑戰(zhàn)，并對“平臺科研”模式進行了展望。申請時間

發(fā)表于 09-09 13:54

Whatsapp正在開發(fā)一種新的生成人工智能功能

據(jù)悉，Whatsapp正在開發(fā)一種新的生成人工智能功能，該功能應(yīng)允許用戶制作自己的個性化頭像，用于任何想象中的場景。WABetaInfo在新的Android版WhatsApp測試版2.24.14.7

發(fā)表于 07-14 17:50 ?1023次閱讀

Google開發(fā)專為視頻生成配樂的人工智能技術(shù)

近日，科技巨頭Google旗下的人工智能研究實驗室DeepMind宣布了一項引人注目的技術(shù)突破——V2A技術(shù)（Video to Audio），這是一項專為視頻生成配樂的人工智能技術(shù)。這

發(fā)表于 06-20 11:03 ?520次閱讀

Stability AI發(fā)布Stable Code Instruct 3B大語言模型，可編譯多種編程語言

據(jù)報道，Stability AI公司近期推出了適配程序員使用的Stable Code Instruct 3B大語言模型，此款模型的顯著特點是能夠?qū)崿F(xiàn)編程語言間的自如切換。

發(fā)表于 03-27 10:04 ?516次閱讀

Stability AI推出全新Stable Video 3D模型

近日，Stability AI 推出了全新的 Stable Video 3D 模型，該模型以其獨特的功能吸引了眾多關(guān)注。此模型具備從單張圖像中生成

發(fā)表于 03-22 10:30 ?874次閱讀

OpenAI首席技術(shù)官穆拉蒂：Sora今年發(fā)布，音頻生成功能將提升場景呈現(xiàn)

穆拉提還提到，Sora將覆蓋音頻生成領(lǐng)域，以增強應(yīng)用效果；考慮到人工智能生成內(nèi)容有時不夠精確，OpenAI擬允許用戶自主修改、創(chuàng)建視聽內(nèi)容。

發(fā)表于 03-14 14:17 ?472次閱讀

OpenAI新年開出王炸，視頻生成模型Sora問世

近日，OpenAI在AI生成視頻領(lǐng)域取得重大突破，發(fā)布了全新的生成式人工智能模型“Sora”。該模型在視頻生成方面展現(xiàn)出了驚人的能力，通過

發(fā)表于 02-20 11:46 ?834次閱讀

Stability AI試圖通過新的圖像生成人工智能模型保持領(lǐng)先地位

Stability AI的最新圖像生成模型Stable Cascade承諾比其業(yè)界領(lǐng)先的前身Stable Diffusion更快、更強大，而

發(fā)表于 02-19 16:03 ?960次閱讀

OpenAI發(fā)布文生視頻模型Sora，引領(lǐng)AI視頻生成新紀元

在人工智能(AI)領(lǐng)域掀起新一輪革命浪潮的，正是OpenAI最新推出的文生視頻大模型——Sora。這款被業(yè)界廣泛贊譽的模型，以其“逼真”和“富有想象力”的視頻生成能力，徹底顛覆了傳統(tǒng)視

發(fā)表于 02-19 11:03 ?977次閱讀

谷歌發(fā)布Lumiere人工智能文本視頻生成器

隨著近年來AI應(yīng)用的不斷普及和改進，自動文本創(chuàng)作系統(tǒng)如ChatGPT已經(jīng)被廣泛接受，成為聊天窗口中的常客。類似地，文本到圖畫生成工具讓人們得

發(fā)表于 01-31 16:45 ?880次閱讀

IEEE電氣電子工程師
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關(guān)注個人主頁

Hot 經(jīng)久不衰的魅力來自輝光數(shù)碼管豐富多彩的歷史
Hot 《覺醒》是世界上第一款由大腦控制的虛擬現(xiàn)實游戲

New Adobe在Illustrator和Photoshop設(shè)計軟件中引入新工具和生成性AI功能
New 如何更好回收太陽能電池板

精選推薦
更多

文章

資料

帖子

ElfBoard技術(shù)貼|如何通過TF卡啟動ELF 2學習板

ElfBoard
8小時前

264 閱讀

恩智浦i.MX95打造高級數(shù)字互聯(lián)儀表盤方案顛覆兩輪車騎行體驗

NXP客棧
9小時前

316 閱讀

飛凌嵌入式i.MX8M Mini核心板已支持Linux6.1

飛凌嵌入式
9小時前

224 閱讀

DC/DC轉(zhuǎn)換器電路中MOSFET的選擇指南(上)

駿龍電子
10小時前

308 閱讀

eIQ Time Series Studio工具使用攻略(三)-工程創(chuàng)建

恩智浦MCU加油站
1天前

358 閱讀

電子鐘全套資料合集免費下載

0.34 MB

免費

114下載

OctoPod OctoPrint的免費開源客戶端

笑盡往事
3.61 MB

免費

0下載

RuoYi-Vue前后端分離權(quán)限管理系統(tǒng)

dplion5
1.94 MB

免費

0下載

PolyORB Ada語言實現(xiàn)的分布式中間件

絕代雙驕
5.34 MB

2積分

3下載

ProMicro-RP2040印刷電路板

張濤
0.18 MB

3積分

11下載

電子發(fā)燒友榮獲機械工業(yè)出版社華章板塊“2024年度優(yōu)秀合作伙伴獎”

ElecFans小喇叭
19小時前

92 閱讀

這個電路如何實現(xiàn)遠近光的切換？

LtNSee
19小時前

129 閱讀

[求助] CDS8711開發(fā)板，Keil例程使用JLINK燒錄，遇到無法識別單片機的情況

未存3308
19小時前

198 閱讀

backdrill legend 顯示參數(shù)如何編輯

jf_86378909
19小時前

251 閱讀

迅為RK3568開發(fā)板篇OpenHarmony配置HDF驅(qū)動控制LED-配置創(chuàng)建私有配置文件

jf_23361246
19小時前

202 閱讀

推薦專欄
更多

色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

搜索歷史

Stability AI推出Stable audio的文本到音頻生成人工智能平臺

評論

生成式AI工具作用

《AI for Science：人工智能驅(qū)動科學創(chuàng)新》第6章人AI與能源科學讀后感

AI for Science：人工智能驅(qū)動科學創(chuàng)新》第4章-AI與生命科學讀后感

《AI for Science：人工智能驅(qū)動科學創(chuàng)新》第一章人工智能驅(qū)動的科學創(chuàng)新學習心得

人工智能ai4s試讀申請

名單公布！【書籍評測活動NO.44】AI for Science：人工智能驅(qū)動科學創(chuàng)新

Whatsapp正在開發(fā)一種新的生成人工智能功能

Google開發(fā)專為視頻生成配樂的人工智能技術(shù)

Stability AI發(fā)布Stable Code Instruct 3B大語言模型，可編譯多種編程語言

Stability AI推出全新Stable Video 3D模型

OpenAI首席技術(shù)官穆拉蒂：Sora今年發(fā)布，音頻生成功能將提升場景呈現(xiàn)

OpenAI新年開出王炸，視頻生成模型Sora問世

Stability AI試圖通過新的圖像生成人工智能模型保持領(lǐng)先地位

OpenAI發(fā)布文生視頻模型Sora，引領(lǐng)AI視頻生成新紀元

谷歌發(fā)布Lumiere人工智能文本視頻生成器