一、前序
這里了解一下各個參數的含義以及一些基本概念。
聲音是連續模擬量,計算機將它離散化之后用數字表示,就有了以下幾個名詞術語。
樣本長度(sample):樣本是記錄音頻數據最基本的單位,計算機對每個通道采樣量化時數字比特位數,常見的有8位和16位。
通道數(channel):該參數為1表示單聲道,2則是立體聲。
幀(frame):幀記錄了一個聲音單元,其長度為樣本長度與通道數的乘積,一段音頻數據就是由苦干幀組成的。
采樣率(rate):每秒鐘采樣次數,該次數是針對幀而言,常用的采樣率如8KHz的人聲, 44.1KHz的mp3音樂, 96Khz的藍光音頻。
周期(period):音頻設備一次處理所需要的楨數,對于音頻設備的數據訪問以及音頻數據的存儲,都是以此為單位。
交錯模式(interleaved):是一種音頻數據的記錄方式
在交錯模式下,數據以連續楨的形式存放,即首先記錄完楨1的左聲道樣本和右聲道樣本(假設為立體聲格式),再開始楨2的記錄。
而在非交錯模式下,首先記錄的是一個周期內所有楨的左聲道樣本,再記錄右聲道樣本,數據是以連續通道的方式存儲。
不過多數情況下,我們只需要使用交錯模式就可以了。
period(周期):?硬件中中斷間的間隔時間。它表示輸入延時。
比特率(Bits Per Second):比特率表示每秒的比特數,比特率=采樣率×通道數×樣本長度
1、ALSA聲音編程介紹
ALSA表示高級Linux聲音體系結構(Advanced Linux Sound Architecture)。
它由一系列內核驅動,應用程序編譯接口(API)以及支持Linux下聲音的實用程序組成。
這篇文章里,我將簡單介紹 ALSA項目的基本框架以及它的軟件組成。主要集中介紹PCM接口編程,包括您可以自動實踐的程序示例。
您使用ALSA的原因可能就是因為它很新,但它并不是唯一可用的聲音API。如果您想完成低級的聲音操作,以便能夠最大化地控制聲音并最大化地提高性能,或者如果您使用其它聲音API沒有的特性,那么ALSA是很好的選擇。如果您已經寫了一個音頻程序,你可能想要為ALSA聲卡驅動添加本地支持。如果您對音頻不感興趣,只是想播放音頻文件,那么高級的API將是更好的選擇,比如SDL,OpenAL以及那些桌面環境提供的工具集。另外,您只能在有ALSA 支持的Linux環境中使用ALSA。
2、ALSA歷史
ALSA項目發起的起因是Linux下的聲卡驅動(OSS/Free drivers)沒有得到積極的維護。并且落后于新的聲卡技術。Jaroslav Kysela早先寫了一個聲卡驅動,并由此開始了ALSA項目,隨便,更多的開發者加入到開發隊伍中,更多的聲卡得到支持,API的結構也得到了重組。
Linux內核2.5在開發過程中,ALSA被合并到了官方的源碼樹中。在發布內核2.6后,ALSA已經內建在穩定的內核版本中并將廣泛地使用。
3、數字音頻基礎
聲音由變化的氣壓組成。它被麥克風這樣的轉換器轉換成電子形式。
模/數(ADC)轉換器將模擬電壓轉換成離散的樣本值。
聲音以固定的時間間隔被采樣,采樣的速率稱為采樣率。把樣本輸出到數/模(DAC)轉換器,比如擴音器,最后轉換成原來的模擬信號。
樣本大小以位來表示。樣本大小是影響聲音被轉換成數字信號的精確程度的因素之一。
另一個主要的因素是采樣率。奈奎斯特(Nyquist)理論中,只要離散系統的奈奎斯特頻率高于采樣信號的最高頻率或帶寬,就可以避免混疊現象。
4、ALSA基礎
ALSA由許多聲卡的聲卡驅動程序組成,同時它也提供一個稱為libasound的API庫。
應用程序開發者應該使用libasound而不是內核中的 ALSA接口。因為libasound提供最高級并且編程方便的編程接口。并且提供一個設備邏輯命名功能,這樣開發者甚至不需要知道類似設備文件這樣的低層接口。
相反,OSS/Free驅動是在內核系統調用級上編程,它要求開發者提供設備文件名并且利用ioctrl來實現相應的功能。
為了向后兼容,ALSA提供內核模塊來模擬OSS,這樣之前的許多在OSS基礎上開發的應用程序不需要任何改動就可以在ALSA上運行。另外,libaoss庫也可以模擬OSS,而它不需要內核模塊。
ALSA包含插件功能,使用插件可以擴展新的聲卡驅動,包括完全用軟件實現的虛擬聲卡。ALSA提供一系列基于命令行的工具集,比如混音器(mixer),音頻文件播放器(aplay),以及控制特定聲卡特定屬性的工具。
5、ALSA體系結構
ALSA API可以分解成以下幾個主要的接口:
1 控制接口:提供管理聲卡注冊和請求可用設備的通用功能
2 PCM接口:管理數字音頻回放(playback)和錄音(capture)的接口。本文后續總結重點放在這個接口上,因為它是開發數字音頻程序最常用到的接口。
3 Raw MIDI接口:支持MIDI(Musical Instrument Digital Interface),標準的電子樂器。這些API提供對聲卡上MIDI總線的訪問。這個原始接口基于MIDI事件工作,由程序員負責管理協議以及時間處理。
4 定時器(Timer)接口:為同步音頻事件提供對聲卡上時間處理硬件的訪問。
5 時序器(Sequencer)接口
6 混音器(Mixer)接口
6、設備命名
API庫使用邏輯設備名而不是設備文件。設備名字可以是真實的硬件名字也可以是插件名字。硬件名字使用hw:i,j這樣的格式。其中i是卡號,j是這塊聲卡上的設備號。
第一個聲音設備是hw:0,0.這個別名默認引用第一塊聲音設備并且在本文示例中一真會被用到。
插件使用另外的唯一名字,比如 plughw:,表示一個插件,這個插件不提供對硬件設備的訪問,而是提供像采樣率轉換這樣的軟件特性,硬件本身并不支持這樣的特性。
7、聲音緩存和數據傳輸
每個聲卡都有一個硬件緩存區來保存記錄下來的樣本。
當緩存區足夠滿時,聲卡將產生一個中斷。
內核聲卡驅動然后使用直接內存(DMA)訪問通道將樣本傳送到內存中的應用程序緩存區。類似地,對于回放,任何應用程序使用DMA將自己的緩存區數據傳送到聲卡的硬件緩存區中。
這樣硬件緩存區是環緩存。也就是說當數據到達緩存區末尾時將重新回到緩存區的起始位置。
ALSA維護一個指針來指向硬件緩存以及應用程序緩存區中數據操作的當前位置。
從內核外部看,我們只對應用程序的緩存區感興趣,所以本文只討論應用程序緩存區。
應用程序緩存區的大小可以通過ALSA庫函數調用來控制。
緩存區可以很大,一次傳輸操作可能會導致不可接受的延遲,我們把它稱為延時(latency)。
為了解決這個問題,ALSA將緩存區拆分成一系列周期(period)(OSS/Free中叫片斷fragments).ALSA以period為單元來傳送數據。
一個周期(period)存儲一些幀(frames)。每一幀包含時間上一個點所抓取的樣本。對于立體聲設備,一個幀會包含兩個信道上的樣本。
分解過程:一個緩存區分解成周期,然后是幀,然后是樣本。
左右信道信息被交替地存儲在一個幀內。這稱為交錯 (interleaved)模式。
在非交錯模式中,一個信道的所有樣本數據存儲在另外一個信道的數據之后。
8、Over and Under Run
當一個聲卡活動時,數據總是連續地在硬件緩存區和應用程序緩存區間傳輸。
但是也有例外。
在錄音例子中,如果應用程序讀取數據不夠快,循環緩存區將會被新的數據覆蓋。這種數據的丟失被稱為"over?? run".
在回放例子中,如果應用程序寫入數據到緩存區中的速度不夠快,緩存區將會"餓死"。這樣的錯誤被稱為"under?? run"。
在ALSA文檔中,有時將這兩種情形統稱為"XRUN"。適當地設計應用程序可以最小化XRUN并且可以從中恢復過來。
XRUN狀態又分有兩種,在播放時,用戶空間沒及時寫數據導致緩沖區空了,硬件沒有 可用數據播放導致"under?? run"; 錄制時,用戶空間沒有及時讀取數據導致緩沖區滿后溢出, 硬件錄制的數據沒有空閑緩沖可寫導致"over?? run".?
當用戶空間由于系統繁忙等原因,導致hw_ptr>appl_ptr時,緩沖區已空,內核這里有兩種方案:?
停止DMA傳輸,進入XRUN狀態。這是內核默認的處理方法。?繼續播放緩沖區的重復的音頻數據或靜音數據。?
用戶空間配置stop_threshold可選擇方案1或方案2,配置silence_threshold選擇繼 續播放的原有的音頻數據還是靜意數據了。個人經驗,偶爾的系統繁忙導致的這種狀態, 重復播放原有的音頻數據會顯得更平滑,效果更好。?
9、音頻參數(ALSA 用戶空間之 TinyAlsa)
TinyAlsa是 Android 默認的 alsalib, 封裝了內核 ALSA 的接口,用于簡化用戶空 間的 ALSA 編程。
合理的pcm_config可以做到更好的低時延和功耗,移動設備的開發優為敏感。
struct pcm_config { unsigned int channels; unsigned int rate; unsigned int period_size; unsigned int period_count; enum pcm_format format; unsigned int start_threshold; unsigned int stop_threshold; unsigned int silence_threshold; int avail_min;};
解釋一下結構中的各個參數,每個參數的單位都是frame(1幀 = 通道*采樣位深):
period_size. 每次傳輸的數據長度。值越小,時延越小,cpu占用就越高。
period_count. 緩之沖區period的個數。緩沖區越大,發生XRUN的機會就越少。
format. 定義數據格式,如采樣位深,大小端。
start_threshold. 緩沖區的數據超過該值時,硬件開始啟動數據傳輸。如果太大, 從開始播放到聲音出來時延太長,甚至可導致太短促的聲音根本播不出來;如果太小, 又可能容易導致XRUN.
stop_threshold. 緩沖區空閑區大于該值時,硬件停止傳輸。默認情況下,這個數 為整個緩沖區的大小,即整個緩沖區空了,就停止傳輸。但偶爾的原因導致緩沖區空, 如CPU忙,增大該值,繼續播放緩沖區的歷史數據,而不關閉再啟動硬件傳輸(一般此 時有明顯的聲音卡頓),可以達到更好的體驗。
silence_threshold. 這個值本來是配合stop_threshold使用,往緩沖區填充靜音 數據,這樣就不會重播歷史數據了。但如果沒有設定silence_size,這個值會生效嗎? 求解??
avail_min. 緩沖區空閑區大于該值時,pcm_mmap_write()才往緩沖寫數據。這個 值越大,往緩沖區寫入數據的次數就越少,面臨XRUN的機會就越大。Android samsung tuna 設備在screen_off時增大該值以減小功耗,在screen_on時減小該 值以減小XRUN的機會。
在不同的場景下,合理的參數就是在性能、時延、功耗等之間達到較好的平衡。
有朋友問為什么在pcm_write()/pcm_mmap_write(),而不在pcm_open()調用pcm_start()? 這是因為音頻流與其它的數據不同,實時性要求很高。作為 TinyAlsa的實現者,不能假定在調用者open之后及時的write數據,所以只能在有 數據寫入的時候start設備了。
Mixer的實現很明了,通過ioctl()調用訪問kcontrols.
10、一個典型的聲音程序
1 使用PCM的程序通常類似下面的偽代碼:
2 打開回放或錄音接口
3 設置硬件參數(訪問模式,數據格式,信道數,采樣率,等等)
4 while 有數據要被處理:
5 讀PCM數據(錄音)?或 寫PCM數據(回放)
6 關閉接口
------------------------------------------------------------------------------------------------------------------------------------------------------------------
三、實例
1、顯示了一些ALSA使用的PCM數據類型和參數。
#include int main() { int val; printf("ALSA library version: %s\n", SND_LIB_VERSION_STR); printf("\nPCM stream types:\n"); for (val = 0; val <= SND_PCM_STREAM_LAST; val++) printf(" %s\n", snd_pcm_stream_name((snd_pcm_stream_t)val)); printf("\nPCM access types:\n"); for (val = 0; val <= SND_PCM_ACCESS_LAST; val++) { printf(" %s\n", snd_pcm_access_name((snd_pcm_access_t)val)); } printf("\nPCM formats:\n"); for (val = 0; val <= SND_PCM_FORMAT_LAST; val++) { if (snd_pcm_format_name((snd_pcm_format_t)val)!= NULL) { printf(" %s (%s)\n", snd_pcm_format_name((snd_pcm_format_t)val), snd_pcm_format_description( (snd_pcm_format_t)val)); } } printf("\nPCM subformats:\n"); for (val = 0; val <= SND_PCM_SUBFORMAT_LAST;val++) { printf(" %s (%s)\n", snd_pcm_subformat_name(( snd_pcm_subformat_t)val), snd_pcm_subformat_description(( snd_pcm_subformat_t)val)); } printf("\nPCM states:\n"); for (val = 0; val <= SND_PCM_STATE_LAST; val++) printf(" %s\n", snd_pcm_state_name((snd_pcm_state_t)val)); return 0;}
首先需要做的是包括頭文件。這些頭文件包含了所有庫函數的聲明。其中之一就是顯示ALSA庫的版本。
這個程序剩下的部分的迭代一些PCM數據類型,以流類型開始。ALSA為每次迭代的最后值提供符號常量名,并且提供功能函數以顯示某個特定值的描述字符串。你將會看到,ALSA支持許多格式,在我的1.0.15版本里,支持多達36種格式。
這個程序必須鏈接到alsalib庫,通過在編譯時需要加上-lasound選項。有些alsa庫函數使用dlopen函數以及浮點操作,所以您可能還需要加上-ldl,-lm選項。
編譯:gcc -o main test.c -lasound
2、打開默認的PCM設備,設置一些硬件參數并且打印出最常用的硬件參數值
Int32 Audio_alsaSetparams(Alsa_Env *pEnv, int verbose){ Int32 err = 0; Uint32 rate, n; snd_pcm_t *handle; snd_output_t *log; snd_pcm_hw_params_t *params; snd_pcm_sw_params_t *swparams; snd_pcm_uframes_t buffer_size; snd_pcm_uframes_t start_threshold, stop_threshold; unsigned int buffer_time, period_time; handle = pEnv->handle; err = snd_output_stdio_attach(&log, stderr, 0); OSA_assert(err >= 0); snd_pcm_hw_params_alloca(¶ms); snd_pcm_sw_params_alloca(&swparams); err = snd_pcm_hw_params_any(handle, params); if (err < 0) { AUD_DEVICE_PRINT_ERROR_AND_RETURN("Broken configuration for this PCM:" "no configurations available(%s)\n", err, handle); } err = snd_pcm_hw_params_set_access(handle, params, SND_PCM_ACCESS_RW_INTERLEAVED); if (err < 0) { AUD_DEVICE_PRINT_ERROR_AND_RETURN("cannot set access type (%s)\n", err, handle); } err = snd_pcm_hw_params_set_format(handle, params, pEnv->format); if (err < 0) { AUD_DEVICE_PRINT_ERROR_AND_RETURN("cannot set sample format (%s)\n", err, handle); } err = snd_pcm_hw_params_set_channels(handle, params, pEnv->channels); if (err < 0) { AUD_DEVICE_PRINT_ERROR_AND_RETURN("cannot set channel count (%s)\n", err, handle); } rate = pEnv->rate; err = snd_pcm_hw_params_set_rate_near(handle, params, &pEnv->rate, 0); OSA_assert(err >= 0); if ((float)rate * 1.05 < pEnv->rate || (float)rate * 0.95 > pEnv->rate) { fprintf(stderr, "Warning: rate is not accurate" "(requested = %iHz, got = %iHz)\n", rate, pEnv->rate); } rate = pEnv->rate; /* following setting of period size is done only for AIC3X. Leaving default for HDMI */ if (pEnv->resample) { /* Restrict a configuration space to contain only real hardware rates. */ snd_pcm_hw_params_set_rate_resample(handle, params, 1); } buffer_time = 0; period_time = 0; if (pEnv->periods == 0) { err = snd_pcm_hw_params_get_buffer_time_max(params, &buffer_time, 0); OSA_assert(err >= 0); /* in microsecond */ if (buffer_time > 500000) buffer_time = 500000; /* 500ms */ } if (buffer_time > 0) period_time = buffer_time / 4; if (period_time > 0) err = snd_pcm_hw_params_set_period_time_near(handle, params, &period_time, 0); else err = snd_pcm_hw_params_set_period_size_near(handle, params, &pEnv->periods, 0); OSA_assert(err >= 0); if (period_time > 0) { err = snd_pcm_hw_params_set_buffer_time_near(handle, params, &buffer_time, 0); } else { buffer_size = pEnv->periods * 4; err = snd_pcm_hw_params_set_buffer_size_near(handle, params, &buffer_size); } OSA_assert(err >= 0); err = snd_pcm_hw_params(handle, params); if (err < 0) { fprintf(stderr, "cannot set alsa hw parameters %d\n", err); return err; } /* Get alsa interrupt duration */ snd_pcm_hw_params_get_period_size(params, &pEnv->periods, 0); snd_pcm_hw_params_get_buffer_size(params, &buffer_size); if (pEnv->periods == buffer_size) { fprintf(stderr, "Can't use period equal to buffer size (%lu == %lu)\n", pEnv->periods, buffer_size); return -1; } /* set software params */ snd_pcm_sw_params_current(handle, swparams); n = pEnv->periods; /* set minimum avil size -> 1 period size */ err = snd_pcm_sw_params_set_avail_min(handle, swparams, n); OSA_assert(err >= 0); n = buffer_size; /* in microsecond -> divide 1000000 */ if (pEnv->start_delay <= 0) start_threshold = n + (double)rate * pEnv->start_delay / 1000000; else start_threshold = (double)rate * pEnv->start_delay / 1000000; if (start_threshold < 1) start_threshold = 1; if (start_threshold > n) start_threshold = n; /* set pcm auto start condition */ err = snd_pcm_sw_params_set_start_threshold(handle, swparams, start_threshold); OSA_assert(err >= 0); /* in microsecond -> divide 1000000 */ if (pEnv->stop_delay <= 0) stop_threshold = buffer_size + (double)rate * pEnv->stop_delay / 1000000; else stop_threshold = (double)rate * pEnv->stop_delay / 1000000; err = snd_pcm_sw_params_set_stop_threshold(handle, swparams, stop_threshold); OSA_assert(err >= 0); err = snd_pcm_sw_params(handle, swparams); if (err < 0) { fprintf(stderr, "unable to install sw params\n"); return err; } if (verbose) snd_pcm_dump(handle, log); snd_output_close(log); return err;}
1)snd_pcm_open打開默認的PCM 設備并設置訪問模式為PLAYBACK。這個函數返回一個句柄,這個句柄保存在第一個函數參數中。該句柄會在隨后的函數中用到。像其它函數一樣,這個函數返回一個整數。
2)如果返回值小于0,則代碼函數調用出錯。如果出錯,我們用snd_errstr打開錯誤信息并退出。
3)為了設置音頻流的硬件參數,我們需要分配一個類型為snd_pcm_hw_param的變量。分配用到函數宏 snd_pcm_hw_params_alloca。
4)下一步,我們使用函數snd_pcm_hw_params_any來初始化這個變量,傳遞先前打開的 PCM流句柄。
5)接下來,我們調用API來設置我們所需的硬件參數。
這些函數需要三個參數:PCM流句柄,參數類型,參數值。
我們設置流為交錯模式,16位的樣本大小,2 個信道,44100bps的采樣率。
對于采樣率而言,聲音硬件并不一定就精確地支持我們所定的采樣率,但是我們可以使用函數 snd_pcm_hw_params_set_rate_near來設置最接近我們指定的采樣率的采樣率。
其實只有當我們調用函數 snd_pcm_hw_params后,硬件參數才會起作用。
6)程序的剩余部分獲得并打印一些PCM流參數,包括周期和緩沖區大小。結果可能會因為聲音硬件的不同而不同。
運行該程序后,做實驗,改動一些代碼。把設備名字改成hw:0,0,然后看結果是否會有變化。設置不同的硬件參數然后觀察結果的變化。
3、添加聲音回放
/*This example reads standard from input and writesto the default PCM device for 5 seconds of data.*//* Use the newer ALSA API */#define ALSA_PCM_NEW_HW_PARAMS_API#include int main() { long loops; int rc; int size; snd_pcm_t *handle; snd_pcm_hw_params_t *params; unsigned int val; int dir; snd_pcm_uframes_t frames; char *buffer; /* Open PCM device for playback. */ rc = snd_pcm_open(&handle, "default", SND_PCM_STREAM_PLAYBACK, 0); if (rc < 0) { fprintf(stderr,"unable to open pcm device: %s\n",snd_strerror(rc)); exit(1); } /* Allocate a hardware parameters object. */ snd_pcm_hw_params_alloca(?ms); /* Fill it in with default values. */ snd_pcm_hw_params_any(handle, params); /* Set the desired hardware parameters. */ /* Interleaved mode */ snd_pcm_hw_params_set_access(handle, params, SND_PCM_ACCESS_RW_INTERLEAVED); /* Signed 16-bit little-endian format */ snd_pcm_hw_params_set_format(handle, params, SND_PCM_FORMAT_S16_LE); /* Two channels (stereo) */ snd_pcm_hw_params_set_channels(handle, params, 2); /* 44100 bits/second sampling rate (CD quality) */ val = 44100; snd_pcm_hw_params_set_rate_near(handle, params, &val, &dir); /* Set period size to 32 frames. */ frames = 32; snd_pcm_hw_params_set_period_size_near(handle, params, &frames, &dir); /* Write the parameters to the driver */ rc = snd_pcm_hw_params(handle, params); if (rc < 0) { fprintf(stderr, "unable to set hw parameters: %s\n", snd_strerror(rc)); exit(1); } /* Use a buffer large enough to hold one period */ snd_pcm_hw_params_get_period_size(params, &frames, &dir); size = frames * 4; /* 2 bytes/sample, 2 channels */ buffer = (char *) malloc(size); /* We want to loop for 5 seconds */ snd_pcm_hw_params_get_period_time(params,&val, &dir); /* 5 seconds in microseconds divided by * period time */ loops = 5000000 / val; while (loops > 0) //循環錄音 5 s { loops--; rc = read(0, buffer, size); if (rc == 0) //沒有讀取到數據 { fprintf(stderr, "end of file on input\n"); break; } else if (rc != size)//實際讀取 的數據 小于 要讀取的數據 { fprintf(stderr,"short read: read %d bytes\n", rc); } rc = snd_pcm_writei(handle, buffer, frames);//寫入聲卡 (放音) if (rc == -EPIPE) { /* EPIPE means underrun */ fprintf(stderr, "underrun occurred\n"); snd_pcm_prepare(handle); } else if (rc < 0) { fprintf(stderr,"error from writei: %s\n",snd_strerror(rc)); } else if (rc != (int)frames) { fprintf(stderr,"short write, write %d frames\n", rc); } } snd_pcm_drain(handle); snd_pcm_close(handle); free(buffer); return 0;}
在這個例子中,我們從標準輸入中讀取數據,每個周期讀取足夠多的數據,然后將它們寫入到聲卡中,直到5秒鐘的數據全部傳輸完畢。
這個程序的開始處和之前的版本一樣---打開PCM設備、設置硬件參數。我們使用由ALSA自己選擇的周期大小,申請該大小的緩沖區來存儲樣本。然后我們找出周期時間,這樣我們就能計算出本程序為了能夠播放5秒鐘,需要多少個周期。
在處理數據的循環中,我們從標準輸入中讀入數據,并往緩沖區中填充一個周期的樣本。然后檢查并處理錯誤,這些錯誤可能是由到達文件結尾,或讀取的數據長度與我期望的數據長度不一致導致的。
我們調用snd_pcm_writei來發送數據。它操作起來很像內核的寫系統調用,只是這里的大小參數是以幀來計算的。我們檢查其返回代碼值。返回值為EPIPE表明發生了underrun,使得PCM音頻流進入到XRUN狀態并停止處理數據。從該狀態中恢復過來的標準方法是調用snd_pcm_prepare()函數,把PCM流置于PREPARED狀態,這樣下次我們向該PCM流中數據時,它就能重新開始處理數據。如果我們得到的錯誤碼不是EPIPE,我們把錯誤碼打印出來,然后繼續。最后,如果寫入的幀數不是我們期望的,則打印出錯誤消息。 ? ? ?
這個程序一直循環,直到5秒鐘的幀全部傳輸完,或者輸入流讀到文件結尾。然后我們調用snd_pcm_drain把所有掛起沒有傳輸完的聲音樣本傳輸完全,最后關閉該音頻流,釋放之前動態分配的緩沖區,退出。 ? ? ? ?
我們可以看到這個程序沒有什么用,除非標準輸入被重定向到了其它其它的文件。
嘗試用設備/dev/urandom來運行這個程序,該設備產生隨機數據:
./example3 ? ?
隨機數據會產生5秒鐘的白色噪聲。 ? ? ? ?
然后,嘗試把標準輸入重定向到設備/dev/null和/dev/zero上,并比較結果。改變一些參數,例如采樣率和數據格式,然后查看結果的變化。
4、添加錄音
/*This example reads from the default PCM deviceand writes to standard output for 5 seconds of data.*//* Use the newer ALSA API */#define ALSA_PCM_NEW_HW_PARAMS_API#include int main() {long loops;int rc;int size;snd_pcm_t *handle;snd_pcm_hw_params_t *params;unsigned int val;int dir;snd_pcm_uframes_t frames;char *buffer;/* Open PCM device for recording (capture). */rc = snd_pcm_open(&handle, "default", SND_PCM_STREAM_CAPTURE, 0);if (rc < 0) { fprintf(stderr, "unable to open pcm device: %s\n", snd_strerror(rc)); exit(1);}/* Allocate a hardware parameters object. */snd_pcm_hw_params_alloca(?ms);/* Fill it in with default values. */snd_pcm_hw_params_any(handle, params);/* Set the desired hardware parameters. *//* Interleaved mode */snd_pcm_hw_params_set_access(handle, params, SND_PCM_ACCESS_RW_INTERLEAVED);/* Signed 16-bit little-endian format */snd_pcm_hw_params_set_format(handle, params, SND_PCM_FORMAT_S16_LE);/* Two channels (stereo) */snd_pcm_hw_params_set_channels(handle, params, 2);/* 44100 bits/second sampling rate (CD quality) */val = 44100;snd_pcm_hw_params_set_rate_near(handle, params, &val, &dir);/* Set period size to 32 frames. */frames = 32;snd_pcm_hw_params_set_period_size_near(handle, params, &frames, &dir);/* Write the parameters to the driver */rc = snd_pcm_hw_params(handle, params);if (rc < 0) { fprintf(stderr, "unable to set hw parameters: %s\n", snd_strerror(rc)); exit(1);}/* Use a buffer large enough to hold one period */snd_pcm_hw_params_get_period_size(params, &frames, &dir);size = frames * 4; /* 2 bytes/sample, 2 channels */buffer = (char *) malloc(size);/* We want to loop for 5 seconds */snd_pcm_hw_params_get_period_time(params, &val, &dir);loops = 5000000 / val;while (loops > 0) { loops--; rc = snd_pcm_readi(handle, buffer, frames); if (rc == -EPIPE) { /* EPIPE means overrun */ fprintf(stderr, "overrun occurred\n"); snd_pcm_prepare(handle); } else if (rc < 0) { fprintf(stderr, "error from read: %s\n", snd_strerror(rc)); } else if (rc != (int)frames) { fprintf(stderr, "short read, read %d frames\n", rc); } rc = write(1, buffer, size); if (rc != size) fprintf(stderr, "short write: wrote %d bytes\n", rc);}snd_pcm_drain(handle);snd_pcm_close(handle);free(buffer);return 0;}
當打開PCM設備時我們指定打開模式為SND_PCM_STREAM_CPATURE。在主循環中,我們調用snd_pcm_readi()從聲卡中讀取數據,并把它們寫入到標準輸出。同樣地,我們檢查是否有overrun,如果存在,用與前例中相同的方式處理。
運行清單4的程序將錄制將近5秒鐘的聲音數據,并把它們發送到標準輸出。你也可以重定向到某個文件。如果你有一個麥克風連接到你的聲卡,可以使用某個混音程序(mixer)設置錄音源和級別。同樣地,你也可以運行一個CD播放器程序并把錄音源設成CD。
運行程序4并把輸出定向到某個文件,然后運行程序 3播放該文件里的聲音數據:
./listing4 ? > sound.raw
./listing3 ? < sound.raw
如果你的聲卡支持全雙工,你可以通過管道把兩個程序連接起來,這樣就可以從聲卡中聽到錄制的聲音:
./listing4 | ./listing3
同樣地,您可以做實驗,看看采樣率和樣本格式的變化會產生什么影響。
------------------------------------------------------------------------------------------------------------------------------------------------------------------
四、高級特性
在前面的例子中,PCM流是以阻塞模式操作的,也就是說,直到數據已經傳送完,PCM接口調用才會返回。在事件驅動的交互式程序中,這樣會長時間阻塞應用程序,通常是不能接受的。
ALSA支持以非阻塞模式打開音頻流,這樣讀寫函數調用后立即返回。如果數據傳輸被掛起,調用不能被處理,ALSA就是返回一個 EBUSY的錯誤碼。
許多圖形應用程序使用回調來處理事件。ALSA支持以異步的方式打開一個PCM音頻流。這使得當某個周期的樣本數據被傳輸完后,某個已注冊的回調函數將會調用。
這里用到的snd_pcm_readi()和snd_pcm_writei()調用和Linux下的讀寫系統調用類似。
字母i表示處理的幀是交錯式 (interleaved)的。ALSA中存在非交互模式的對應的函數。
Linux下的許多設備也支持mmap系統調用,這個調用將設備內存映射到主內存,這樣數據就可以用指針來維護。
ALSA也運行以mmap模式打開一個PCM信道,這允許有效的零拷貝(zero copy)方式訪問聲音數據。
最后,我希望這篇文章能夠激勵你嘗試編寫某些ALSA程序。伴隨著2.6內核在Linux發布版本(distributions)中被廣泛地使用,ALSA也將被廣泛地采用。它的高級特征將幫助Linux音頻程序更好地向前發展。
?
評論
查看更多