最近在研究speex的编码和解码流程
之前在IM上用到的都是发语音片段,这个很简单,只需要找到googlecode上gauss的代码,然后套一下就可以用了。
不过googlecode要关闭,有人将他导入到了github,地址在这里 https://github.com/cczufish/OggSpeex-android
我也导入了,但是没成功,不知道什么问题,可能级别不够吧,哈哈 https://github.com/dongweiq/android-recorder
现在我们的需求是要求将语音片段拼接合成,而且要在UI中显示出正在播放的时间,看了gauss的代码后发现,他的代码是边解码边播放的,按照的是short[160]的片段一个个播放的
1 /* decode each segment, writing output to wav */ 2 for (curseg = 0; curseg < segments; curseg++) { 3 4 if (Thread.interrupted()) { 5 dis.close(); 6 track.stop(); 7 track.release(); 8 return; 9 } 10 11 while (this.isPaused()) { 12 track.stop(); 13 track.release(); 14 // Thread.sleep(100); 15 } 16 17 /* get the number of bytes in the segment */ 18 bodybytes = header[OGG_HEADERSIZE + curseg] & 0xFF; 19 if (bodybytes == 255) { 20 System.err.println("sorry, don't handle 255 sizes!"); 21 return; 22 } 23 dis.readFully(payload, 0, bodybytes); 24 chksum = OggCrc.checksum(chksum, payload, 0, bodybytes); 25 26 /* decode the segment */ 27 /* if first packet, read the Speex header */ 28 if (packetNo == 0) { 29 if (readSpeexHeader(payload, 0, bodybytes, true)) { 30 packetNo++; 31 } else { 32 packetNo = 0; 33 } 34 } else if (packetNo == 1) { // Ogg Comment packet 35 packetNo++; 36 } else { 37 38 /* get the amount of decoded data */ 39 short[] decoded = new short[160]; 40 if ((decsize = speexDecoder.decode(payload, decoded, 160)) > 0) { 41 track.write(decoded, 0, decsize); 42 float maxVol = AudioTrack.getMaxVolume(); 43 track.setStereoVolume(maxVol, maxVol);// 设置当前音量大小 44 track.play(); 45 } 46 packetNo++; 47 } 48 }
而且他还有一个包序号,pacetNo为0则是speex的文件头,占80字节,packetNo为1则查找包序号2,2中就按照160short解码音频,然后播放解码后的wav。
后来从网上找到以下内容http://blog.163.com/yuan_zhch/blog/static/193790046201172611527217/
相当于是对整个speex编码和解码的过程的总结吧
一:编码流程
使用Speex的API函数对音频数据进行压缩编码要经过如下步骤:
1、定义一个SpeexBits类型变量bits和一个Speex编码器状态变量enc_state。
2、调用speex_bits_init(&bits)初始化bits。
3、调用speex_encoder_init(&speex_nb_mode)来初始 化enc_state。其中speex_nb_mode是SpeexMode类型的变量,表示的是窄带模式。还有speex_wb_mode表示宽带模 式、speex_uwb_mode表示超宽带模式。
4、调用函数int speex_encoder_ ctl(void *state, int request, void *ptr)来设定编码器的参数,其中参数state表示编码器的状态;参数request表示要定义的参数类型,如SPEEX_ GET_ FRAME_SIZE表示设置帧大小,SPEEX_ SET_QUALITY表示量化大小,这决定了编码的质量;参数ptr表示要设定的值。
可通过speex_encoder_ctl(enc_state, SPEEX_GET_FRAME_SIZE, &frame_size) 和speex_encoder_ctl(enc_state, SPEEX_SET_QUALITY, &quality)来设定编码器的参数。
5、初始化完毕后,对每一帧声音作如下处理:调用函数 speex_bits_reset(&bits)再次设定SpeexBits,然后调用函数speex_encode(enc_state, input_frame, &bits),参数bits中保存编码后的数据流。
6、编码结束后,调用函数speex_bits_destroy (&bits), speex_encoder_destroy (enc_state)来
二:解码流程
同样,对已经编码过的音频数据进行解码要经过以下步骤:
1、 定义一个SpeexBits类型变量bits和一个Speex编码状态变量enc_state。
2、 调用speex_bits_init(&bits)初始化bits。
3、 调用speex_decoder_init (&speex_nb_mode)来初始化enc_state。
4、 调用函数speex_decoder_ctl (void *state, int request, void *ptr)来设定编码器的参数。
5、 调用函数 speex_decode(void *state, SpeexBits *bits, float *out)对参数bits中的音频数据进行解编码,参数out中保存解码后的数据流。
6、 调用函数speex_bits_destroy(&bits), speex_ decoder_ destroy (void *state)来关闭和销毁SpeexBits和解码器。
下面是一段实例代码:
- #include <speex.h>
- #include <stdio.h>
- /*帧的大小在这个例程中是一个固定的值,但它并不是必须这样*/
- #define FRAME_SIZE 160
- int main(int argc, char **argv)
- {
- char *inFile;
- FILE *fin;
- short in[FRAME_SIZE];
- float input[FRAME_SIZE];
- char cbits[200];
- int nbBytes;
- /*保存编码的状态*/
- void *state;
- /*保存字节因此他们可以被speex常规读写*/
- SpeexBits bits;
- int i, tmp;
- //新建一个新的编码状态在窄宽(narrowband)模式下
- state = speex_encoder_init(&speex_nb_mode);
- //设置质量为8(15kbps)
- tmp=8;
- speex_encoder_ctl(state, SPEEX_SET_QUALITY, &tmp);
- inFile = argv[1];
- fin = fopen(inFile, "r");
- //初始化结构使他们保存数据
- speex_bits_init(&bits);
- while (1)
- {
- //读入一帧16bits的声音
- fread(in, sizeof(short), FRAME_SIZE, fin);
- if (feof(fin))
- break;
- //把16bits的值转化为float,以便speex库可以在上面工作
- for (i=0;i<FRAME_SIZE;i++)
- input[i]=in[i];
- //清空这个结构体里所有的字节,以便我们可以编码一个新的帧
- speex_bits_reset(&bits);
- //对帧进行编码
- speex_encode(state, input, &bits);
- //把bits拷贝到一个利用写出的char型数组
- nbBytes = speex_bits_write(&bits, cbits, 200);
- //首先写出帧的大小,这是sampledec文件需要的一个值,但是你的应用程序中可能不一样
- fwrite(&nbBytes, sizeof(int), 1, stdout);
- //写出压缩后的数组
- fwrite(cbits, 1, nbBytes, stdout);
- }
- //释放编码器状态量
- speex_encoder_destroy(state);
- //释放bit_packing结构
- speex_bits_destroy(&bits);
- fclose(fin);
- return 0;
- }