音视频基本概念介绍

基本概念

1.1. 比特率

比特率是指每秒传送的比特(bit)数。单位是比特(https://baike.baidu.com/item/%E6%AF%94%E7%89%B9)率越高,每秒传送数据就越多,画质就越清晰。声音中的比特率是指将模拟声音信号转换成数字声音信号后,单位时间内的二进制数据量,是间接衡量音频质量的一个指标。 视频中的比特率(码率)原理与声音中的相同,都是指由模拟信号转换为数字信号后,单位时间内的二进制数据量。比特率越高,表示单位时间传送的数据就越多。

  信道编码中,K符号大小的信源数据块通过编码映射为N符号大小的码字,则K/N成为码率,其中假设编码前后的符号表没有变化。
  在通信和计算机领域,比特率 (bit rate) 是指信号(用数字二进制位表示)通过系统(设备、无线电波或导线)处理或传送的速率,即单位时间内处理或传输比特的数据量。比特率经常在通信领域用作连接速度、传输速度、信道容量、最大吞吐量和数字带宽容量的同义词。
  在电信和计算机科学中。
  在数字多媒体领域,比特率是单位时间播放连续的媒体如压缩后的音频或视频的比特数量。在这个意义上讲,它相当于术语数字带宽消耗量,或吞吐量。又称“二进制位速率”,俗称“码率”。表示单位时间内传送比特的数目。用于衡量数字信息的传送速度,常写作bit/sec。根据每帧图像存储时所占的比特数和传输比特率,可以计算数字图像信息传输的速度。

  通信和计算机行业内经常利用“类似国际单位制”的前缀来表示更大的衍生单位:

1000 bit/s = 1 kbit/s (一千位每秒)
1000 kbit/s = 1 Mbit/s (一兆或一百万位每秒)
1000 Mbit/s = 1 Gbit/s (一吉比特或十亿位每秒)。
(此处K和M分别为1000和1000000,而不是涉及计算机存储器容量时的1024和1048576)

  大的比特率,使用国际单位制词头:

1,000 bps= 【1kbps】 =1,000 bit/s= 0.97656 Kibi bit/s
1,000,000 bps= 【1Mbps】 =1,000,000 bit/s= 0.95367 Mebi bit/s
1,000,000,000 bps= 【1Gbps】 =1,000,000,000 bit/s= 0.93132 Gibi bit/s

常利用比特率衡量声音和视频文件质量。例子:音频文件中: 8 kbps 通话质量, 32 kbps 中波广播质量, 96 kbps FM广播质量, 128 kbps 普通MP3质量,1411 Kbps 16位CD质量当描述比特率的时候,二进制乘数词头几乎从来不使用而基本使用国际单位制词头作为标准,十进制含义,不是旧的计算机初始的二进制含义。二进制更多的应用于单位字节/秒(byte/s),而不是电信相关的典型用法。有时在一些特殊的上下文中有必要查找单位的定义。

1.2 波特率

波特率指数据信号载波的调制速率,它用单位时间内载波调制状态改变次数来表示,其单位为波特(Baud)。 [3]

波特率有时候会同比特率混淆,实际上后者是对信息传输速率(传信率)的度量。波特率可以被理解为单位时间内传输符号的个数(传符号率),通过不同的调制方法可以在一个符号上负载多个比特信息。因此信息传输速率即比特率在数值上和波特率有这样的关系:I=SN

其中I为比特率,S为波特率,N为每个符号负载的信息量,以比特为单位。因此只有在每个符号只代表一个比特信息的情况下,例如基带二进制信号,波特率与比特率才在数值上相等,但是它们的意义并不相同。

简单来讲,比特率和波特率既有联系,又有区别。比特率描述的是数据,波特率描述的是信号。我们知道,数据是用信号来表示的。如果一个信号码元只能代表1比特,那么波特率和比特率是相等的。如果一个码元可以表示n个比特信息,那么比特率是波特率的n倍。
信号的带宽取决于波特率, 也就是说跟编码算法有关。如果编码算法可以使得每个符号(一段载波)能够传送(表示)更多的比特,则传同样的数据所需要的带宽更窄!

另外,A/D编码算法,是压缩数据量的关键,模拟语音经过不同A/D编码的算法,产生的数据量是有所不同的。

  当要将数据进行远距离传送时,往往是将数据通过调制解调技术进行传送的,即将数据信号先调制在载波上传送,如QPSK、各种QAM调制等,在接收端再通过 解调得到数据信号。数据信号在对载波调制过程中会使载波的各种参数产生变化(幅度变化、相位变化、频率变化、载波的有或无等,视调制方式而定),波特率是 描述数据信号对模拟载波调制过程中,载波每秒中变化的数值,又称为调制速率,波特率又称符号率。 在数据调制中,数据是由符号组成的,随着采用的调制技术的 不同,调制符号所映射的比特数也不同。符号又称单位码元,它是一个单元传送周期内的数据信息 。 如果一个单位码元对应二个比特数(一个二进制数有两种状态0 和1,所以为二个比特)的数据信息,那么符号率等于比特率;如果一个单位码元对应多个比特数的数据信息(m个),则称单位码元为多进制码元。

在M进制调制中,比特率Rb和波特率(符号率)Rs之间的关系为:
     Rb=Rs * log2 M
比如QPSK调制是四相位码,它的一个单位码元对应四个比特数据信息,即m=4,则比特率=2*符号率,这里“log2 m”又称为频带利用率,单位是:bps/hz。

  另外已调信号传输时,符号率(SR)和传输带宽(BW)的关系是:BW=SR(1+ α) ,α是低通滤波器的滚降系数,当它的取值为0时,频带利用率最高,占用的带宽最小,但由于波形拖尾振荡起伏大(如图5-15b),容易造成码间干扰; 当它的取值为1时,带外特性呈平坦特性,占用的带宽最大是为0时的两倍;由此可见,提高频带利用率与"拖尾"收敛相互矛盾,为此它的取值一般不小于 0.15。例如,在数字电视系统,当α=0.16时,一个模拟频道的带宽为8M,那么其符号率=8/(1+0.16)=6.896Ms/s。如果采用 64QAM调制方式,那么其比特率=6.896log2 64=6.8966=41.376Mbps 。

例如:设信道带宽为3MHz,信噪比S/N为2dB(即100倍),若传送BPSK信号则可达到的最大数据速率是多少?

带噪信道应该用香农公式计算,最大数据速率为:  

3M  ×  log2 (1+100)   bps   = 3M × 6.65 = 20MHz

对于BPSK信号,正弦载波用两种相位状态,表示1比特(0或1)。其波特率也是20MHz。      
如果传输的是QPSK的信号,一个正弦载波可以有4个不同的相位,可以表示两位二进制数位的4种信息状态。那么波特率为0.5×20MHz= 10MHz, 所以根据香农定理移项可知,只需要占用1.5MHz的带宽。

可以这样理解,对于待传输的货物(一定数目的二进制比特),用箱子(符号或者调制方式)去装货,如果每个箱子多装一点(每符号多表示几个比特),那么运的次数少一些,效率高(带宽少);反之则效率低。

1.3 采样率

  把模拟音频转成数字音频的过程,就称作采样,简单地说就是通过波形采样的方法记录1秒钟长度的声音,需要多少个数据。44KHz采样率的声音就是要花费44000个数据来描述1秒钟的声音波形。原则上采样率越高,声音的质量越好。

1.4 码元

  在数字通信中常常用时间间隔相同的符号来表示一个二进制数字,这样的时间间隔内的信号称为(二进制)码元。 而这个间隔被称为码元长度。值得注意的是当码元的离散状态有大于2个时(如M大于2个) 时,此时码元为M进制码元。也可以通俗的将码元就是一个物理实体,真实信号中可以被区分的最小物理实体,就是码元。

图左的3v和-3v就是一个码元中的两种高低变化,一个码元携带1个比特。图右的是四种,一个码元携带2个比特。

  一个脉冲信号就是一个码元,也就是图中的一个方波就是一个码元。
  看下信号脉冲的图片(有高低起伏变化)。二进制码元有两种脉冲变化形式,四进制有四种,八进制有八种。相对应的,能携带的比特数为1个,2个,3个,因为这种组合能够穷尽穷尽0和1的排列组合方式,不然接收两端对脉冲变化的定义就一定会缺斤少两。而同一时间内,不考虑复用的情况,只能有一个码元进入,所以只要双方约定好一个码元中携带的bit代表什么意思就OK。
  比如二进制码元,高低脉冲两种变化,0和1穷尽的排列方式就是0和1。相应的四进制,十进制表示为0,1,2,3。二进制穷尽组合是00,01,10,11(可以参照查看格雷码,Grey Code)。每一种变化都对应着一组排列,需要四个码元表达所有内容。八进制的十进制表示0,1,2,3,4,5,6,7,二进制穷尽组合000、001、010、011、100、101、110、111,(2^3=8也就是log2(8)=3)需要八个码元表达所有内容,相应一个码元里有3个比特。
比如 发送1314,二进制为1 11 1 100,显而易见,如果用二进制码元,只能一个个发,发7次。但如果用八进制码元,可携带3bit信息,发送四次就够了。001,011,001,100。

现在知道了“码元”,或称为“码位”,是对计算机网络传送的二进制数字中的每一位的通称。那么由若干个码元序列表示的数据单元代码通常称为“码字”。例如,二进制数字1000001是由7个码元组成的序列,可以视为一个码字。在7位ASCII码中,这个码字表示字母A。

1.5 码字

  码字(Code Word)是指利用Huffman(哈夫曼)码编码后的信号。
一帧包含m个数据位(即报文)和r个冗余位(校验位)。帧的总长度=数据位+冗余位,包含数据和校验位的第X位单元通常成为X位码字(codeword)。码字由若干个码元组成,计算机通信中通信表现为若干位二进制代码。
由于电子设备只能表示0、1两种状态,因此用电子方式处理符号是,需要对符号进行二进制编码。例如,在计算机中使用的ASCII码,就是计算机中常用符号的8位二进制编码,在实际中,也可以根据情况对字符进行特定的编码。

设某信源产生有五种符号u1、u2、u3、u4和u5,对应概率P1=0.4,P2=0.1,P3=P4=0.2,P5=0.1。首先,将符号按照概率由大到小排队,如图所示。编码时,从最小概率的两个符号开始,可选其中一个支路为0,另一支路为1。这里,我们选上支路为0,下支路为1。再将已编码的两支路的概率合并,并重新排队。多次重复使用上述方法直至合并概率归一时为止。从图(a)和(b)可以看出,两者虽平均码长相等,但同一符号可以有不同的码长,即编码方法并不唯一,其原因是两支路概率合并后重新排队时,可能出现几个支路概率相等,造成排队方法不唯一。一般,若将新合并后的支路排到等概率的最上支路,将有利于缩短码长方差,且编出的码更接近于等长码。这里图(a)的编码比(b)好。

赫夫曼码的码字(各符号的代码)是异前置码字,即任一码字不会是另一码字的前面部分,这使各码字可以连在一起传送,中间不需另加隔离符号,只要传送时不出错,收端仍可分离各个码字,不致混淆。

实际应用中,除采用定时清洗以消除误差扩散和采用缓冲存储以解决速率匹配以外,主要问题是解决小符号集合的统计匹配,例如黑(1)、白(0)传真信源的统计匹配,采用0和1不同长度游程组成扩大的符号集合信源。游程,指相同码元的长度(如二进码中连续的一串0或一串1的长度或个数)。按照CCITT标准,需要统计2×1728种游程(长度),这样,实现时的存储量太大。事实上长游程的概率很小,故CCITT还规定:若l表示游程长度,则l=64q+r。其中q称主码,r为基码。编码时,不小于64的游程长度由主码和基码组成。而当l为64的整数倍时,只用主码的代码,已不存在基码的代码。

长游程的主码和基码均用赫夫曼规则进行编码,这称为修正赫夫曼码,其结果有表可查。该方法已广泛应用于文件传真机中。

1.6 码书

码书预编码中接触到的,就是用来储存一系列预编码向量的集合;
每传输一串数据流时,可以根据某个特定的标准,从codebook中选择一个最合适的vector来对这些数据流进行预编码,优化编码,减少干扰之类的;不知道能不能简单地理解为就是通过codebook指定一个码字(Code word)。

1.7 符号

即用于表示某数字码型[据位数不同,对应不同的键控调制方式]的一定相位或幅度值的一段正弦载波[其长度即符号长度]。

符号速率即载波信号的参数(如相位)转换速率,实际上是载波状态的变化速率。符号率越高,响应的传输速率也越高,但信号中包含的频谱成分越高,占用的带宽越宽。

2、 音、视频中的应用

2.1 音频

32 kbps —MW(AM) 质量

96 kbps —FM质量

128 - 160 kbps –相当好的质量,有时有明显差别

192 kbps — 优良质量,偶尔有差别

224 - 320 kbps — 高质量

800 bps – 能够分辨的语音所需最低码率(需使用专用的FS-1015语音编解码器)

8 kbps —电话质量(使用语音编码)

8-500 kbps --Ogg Vorbis和MPEG1 Player1/2/3中使用的有损音频模式

500 kbps–1.4 Mbps —44.1KHz的无损音频,解码器为FLAC Audio,WavPackMonkey's Audio

1411.2 - 2822.4 Kbps —脉冲编码调制(PCM)声音格式CD光碟数字音频

5644.8 kbps —SACD使用的Direct Stream Digital格式

2.2 视频

16 kbps —可视电话质量(使用者可以接受的"说话的头"照片的最低要求)

128 – 384 kbps — 商业导向的视频会议系统质量

1 Mbps —VHS质量

1.25 Mbps–VCD质量(使用MPEG1压缩)

5 Mbps —DVD质量(使用MPEG2压缩)

8 – 15 Mbps —高清晰度电视(HDTV) 质量(使用H.264压缩)

29.4 Mbps –HD DVD质量

40 Mbps – 蓝光光碟(Blu-ray Disc) 质量(使用MPEG2H.264VC-1压缩)

440/880 Mbps – SonyHDCAM SR质量(SQ/HQ)

2.3 常见编码

VBR(Variable Bitrate)动态比特率也就是没有固定的比特率,压缩软件在压缩时根据音频数据即时确
定使用什么比特率,这是以质量为前提兼顾文件大小的方式,推荐编码模式;

ABR(Average Bitrate)平均比特率 是VBR的一种插值参数。LAME针对CBR不佳的文件体积比和VBR生成文件大小不定的特点独创了这种编码模式。ABR在指定的文件大小内,以每50帧(30帧约1秒)为一段,低频和不敏感频率使用相对低的流量,高频和大动态表现时使用高流量,可以做为VBR和CBR的一种折中选择。

CBR(Constant Bitrate),常数比特率指文件从头到尾都是一种位速率。相对于VBR和ABR来讲,它压缩出来的文件体积很大,而且音质相对于VBR和ABR不会有明显的提高。

2.4 码率计算公式

基本的算法是:【码率】(kbps)=【文件大小】(字节)X8/【时间】(秒)*1000

音频文件专用算法:【比特率】(kbps)=【量化采样点】(kHz)×【位深】(bit/采样点)×【声道数量】(一般为2)

举例,D5的碟,容量4.3G,其中考虑到音频的不同格式,所以算为600M,(故剩余容量为4.3*1000-600=3700M),所以视频文件应不大于3.7G,本例中取视频文件的容量为3.446G,视频长度100分钟(6000秒),计算结果:码率约等于4933kbps

2.5 码率几点原则

1、码率和质量成正比,但是文件体积也和码率成正比。

2、码率超过一定数值,对图像的质量没有多大影响。

3、DVD的容量有限,无论是标准的4.3G,还是超刻,或是D9,都有极限。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 200,841评论 5 472
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 84,415评论 2 377
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 147,904评论 0 333
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,051评论 1 272
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,055评论 5 363
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,255评论 1 278
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,729评论 3 393
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,377评论 0 255
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,517评论 1 294
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,420评论 2 317
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,467评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,144评论 3 317
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,735评论 3 303
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,812评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,029评论 1 256
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,528评论 2 346
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,126评论 2 341

推荐阅读更多精彩内容