马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。
您需要 登录 才可以下载或查看,没有账号?注册
x
本帖最后由 子宁Zing 于 2017-3-29 11:38 编辑
第一次做音频编码,很多算法不理解,麻烦做过的大佬们解答一下。
1、Layer 2编码一帧需要的是1152个音频样点,但是编码这一帧用的是1024点FFT,那么这一帧数据的省下128个样点怎么处理?
2、功率频谱X(k)的索引k的范围是0至N/2(N=1024),且两个点之间的频率差是等宽的,即Fs/N,但是安静阈值LTq(k)根据标准查表得到只有132个值,且对应的频率差也不是等宽的,以Layer 2 采样率为32K为例,如下表所示
Index Number Frequency Crit.Band Rate Absolute Thresh.
i [Hz] [z] [dB]
1 31.25 .309 58.23
2 62.50 .617 33.44
3 93.75 .925 24.17
4 125.00 1.232 19.20
5 156.25 1.538 16.05
6 187.50 1.842 13.87
7 218.75 2.145 12.26
8 250.00 2.445 11.01
9 281.25 2.742 10.01
10 312.50 3.037 9.20
11 343.75 3.329 8.52
12 375.00 3.618 7.94
13 406.25 3.903 7.44
14 437.50 4.185 7.00
15 468.75 4.463 6.62
16 500.00 4.736 6.28
17 531.25 5.006 5.97
18 562.50 5.272 5.70
19 593.75 5.533 5.44
20 625.00 5.789 5.21
21 656.25 6.041 5.00
22 687.50 6.289 4.80
23 718.75 6.532 4.62
24 750.00 6.770 4.45
25 781.25 7.004 4.29
26 812.50 7.233 4.14
27 843.75 7.457 4.00
28 875.00 7.677 3.86
29 906.25 7.892 3.73
30 937.50 8.103 3.61
31 968.75 8.309 3.49
32 1000.00 8.511 3.37
33 1031.25 8.708 3.26
34 1062.50 8.901 3.15
35 1093.75 9.090 3.04
36 1125.00 9.275 2.93
37 1156.25 9.456 2.83
38 1187.50 9.632 2.73
39 1218.75 9.805 2.63
40 1250.00 9.974 2.53
41 1281.25 10.139 2.42
42 1312.50 10.301 2.32
43 1343.75 10.459 2.22
44 1375.00 10.614 2.12
45 1406.25 10.765 2.02
46 1437.50 10.913 1.92
47 1468.75 11.058 1.81
48 1500.00 11.199 1.71
49 1562.50 11.474 1.49
50 1625.00 11.736 1.27
51 1687.50 11.988 1.04
52 1750.00 12.230 .80
53 1812.50 12.461 .55
54 1875.00 12.684 .29
55 1937.50 12.898 .02
56 2000.00 13.104 -.25
57 2062.50 13.302 -.54
58 2125.00 13.493 -.83
59 2187.50 13.678 -1.12
60 2250.00 13.855 -1.43
61 2312.50 14.027 -1.73
62 2375.00 14.193 -2.04
63 2437.50 14.354 -2.34
64 2500.00 14.509 -2.64
65 2562.50 14.660 -2.93
66 2625.00 14.807 -3.22
67 2687.50 14.949 -3.49
68 2750.00 15.087 -3.74
69 2812.50 15.221 -3.98
70 2875.00 15.351 -4.20
71 2937.50 15.478 -4.40
72 3000.00 15.602 -4.57
73 3125.00 15.841 -4.82
74 3250.00 16.069 -4.96
75 3375.00 16.287 -4.97
76 3500.00 16.496 -4.86
77 3625.00 16.697 -4.63
78 3750.00 16.891 -4.29
79 3875.00 17.078 -3.87
80 4000.00 17.259 -3.39
81 4125.00 17.434 -2.86
82 4250.00 17.605 -2.31
83 4375.00 17.770 -1.77
84 4500.00 17.932 -1.24
85 4625.00 18.089 -.74
86 4750.00 18.242 -.29
87 4875.00 18.392 .12
88 5000.00 18.539 .48
89 5125.00 18.682 .79
90 5250.00 18.823 1.06
91 5375.00 18.960 1.29
92 5500.00 19.095 1.49
93 5625.00 19.226 1.66
94 5750.00 19.356 1.81
95 5875.00 19.482 1.95
96 6000.00 19.606 2.08
97 6250.00 19.847 2.33
98 6500.00 20.079 2.59
99 6750.00 20.300 2.86
100 7000.00 20.513 3.17
101 7250.00 20.717 3.51
102 7500.00 20.912 3.89
103 7750.00 21.098 4.31
104 8000.00 21.275 4.79
105 8250.00 21.445 5.31
106 8500.00 21.606 5.88
107 8750.00 21.760 6.50
108 9000.00 21.906 7.19
109 9250.00 22.046 7.93
110 9500.00 22.178 8.75
111 9750.00 22.304 9.63
112 10000.00 22.424 10.58
113 10250.00 22.538 11.60
114 10500.00 22.646 12.71
115 10750.00 22.749 13.90
116 11000.00 22.847 15.18
117 11250.00 22.941 16.54
118 11500.00 23.030 18.01
119 11750.00 23.114 19.57
120 12000.00 23.195 21.23
121 12250.00 23.272 23.01
122 12500.00 23.345 24.90
123 12750.00 23.415 26.90
124 13000.00 23.482 29.03
125 13250.00 23.546 31.28
126 13500.00 23.607 33.67
127 13750.00 23.666 36.19
128 14000.00 23.722 38.86
129 14250.00 23.775 41.67
130 14500.00 23.827 44.63
131 14750.00 23.876 47.76
132 15000.00 23.923 51.04
请问,在换算音调成分和非音调成分时,计算掩蔽阈值的时候,X(k)和LTq(k)的索引系数k该怎么对应?
请求解答!!非常感谢!!
|