[关闭]
@Wayne-Z 2017-11-17T21:25:27.000000Z 字数 2301 阅读 2455

韵母声纹的归一化图示

语音处理


本文对韵母进行了另一次梳理,将分析的频率主要集中在了0-2500HZ的区间,同时对程序解析的窗口进行了二分,使得处理更加精细。
代码如下:

  1. fs=44000; %语音信号采样频率为44100
  2. file = 'a-1.wav';
  3. wavelength = length(audioread(file));
  4. term = floor(wavelength/1100);
  5. samples = [1, 2200];
  6. T = 1:term;
  7. P = zeros(2048,term);
  8. for id = 1:term
  9. x = audioread(file,samples);
  10. t = (0:length(x)-1)/fs;
  11. y = fft(x,4096); %对信号做2048FFT变换
  12. f = fs*(0:2047)/4096;
  13. p= abs(y(1:2048));
  14. [pks,locs,widths,proms] = findpeaks(p,'SortStr','descend');
  15. s = widths.*pks;
  16. idx = 1;
  17. Sum =s(1);
  18. %P(locs(1),id) = s(1);
  19. for j = 2 : length(s)
  20. if s(j)/Sum > 0.10
  21. Sum = Sum + s(j);
  22. idx = [idx , j];
  23. %P(locs(j),id) = s(j);
  24. end
  25. end
  26. % for k = 1 : 2048
  27. % if any(k == idx)
  28. % P(k,id) = p(k);
  29. % end
  30. % end
  31. % 用于显示单纯的振幅峰值
  32. % 筛选出0-1000,1000-2000,2000-3000的频率
  33. ids = [];idm = [];idl = [];
  34. for i = 1:length(idx)
  35. if f(idx) <=1000
  36. ids = [ids,idx(i)];
  37. elseif f(idx) <= 2000;
  38. idm = [idm,idx(i)];
  39. else
  40. idl = [idl, idx(i)];
  41. end
  42. end
  43. %将各个区间内的多条化为一条
  44. As = sum(s(ids));
  45. Am = sum(s(idm));
  46. Al = sum(s(idl));
  47. Fs = floor(dot( s(ids),locs(ids))/As);
  48. Fm = floor(dot( s(idm),locs(idm))/Am);
  49. Fl = floor(dot( s(idl),locs(idl))/Al);
  50. Ps = dot(s(ids),pks(ids))/As;
  51. Pm = dot(s(idm),pks(idm))/Am;
  52. Pl = dot(s(idl),pks(idl))/Al;
  53. if ~isnan(Fs)
  54. P(Fs,id) = Ps;
  55. end
  56. if ~isnan(Fm)
  57. P(Fm,id) = Pm;
  58. end
  59. if ~isnan(Fl)
  60. P(Fl,id) = Pl;
  61. end
  62. if 1100*(id+2) <= wavelength
  63. samples = [1100*id, 1100*(id+2)];
  64. else
  65. samples = [1100*id,wavelength];
  66. end
  67. end
  68. surf(T,f,P,'edgecolor','none'); axis tight;
  69. view(0,90); % 通常看时谱图时都采用这个角度,若需要可以采用
  70. set(gca, 'YLim',[0 3000])
  71. xlabel('Time (0.025s)'); ylabel('Hz');

韵母

单韵母(10)

“a”的图示a-1.PNG-313.5kBa-3.PNG-27.2kB

归一化处理后a-4.PNG-24.8kB

“o”的图示o-1.PNG-268.9kBo-2.PNG-25.1kB

归一化处理后o-3.PNG-22.4kB

“e”的图示e-1.PNG-263.2kBe-2.PNG-27.8kB

归一化处理后e-3.PNG-26.9kB

“i”的图示i-1.PNG-318.9kBi-3.PNG-30kB

归一化处理后i-4.PNG-26.4kB

“u”的图示u-1.PNG-288.7kBu-2.PNG-24.3kB

归一化处理后u-3.PNG-24.6kB

“ü”的图示ü-1.PNG-322.6kBü-2.PNG-26.7kB

归一化处理后u-3.PNG-24.6kB
ê不作为音节使用, 不与任何辅音声母相拼,只构成复韵母ie、üe,并在书写时省去上面的附加符号“ˆ”。

“ê”的图示ê-1.PNG-272.7kBê-2.PNG-21.7kB

归一化处理后ê-3.PNG-17.6kB

“er”的图示er-1.PNG-337.5kBer-2.PNG-26.9kB

归一化处理后er-3.PNG-28.4kB


复韵母(13)

前响复韵母

“ɑi”的图示ai-1.PNG-293.1kBai-2.PNG-28.1kB

归一化处理后ai-3.PNG-24.2kB

“ei”的图示ei-1.PNG-260.8kBei-2.PNG-22.6kB

归一化处理后ei-3.PNG-21.7kB

“ɑo”的图示ao-1.PNG-276.5kBao-2.PNG-24.5kB

归一化处理后ao-3.PNG-22.5kB

“ou”的图示ou-1.PNG-275.9kBou-2.PNG-26.3kB

归一化处理后ou-3.PNG-24.2kB

后响复韵母

“ia”的图示ia-1.PNG-324.2kBia-2.PNG-28.2kB

归一化处理后ia-3.PNG-24kB

“ie”的图示ie-1.PNG-279kBie-2.PNG-25kB

归一化处理后ie-3.PNG-24.5kB

“uo”的图示uo-1.PNG-285.5kBuo-2.PNG-25.9kB

归一化处理后uo-3.PNG-24kB

“ua”的图示ua-1.PNG-322.8kBua-2.PNG-25.9kB

归一化处理后ua-3.PNG-24.7kB

“üe”的图示üe-1.PNG-301kBüe-2.PNG-29.2kB

归一化处理后üe-3.PNG-25.2kB

中响复韵母

“iao”的图示iao-1.PNG-283.8kBiao-2.PNG-25.5kB

归一化处理后iao-3.PNG-24.5kB

“iou”的图示iou-1.PNG-291.6kBiou-2.PNG-22.8kB

归一化处理后iou-3.PNG-23.3kB

“uai”的图示uai-1.PNG-313.4kBuai-2.PNG-27.8kB

归一化处理后uai-3.PNG-22.6kB

“uei”的图示uei-1.PNG-280.6kBuei-2.PNG-25.7kB

归一化处理后uei-3.PNG-24.1kB
中响复韵母的声纹符合其名称特点,呈现出中间的元音能量大,前后一个能量小的特性。能量图呈现出工字型。


鼻韵母(16)

前鼻音(8)

“an”的图示an-1.PNG-307kBan-3.PNG-29.6kB

归一化处理后an-4.PNG-24.8kB

“ian”的图示ian-1.PNG-300.9kBian-3.PNG-28.5kB

归一化处理后ian-4.PNG-23.4kB

“uan”的图示uan-1.PNG-307.4kBuan-3.PNG-28.9kB

归一化处理后uan-4.PNG-25.8kB

“üɑn”的图示üɑn-1.PNG-310.5kBüɑn.PNG-27.8kB

归一化处理后!üɑn-3.PNG-25.4kB

“en”的图示en-1.PNG-300.9kBen-3.PNG-26.4kB

归一化处理后en-4.PNG-24.2kB

“in”的图示in-1.PNG-313.6kBin-3.PNG-26.5kB

归一化处理后in-4.PNG-21.1kB

“uen”的图示uen-1.PNG-281.6kBuen-3.PNG-25.1kB

归一化处理后uen-4.PNG-20.4kB

“un”的图示un-1.PNG-330.2kBun-3.PNG-24.8kB

归一化处理后un-4.PNG-24.3kB

后鼻音(8)

“ang”的图示ang-1.PNG-317.8kBang-3.PNG-31.3kB

归一化处理后ang-4.PNG-26.5kB

“iang”的图示iang-1.PNG-323.5kBiang-3.PNG-31.5kB

归一化处理后iang-4.PNG-26.1kB

“uang”的图示uang-1.PNG-309.6kBuang-3.PNG-28.5kB

归一化处理后uang-4.PNG-25.6kB

“ong”的图示ong-1.PNG-280.1kBong-3.PNG-21.5kB

归一化处理后ong-4.PNG-19.8kB

“eng”的图示eng-1.PNG-283kBeng-3.PNG-28.6kB

归一化处理后eng-4.PNG-25.2kB

“ing”的图示ing-1.PNG-335.7kBing-3.PNG-31.6kB

归一化处理后ing-4.PNG-26.9kB

“ueng”的图示ueng-1.PNG-281.4kBueng-3.PNG-26.8kB

归一化处理后ueng-4.PNG-24.6kB

“iong”的图示iong-1.PNG-279.8kBiong-3.PNG-25.2kB

归一化处理后iong-4.PNG-22.9kB


总结

添加新批注
在作者公开此批注前,只有你和作者可见。
回复批注