ASPMA课程 " 演讲女性hps模型的随机性

来源: Freesound 前往原页面 查看原文
作者:Reincore
许可:CC-BY 保留署名许可协议  
描述:使用在smstools软件包中实现的Harmonic plus Stochastic Model执行的分析/合成过程产生的合成的随机部分。原始文件来自:http://freesound.org/people/xserra/sounds/317745/
标签: 语音 hpsModel 随机 演讲 短信工具 声乐 口语
音频格式wav
声音时长00:03
文件大小344.5 KB
比特率705 kbps
采样率44100 Hz
位深度16 bit
声道立体声
音频蛋下载 推荐

◦  支持一键下载
◦  智能提速线路
◦  队列批量下载
◦  免费跨站下载

  加入任务队列
原站点下载 备用

◦  账户登录下载
◦  普通站点线路
◦  单个文件下载
◦  免费站内下载

  前往声音页面

———— 类似的声音 ————

来源Freesound
描述:通过在smstools软件包中实现的Harmonic plus Stochastic Model执行的分析/合成过程产生的合成的正弦(谐波)部分。原始文件来自:http://freesound.org/people/xserra/sounds/317745/
来源Freesound
描述:通过在smstools软件包中实现的Harmonic plus Stochastic Model执行的分析/合成过程得到的合成。原始文件来自:http://freesound.org/people/xserra/sounds/317745/
来源Freesound
描述:来自ASPMA课程同伴评估7(第1部分)的语音女声。使用来自http://freesound.org/people/xserra/sounds/317745/的原始声音。这个声音是使用短信工具进行HPS模型分析的随机组成部分。 分析中使用的参数是: 窗型汉明;窗口大小 1297; FFTsize 2048;幅度阈值 90;谐波最小持续时间 0.1;最大谐波次数 45;最低基频 100;最大基频 300;最大错误f0检测算法 5;谐波轨道的最大频率偏差 0.01;随机近似因子 0.1;
by mauress
来源Freesound
描述:用HPS模型改变女性语音,以强调字母“V”。 ASPMA作业8.原始声音:http://freesound.org/people/Corsica_S/sounds/72888/
来源Freesound
描述:随机合成组件由分析/合成过程产生的谐波加随机模型在smstools软件包(http://github.com/MTG/smstools)中实现的男性语音声音http:// freesound .ORG /人/ xserra /声音/ 317744 / 分析中使用的参数是:Windowtype Hamming;窗口大小 1501; FFTsize 4096;幅度阈值 90;谐波最小持续时间 0.07;最大谐波次数 100;最低基频 80;最大基频 135;最大误差在f0检测算法 4;谐波轨道的最大频率偏差 0.01;随机近似因子 1。
by DaxaRughani
来源Freesound
描述:来自freesound.org的原始声音https://www.freesound.org/people/xserra/sounds/317745/使用smstools转换包进行转换,以演示频率转置缩放以扭曲声音。附加声音首先被转换使用smstools HPS(Harmonic plus Stochastic Model)。使用的参数如下所示:Window 汉明,M 1101(窗口大小),N 2048 FFT大小,t 100db阈值,minSinDur 0.07s,nH 80(最大谐波),minf0 120, maxf0 260,foet 7,(谐波选择参数)stocf 0.5。然后仅使用频率缩放来变换所得到的声音。声音片段是4s,其被分成3个片段。 0到1.3之间的第一个段将频率缩放0.5,即缩小一个八度,最后一个段的频率缩放2.0 i。比一个八度高。 1.3s和2.7s之间的中间段线性地改变了从0.5到2.0的频率。转换模型的参数为注意时间 值对,其中1.0是maxTime 4.0s
来源Freesound
描述:来自ASPMA课程同伴评估7(第1部分)的语音女声。来自http://freesound.org/people/xserra/sounds/317745/的原始声音。这个声音是使用短信工具进行HPS模型分析的重建组成部分。分析中使用的参数是: 窗型汉明;窗口大小 1297; FFTsize 2048;幅度阈值 90;谐波最小持续时间 0.1;最大谐波次数 45;最低基频 100;最大基频 300;最大错误f0检测算法 5;谐波轨道的最大频率偏差 0.01;随机近似因子 0.1;
来源Freesound
描述:来自ASPMA课程同伴评估7(第1部分)的语音女声。来自http://freesound.org/people/xserra/sounds/317745/的原始声音。这个声音是使用短信工具进行HPS模型分析的谐波分量。 分析中使用的参数是: 窗型汉明;窗口大小 1297; FFTsize 2048;幅度阈值 90;谐波最小持续时间 0.1;最大谐波次数 45;最低基频 100;最大基频 300;最大错误f0检测算法 5;谐波轨道的最大频率偏差 0.01;随机近似因子 0.1;
来源Freesound
描述:基于来自SMS工具声音文件的女性演讲,使用来自Coursera中的音频应用音频信号处理课程的SMSTools的HPS模型工具进行修改。 以下是原始声音的链接:http://www.freesound.org/people/xserra/packs/13038/ 我综合了演讲的随机信息。 应用于原始声音的过程是: 使用HPS模型进行分析和合成
来源Freesound
描述:使用在smstools软件包(http://github.com/MTG/smstools)中实现的Harmonic plus Stochastic Model对男性语音声音进行分析/合成过程得到的合成http://freesound.org /人/ xserra /声音/ 317744 / 分析中使用的参数是:Windowtype Hamming;窗口大小 1501; FFTsize 4096;幅度阈值 90;谐波最小持续时间 0.07;最大谐波次数 100;最低基频 80;最大基频 135;最大误差在f0检测算法 4;谐波轨道的最大频率偏差 0.01;随机近似因子 1。
来源Freesound
描述:谐波正弦合成分量由分析/合成过程产生,谐波加随机模型在smstools软件包(http://github.com/MTG/smstools)中实现,包含在包装中发现的女性语音,最初来自http://freesound.org/people/xserra/sounds/317745/。 分析中使用的参数是:Windowtype Hamming;窗口大小 1535; FFTsize 4096;幅度阈值 100;最小谐波持续时间 0.05;最大谐波次数 100;最低基频 125;最大基频 290;最大误差在f0检测算法 2;谐波最大频率偏差 0.001;随机近似因子 0.025。
来源Freesound
描述:使用在smstools软件包(http://github.com/MTG/smstools)中实现的谐波加随机模型执行的分析/合成过程产生的随机合成分量,包括在包装中发现的女性语音,最初来自http://freesound.org/people/xserra/sounds/317745/。 分析中使用的参数是:Windowtype Hamming;窗口大小 1535; FFTsize 4096;幅度阈值 100;最小谐波持续时间 0.05;最大谐波次数 100;最低基频 125;最大基频 290;最大误差在f0检测算法 2;谐波最大频率偏差 0.001;随机近似因子 0.025。
by mauress
来源Freesound
描述:使用HPS模型转换女性语音,使得在语音速度中存在“手风琴”效果。 ASPMA作业8.原始声音:http://freesound.org/people/Corsica_S/sounds/72888/
来源Freesound
描述:这个声音使用S:speechfemale.wav by xserra |许可证:归因;这是一段女性的演讲短语,取自科西嘉岛的Amy Gedgaudas的声音。 原声:v_of_vendetta.wav 使用此声音时,请使用归因(或署名 非商业)许可,并在上传说明中添加此文字:原始声音:http://freesound.org/people/Corsica_S/sounds/72887/ 我对ASPMA Coursera课程8A同行评估声音的描述:分析参数是window 'blackman',M 1201,N 4096,t 90,minSineDur 0.05,nH 70,minf0 100 ,maxf0 350,f0et 5,harmDevSlope 0.1,stocf 0.1。频率缩放因子:我试图让一个女孩的声音。然后我通过高因子来调整频率,甚至更高的是最后部分的频率,以便得到一个小的羞怯或尴尬的表达。频率拉伸因子:(无变化)音色保持: 1(无变化)音色缩放因子:我改变了这一点为了获得更自然的更高速度,主要是在演讲的最后部分,特别是压缩“静音”空间。
来源Freesound
描述:这是女性语音的再合成(http://www.freesound.org/people/xserra/sounds/254374/),使用来自SMS工具库的谐波加随机分析和综合工具获得:http:// mtg .upf.edu /技术/短信。用于分析的参数是: 窗口类型:布莱克曼 窗口大小(M):1101 FFT大小(N):2048幅度阈值(t)(dB): 90正弦轨道的最小持续时间:0.01最大谐波数:30最小基频:160最大基频:300 f0检测算法中的最大误差:5谐波轨迹中的最大频率偏差:0.01随机近似因子:0.2 原声:http://freesound.org/people/Corsica_S/sounds/72887/ 使用此声音时,请使用归因(或署名 非商业)许可,并在上传说明中添加此文字:原始声音:http://freesound.org/people/Corsica_S/sounds/72887/