语音女性 hps 模型 Fsc Fst 转化

来源: Freesound 前往原页面 查看原文
作者:anjds
许可:CC0 公众共享许可协议  
描述:使用smstools软件包中实现的转换模型,在频率缩放和扩展声音语音 female_hpsModel.wav(https://www.freesound.org/people/anjds/sounds/377067/)后获得输出声音(http:/ /github.com/MTG/smstools)考虑的参数是: i)频率缩放因子 ,ii)频率拉伸因子 ,iii)音色保持 1,iv)时间缩放因子 。
标签: 改造 谐波 演讲 随机
音频格式wav
声音时长00:03
文件大小343.8 KB
比特率705 kbps
采样率44100 Hz
位深度16 bit
声道立体声
音频蛋下载 推荐

◦  支持一键下载
◦  智能提速线路
◦  队列批量下载
◦  免费跨站下载

  加入任务队列
原站点下载 备用

◦  账户登录下载
◦  普通站点线路
◦  单个文件下载
◦  免费站内下载

  前往声音页面

———— 类似的声音 ————

来源Freesound
描述:通过分析和合成声音语音获得的频率缩放输出声音 female_hpsModel.wav(https://www.freesound.org/people/anjds/sounds/377067/),其中的转换模型在smstools软件包中实现(http: //github.com/MTG/smstools)考虑的参数是: i)频率缩放因子 ,ii)频率拉伸因子 ,iii )音色保持 1,iv)时间缩放因子 。
来源Freesound
描述:使用smstools软件包中实现的转换模型,在频率缩放和拉伸以及声音时间缩放后获得输出声音 female_hpsModel.wav(https://www.freesound.org/people/anjds/sounds/377067/) (http://github.com/MTG/smstools)考虑的参数是: i)频率缩放因子 ,ii)频率拉伸因子 ,iii)音色保持 1,iv)时间缩放因子 。
来源Freesound
描述:Coursera音频处理 谐波+随机模型(使用短信工具) 谐波模型后残差的随机模型。 基于:http://freesound.org/people/xserra/sounds/317745/
来源Freesound
描述:通过谐波模型和随机模型的求和结果得到的再合成声音
来源Freesound
描述:Coursera音频处理 谐波+随机模型(使用短信工具) 谐波+随机模型后的残差。 基于:http://freesound.org/people/xserra/sounds/317745/
by WantingChen
来源Freesound
描述:谐波加上女性语音的随机再合成:http://www.freesound.org/people/xserra/sounds/254374/。这是使用SMS工具中实现的谐波加随机模型完成的:http://mtg.upf.edu/technologies/sms。用于分析的参数是: 窗口:黑人 窗口大小:2001 FFT大小:2048幅度阈值:100正弦轨道的最小持续时间:0.05最大谐波数量:100最小基频:150最大基频:250最大误差在f0检测算法中:谐波轨迹中的最大频率偏差为5:0.05随机因子:1
来源Freesound
描述:Coursera音频处理 谐波+随机模型(使用短信工具) 谐波模型。 基于:http://freesound.org/people/xserra/sounds/317745/
来源Freesound
描述:谐波正弦合成分量由分析/合成过程产生,谐波加随机模型在smstools软件包(http://github.com/MTG/smstools)中实现,包含在包装中发现的女性语音,最初来自http://freesound.org/people/xserra/sounds/317745/。 分析中使用的参数是:Windowtype Hamming;窗口大小 1535; FFTsize 4096;幅度阈值 100;最小谐波持续时间 0.05;最大谐波次数 100;最低基频 125;最大基频 290;最大误差在f0检测算法 2;谐波最大频率偏差 0.001;随机近似因子 0.025。
来源Freesound
描述:通过在smstools软件包中实现的谐波加随机模型的声音语音 female.wav(http://freesound.org/people/xserra/sounds/317745/)的分析和合成获得的合成输出声音(http:/ /github.com/MTG/smstools)分析中使用的参数是: 窗口类型布莱克曼,窗口大小(M) 2019,FFT大小(N) 2048,db(t)的幅度阈值 100,谐波轨迹的最小持续时间 0.1,最大谐波次数 100,最小基频 80,最大基频 300,f0检测算法中的最大误差 5,谐波轨迹中的最大频率偏差 0.01,随机近似因子 0.7
by rgonnering
来源Freesound
描述:原声:http://freesound.org/people/xserra/sounds/317745/ 使用Harmonic plus Stochastic Model处理Original Sound以产生此输出。 谐波加上女性语音的随机再合成:用于分析的参数为:窗口类型:blackmanWindow size(M):1325FFT size(N):2048#识别峰值和谐波的参数:幅度阈值(t): 80Min持续时间:0.1Max谐波数:20Min f0:100Max f0:500 fx误差f0检测:5Max freq dev in harmon tracks:0.01随机近似因子:0.4
来源Freesound
描述:重建hps女性言语模型。 http://freesound.org/people/xserra/sounds/317745/ 分析中使用的参数是:Windowtype Hamming;窗口大小 1024; FFTsize 2048;幅度阈值 90;最小谐波持续时间 0.01;最大谐波次数 100;最低基频 50;最大基频 250;最大误差在f0检测算法 7;谐波轨道的最大频率偏差 0.01;随机近似因子 0.2。
来源Freesound
描述:使用在smstools软件包(http://github.com/MTG/smstools)中实现的谐波加随机模型执行的分析/合成过程对包装中发现的女性语音进行合成,最初来自http://freesound.org/people/xserra/sounds/317745/。 分析中使用的参数是:Windowtype Hamming;窗口大小 1535; FFTsize 4096;幅度阈值 100;最小谐波持续时间 0.05;最大谐波次数 100;最低基频 125;最大基频 290;最大误差在f0检测算法 2;谐波最大频率偏差 0.001;随机近似因子 0.025。
来源Freesound
描述:随机合成组件由分析/合成过程产生的谐波加随机模型在smstools软件包(http://github.com/MTG/smstools)中实现的男性语音声音http:// freesound .ORG /人/ xserra /声音/ 317744 / 分析中使用的参数是:Windowtype Hamming;窗口大小 1501; FFTsize 4096;幅度阈值 90;谐波最小持续时间 0.07;最大谐波次数 100;最低基频 80;最大基频 135;最大误差在f0检测算法 4;谐波轨道的最大频率偏差 0.01;随机近似因子 1。
来源Freesound
描述:Coursera音频处理 谐波+随机模型(使用短信工具) 用谐波+随机模型重建。 基于:http://freesound.org/people/xserra/sounds/317745/ 参数:{'window':'blackmanharris','M':1024,'N':8192,'t': 90,'minSineDur':0.005,'nH':40,'minf0':120,'maxf0 ':270,'f0et':15,'harmDevSlope':0.05,'N_synth':512,'hop_size':128,'stocf':0.1}
来源Freesound
描述:HPS过程产生的转换组件。原始声音可以在smstools软件包(http://github.com/MTG/smstools)中找到,作为speechfemale。 也可以在这里找到:http://freesound.org/people/xserra/sounds/317745/ 这个想法是对演讲进行改造。为此,我改变了时间缩放和频率拉伸因子。