-
Notifications
You must be signed in to change notification settings - Fork 4.2k
Open
Description
TODO 此处想使用固定的男女声色
male_spk = chat.sample_random_speaker() # 固定seed确保音色一致
# 数据类型:spk_emb 可以是两种形式:
# 字符串(str):通过编码后的字符串表示(内部通过 pybase16384 和 lzma 压缩编码,便于存储和传输)。
# 张量(torch.Tensor):原始的嵌入向量(维度通常与模型配置的 dim 一致,用于模型内部计算)。
# 核心本质:本质是一个固定维度的向量(如 dim=512),用于表征特定说话人的音色特征。模型通过这个向量调整语音生成的参数,从而模拟不同人的声音。
print(f"男生: {male_spk}")
role_params = ChatTTS.Chat.InferCodeParams(
spk_emb=male_spk,
temperature=0.3, # 较低温度使发音更稳定
top_P=0.7,
top_K=20
)
Metadata
Metadata
Assignees
Labels
No labels