CosyVoice 2.0在做跨语言克隆时，待合成的英文文本<|en|>后面的内容会被ttsfrd删除，无法合成。用默认的WeTextProcessing没有这个问题 #782

hixiaoxiong · 2024-12-24T10:07:41Z

def text_normalize(self, text, split=True, text_frontend=True):
        if text_frontend is False:
            return [text] if split is True else text
        text = text.strip()
        print(f"原始文本为=======:{text}")
        if contains_chinese(text):
            if self.use_ttsfrd:
                texts = [i["text"] for i in json.loads(self.frd.do_voicegen_frd(text))["sentences"]]
                text = ''.join(texts)
            else:
                text = self.zh_tn_model.normalize(text)
                text = text.replace("\n", "")
                text = replace_blank(text)
                text = replace_corner_mark(text)
                text = text.replace(".", "。")
                text = text.replace(" - ", "，")
                text = remove_bracket(text)
                text = re.sub(r'[，,、]+$', '。', text)
                texts = list(split_paragraph(text, partial(self.tokenizer.encode, allowed_special=self.allowed_special), "zh", token_max_n=80,
                                             token_min_n=60, merge_len=20, comma_split=False))
        else:
            if self.use_ttsfrd:
                texts = [i["text"] for i in json.loads(self.frd.do_voicegen_frd(text))["sentences"]]
                # 以上这句代码会把跨语种克隆中英文文本<|en|>后面的内容删除
                text = ''.join(texts)
                text = text.replace("\n", "") # added by xlp
            else:
                text = self.en_tn_model.normalize(text)
                text = spell_out_number(text, self.inflect_parser)
                texts = list(split_paragraph(text, partial(self.tokenizer.encode, allowed_special=self.allowed_special), "en", token_max_n=80,
                                             token_min_n=60, merge_len=20, comma_split=False))
        if split is False:
            return text
        return texts

The text was updated successfully, but these errors were encountered:

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

CosyVoice 2.0在做跨语言克隆时，待合成的英文文本<|en|>后面的内容会被ttsfrd删除，无法合成。用默认的WeTextProcessing没有这个问题 #782

CosyVoice 2.0在做跨语言克隆时，待合成的英文文本<|en|>后面的内容会被ttsfrd删除，无法合成。用默认的WeTextProcessing没有这个问题 #782

hixiaoxiong commented Dec 24, 2024

CosyVoice 2.0在做跨语言克隆时，待合成的英文文本<|en|>后面的内容会被ttsfrd删除，无法合成。用默认的WeTextProcessing没有这个问题 #782

CosyVoice 2.0在做跨语言克隆时，待合成的英文文本<|en|>后面的内容会被ttsfrd删除，无法合成。用默认的WeTextProcessing没有这个问题 #782

Comments

hixiaoxiong commented Dec 24, 2024