Ajar ned 18.2.2024 19:26

nalikuje ali ljudi ipak dišu a skupovi algoritama (ma kako to marketingaška gamad nazivala) - ne. i intonacija je napadno umjetna. no čemu sve to? ljudi zaboravili čitati i govoriti? ili kir janja pohlepno gleda kako bi ne platio žive, ljudske glasove? 

sporttest ned 18.2.2024 21:55
Ajar kaže...

nalikuje ali ljudi ipak dišu a skupovi algoritama (ma kako to marketingaška gamad nazivala) - ne. i intonacija je napadno umjetna. no čemu sve to? ljudi zaboravili čitati i govoriti? ili kir janja pohlepno gleda kako bi ne platio žive, ljudske glasove? 

 da ne moraju placati ljude za audio knjige

jozef pon 19.2.2024 10:08

Bolje jest od dosadašnjih TTSova, ali nije senzacionalno. I ove priče oko moguće zlouporabe su tek jadan marketing; "naš TTS je toliko dobar da smo ga morali zabraniti". Dobro da nisu rekli da ga doktori mrze... 

Yuda pon 19.2.2024 15:53
Zaporožac kaže...

Ako je već sempliran ljudski glas, bilo bi dobro kada bih mogao snimiti svako svoje rečenice snimljene preko mikrofona,pa neka AI govori npr mojim bogougodnim glasom. 

 

Misliš ovako nešto:

 

BASE TTS is a high-fidelity model capable of mimicking speaker characteristics with just a few seconds of reference audio, providing many opportunities to enhance user experiences and support under-resourced languages. - https://arxiv.org/pdf/2402.08093.pdf

 

 

Još neka želja?