
Amazonov računalni govor istovjetan ljudskome


nalikuje ali ljudi ipak dišu a skupovi algoritama (ma kako to marketingaška gamad nazivala) - ne. i intonacija je napadno umjetna. no čemu sve to? ljudi zaboravili čitati i govoriti? ili kir janja pohlepno gleda kako bi ne platio žive, ljudske glasove?

"ma kakva inteligencija, neka on pobijedi u šahu ako može". "E, lako je šah, neka pobijedi u go". "A pa to je lako, neka proba disati dok govori".

nalikuje ali ljudi ipak dišu a skupovi algoritama (ma kako to marketingaška gamad nazivala) - ne. i intonacija je napadno umjetna. no čemu sve to? ljudi zaboravili čitati i govoriti? ili kir janja pohlepno gleda kako bi ne platio žive, ljudske glasove?
da ne moraju placati ljude za audio knjige

Bolje jest od dosadašnjih TTSova, ali nije senzacionalno. I ove priče oko moguće zlouporabe su tek jadan marketing; "naš TTS je toliko dobar da smo ga morali zabraniti". Dobro da nisu rekli da ga doktori mrze...

Ako je već sempliran ljudski glas, bilo bi dobro kada bih mogao snimiti svako svoje rečenice snimljene preko mikrofona,pa neka AI govori npr mojim bogougodnim glasom.

Ajd možda se sad na yubitou bude moglo što i poslušati, jer ovo dosad je blago rečeno užas.

Ajd možda se sad na yubitou bude moglo što i poslušati, jer ovo dosad je blago rečeno užas.
Sta slusas na jubitu?

Šta nikad nisi naletio video sa računalno generiranim glasom?

Ako je već sempliran ljudski glas, bilo bi dobro kada bih mogao snimiti svako svoje rečenice snimljene preko mikrofona,pa neka AI govori npr mojim bogougodnim glasom.
Misliš ovako nešto:
BASE TTS is a high-fidelity model capable of mimicking speaker characteristics with just a few seconds of reference audio, providing many opportunities to enhance user experiences and support under-resourced languages. - https://arxiv.org/pdf/2402.08093.pdf
Još neka želja?

Šta nikad nisi naletio video sa računalno generiranim glasom?
Pa jesam, ali to sranje odmah zatvorim. Auto-spam.
"However, due to the potential misuse of this capability, we have decided against open-sourcing this model as a precautionary measure."
Šmrk.