Azken urteetan, testu-ahotsaren motorrek aurrerapen handiak izan dituzte gaur egungo makina ikasteko metodoei esker. Aurretik izugarri sinplea zen ulertzea testua irakurtzen duen ordenagailua zela gizakia baino. Baina azkar eboluzionatzen ari da.
Gaur egun Amazon AWS cloud computing arm-ek testu neurriko ahozko modeloak eta berriemaileen estilo berria aurkeztu zituen.
Amazon Neural Text-To-Speech estiloaren eta albistegien eskuragarritasun orokorra iragarri du gaur Amazon Polly, hodeiko zerbitzua da testua hizkerara bihurtzen duena, Google-ren WaveNet-ek gehiegikeriarik izan ez dezakeena, tonuak patroia eta intonazioa simulatzen dituena.
Julien Simonek ebanjelari teknologiak blogaren post batean adierazi zuen bezala Amazon Web Zerbitzuek, neural testuaren hizkerak kalitatearen hobekuntza nabarmenak eskaintzen ditu naturaltasun eta adierazpen handiagoak direla eta.
Zerbitzu berria formalki aipatzen denez, Amazon Polus albisteak AWS testu-ahotsen azterketen urteen ondorioa da bere motor neuronalaren bidez ere eskuragarri egotea.
Motor fresko honek 11 ahots ditu, hiru Erresuma Batuarentzat, zortzi AEBentzat. Hau ez da aldera Googleko WaveNet eta beste batzuk bezalako neuronal motore konparagarriekin.
Albiste faltsuen aro honetan, hasieran zaila da bizitzako robot ahotsak izatea egiazko kazetariak diruditenak. Hala ere, ez du oso desberdintasunik robot batek edo gizonak testua irakurtzen duen ala ez. Ahotsaren erabilera bikain asko daude, eta ahots horiek askoz ere luzeago entzun ditzakezu, AWS-k emandako adibideak kontuan hartuta, antzinako ahotsak entzunaldia moztu nahi baduzu.
Bidea: TechCrunch