Հիմնական տանողներ
- DeepZen-ն օգտագործում է AI (արհեստական բանականություն)՝ տեքստից զարմանալի իրատեսական աուդիոգրքեր ստեղծելու համար:
- Տեխնոլոգիան օգտագործում է իրական մարդկային ձայնային դերակատարներ՝ շինարարական բլոկները ապահովելու համար:
- Amazon-ը և Audible-ը ներկայումս չեն ընդունում համակարգչային ստեղծած աուդիոգրքեր:
DeepZen-ը ընկերություն է, որը ստեղծում է համակարգչային ձայներ, որոնք օգտագործվում են աուդիոգրքերում՝ հիմնվելով մարդկային դերասանների իրական ձայների վրա: Որակը սարսափելի է, բավական հեշտ է, որ ժամերով լսեք:Այստեղ հնարքը AI (արհեստական ինտելեկտ) բաղադրիչն է, որը կարող է կարդալ տեքստը և եզրակացնել ճիշտ հուզական արձագանքը՝ հիմնվելով համատեքստի վրա: Այն այնուհետև այդ զգացմունքը դնում է ձայնի մեջ:
Տպավորիչ է և շատ հարմար։ Բայց արդյո՞ք մենք իսկապես ցանկանում ենք աուդիոգրքերի համասեռացված փորձ: Իսկ ի՞նչ կասեք այդ ձայնային դերասանների մասին:
«Ինդի հրատարակչի տեսանկյունից, ամեն ինչ, որը նվազեցնում է աուդիոգրքերի արտադրության արժեքը, շատ հետաքրքիր է», - ասաց Ռիկ Կարլայլը, անկախ հրատարակիչ Carlile Media-ի սեփականատերը, Lifewire-ին էլփոստով::
«Բայց այդ գրավչությունը ենթադրում է, որ արտադրանքը կլինի նույն որակի, ինչ ավանդական պատմվածքը: Կարծում եմ, որ մենք դեռ հարյուր տոկոսով չենք հասել: Ինձ սխալ չհասկանաք, DeepZen-ը զարմանալիորեն լավն է: Դա մի բան է: հսկայական առաջընթաց, և դրա ստեղծողները արժանի են հսկայական գովասանքի և հաջողության: Բայց դա դեռ կատարյալ չէ»:
Աուդիո Դա «բավական լավ է»
DeepZen-ի որակը հասկանալու լավագույն միջոցը նմուշները լսելն է:Եթե դուք չգիտեիք, որ դրանք համակարգչային ստեղծվել են, կարող էիք նույնիսկ չհասկանաք: Ամեն դեպքում, ոչ մի որոշ ժամանակով: Ենթադրենք, որ DeepZen-ի AI-ն կատարյալ է և երբեք սխալ չի մեկնաբանում այն էմոցիոնալ նոտաները, որոնք պետք է դիպչեն:
Նույնիսկ այդ դեպքում մարդը կարող է առաջարկել ավելի նրբերանգ և հաճախ ավելի զարմանալի մեկնաբանություններ: Դերասանը կարող է անսպասելի շրջադարձ կատարել այն բառերի վրա, որոնք համակարգիչը երբեք չի էլ մտածի: Իսկ իրականում արհեստական ինտելեկտի մեկնաբանությունը, անշուշտ, դեռ այնքան լավը չէ, որքան պրոֆեսիոնալ ձայնային դերասանի մեկնաբանությունը:
«Որպես ֆիլմերի վրա աշխատող և վերջին շրջանում աուդիո շարադրման աշխարհում, չնայած ես տպավորված եմ արհեստական ինտելեկտով, ես հաստատ գիտեմ, որ կան իմաստի խորը խորություններ, որոնք մեքենան չի կարող մեկնաբանել», - պրոֆեսիոնալ ձայն: Դերասան Փոլ Քրամը Lifewire-ին էլփոստով հայտնել է:
«Արդյո՞ք այն օգտագործող անհայտ հեղինակների աճ կլինի: Ես երաշխավորում եմ, որ դա կլինի, քանի որ այն «բավականին լավ է»:»
Բավական լավ լինելը, զուգորդված հարմարավետության և ծախսերի խնայողության հետ, կարող է բավարար լինել ինդի հրատարակիչներին դեպի ծառայություն մղելու համար:
«Աուդիոգրքերը կարող են արժենալ մինչև 500 դոլար ձայնի ավարտված ժամի համար (շատ ավելին հայտնի մարդկանց ձայնի համար), և դա չի ներառում կառավարման և ադմինիստրատորի ժամանակի ծախսերը», - ասում է Կարլիլը: «Կարողանալով կրկնակի կրճատել այդ արժեքը՝ պարզապես ձեռագիր վերբեռնելով DeepZen-ի նման մատակարարին, չափազանց գրավիչ է»:
Խոսելու խնդիր
Դեռ այնքան էլ հեշտ չէ, որքան ձեր ձայնային դերասաններին աշխատանքից հեռացնելը և ձեռագրերը DeepZen-ում վերբեռնելը: Աուդիոգրքերի AI-ի դյուրին խոսքի համար ներկայումս կա մեկ խոչընդոտ, և այն Amazon-ից է:
«Ներկայումս ACX-ը՝ ինքնահրատարակչի՝ Audible և Amazon աուդիոգրքերի բաշխման ուղին, չի ընդունի աուդիոգրքեր, որոնք մարդը չի ձայնագրել», - ասում է Կարլիլը։
Ինչու? Որակ. Ահա FAQ գրառումը կայքից՝
Տեքստից խոսք կամ այլ ավտոմատ ձայնագրություններ չեն թույլատրվում: Լսելի լսողները ընտրում են աուդիոգրքեր նյութի, ինչպես նաև պատմության համար: Այդ ակնկալիքը բավարարելու համար ձեր աուդիոգիրքը պետք է ձայնագրվի մարդու կողմից: «
Սա նշանակում է, որ DeepZen-ի կողմից ստեղծված աուդիոգրքերը գոնե առայժմ դուրս են մնացել: Սա մաքուր ենթադրություն է, բայց DeepZen-ը բավականին լավ ձեռքբերում է թվում Amazon-ի համար, որը թույլ է տալիս վաճառել ծառայությունը և պահել այն բացառապես Audible գրքերի համար: Եվ նույնիսկ եթե դա տեղի չունենա, եթե համակարգչային ստեղծվող աուդիոգրքերի որակը նույնքան լավն է, ապա այս կանոնից բացառություն չանելու քիչ պատճառ կա:
Ուրախ կլինե՞ք լսել այս եղանակով ստեղծված աուդիոգրքերը: Երբ դա տեղի ունենա, շատերը չեն էլ կասկածի: Ոմանք կարող են գերադասել համակարգչային ձայների կատարելությունը, քանի որ նրանք զերծ կլինեն վոկալ տիկերից և սովորություններից, որոնք երբեմն կարող են շեղել ուշադրությունը: Տեխնոլոգիան հարմար է նաև տեսախաղերի, հեռուստատեսային և ռադիո գովազդի և ցանկացած այլ սցենարի համար, որտեղ դուք կվարձեք ձայնային դերասան:
DeepZen-ի տեխնոլոգիան նաև հիանալի միջոց է գրավոր հոդվածներից ավտոմատ կերպով նորությունների փոդքաստեր ստեղծելու համար, որոնք կարող են հարմար լինել երթևեկության համար:
Իսկ ի՞նչ կասեք այդ ձայնային դերասանների մասին: Դե, գոնե մեկ հնարավորություն կլինի՝ նրանք կարող են գնալ և աշխատել DeepZen-ի համար: