Հիմնական տանողներ
- Նոր տեխնոլոգիաները կարող են հանգեցնել համակարգիչների, որոնք ավելի լավ են հասկանում մարդու խոսքը:
- Microsoft-ը և NVIDIA-ն վերջերս հայտարարեցին լեզուն մեկնաբանելու AI-ի վրա հիմնված նոր մեթոդի մասին:
- Քվանտային հաշվարկը կարող է լինել լեզուների մշակման ոլորտը առաջ մղելու ևս մեկ միջոց:
Այս օրերին շատ խելացի գաջեթներ կան, որոնք հրամաններ են տալիս, բայց մենք դեռ շատ հեռու ենք խոսակցական խոսքը հասկացող համակարգիչներից:
Microsoft-ը և NVIDIA-ն վերջերս հայտարարեցին խոսքի մեկնաբանման նոր մեթոդի մասին, որը հիմնված է AI-ի վրա, որը կարող է փոխել, թե ինչպես ենք մենք զրուցում մեր էլեկտրոնիկայի հետ: Սա աճող շարժման մի մասն է, որը փոխում է, թե ինչպես են համակարգիչները հասկանում խոսքը, որը նաև կոչվում է բնական լեզվի մշակում (NLP):
«NLP-ն սնուցող մոդելները դառնում են ավելի մեծ և առաջադեմ և ավելի են մոտենում մարդու ըմբռնմանը»,- Lifewire-ին տված հարցազրույցում ասել է AI փորձագետ Համիշ Օգիլվին::
«Մեծ առաջընթացներից մեկն այն է, որ NLP-ն դուրս է գալիս պարզ հիմնաբառերից: Դուք կարող եք սովորել այսօր մուտքագրել կամ խոսել մեկ կամ երկու հիմնաբառ՝ որոնման արդյունքներ ստանալու համար, սակայն բնական լեզվի մշակման նոր մոդելներն օգտագործում են համատեքստը՝ ավելի հարուստ արդյունքներ ապահովելու համար: «
Չաթի բոտեր
NVIDIA-ն և Microsoft-ը միավորվել են՝ ստեղծելու Megatron-Turing Natural Language Generation մոդելը (MTNLG), որը դուետը պնդում է, որ «ամենահզոր մոնոլիտ տրանսֆորմատորային լեզվի մոդելը, որը վերապատրաստվել է մինչ օրս»: AI մոդելն աշխատում է սուպերհամակարգիչների վրա:
Բայց հետազոտողները պարզել են, որ MTNLG մոդելը հայտնաբերում է մարդու կողմնակալությունը, երբ այն անցնում է մարդկային խոսքի նմուշների լեռների միջով:
«Մինչ հսկա լեզվական մոդելները զարգացնում են լեզվի ստեղծման ժամանակակից մակարդակը, նրանք նաև տառապում են այնպիսի խնդիրներից, ինչպիսիք են կողմնակալությունը և թունավորությունը», - գրել են հետազոտողները բլոգի գրառման մեջ: «MT-NLG-ի հետ կապված մեր դիտարկումներն այն են, որ մոդելն ընտրում է կարծրատիպեր և կողմնակալություններ այն տվյալներից, որոնց վրա նա վերապատրաստվել է»:
Համակարգիչները, որոնք ավելի լավ են հասկանում խոսքը, ոչ միայն կբարելավեն Alexa-ի նման խելացի բարձրախոսները, պնդում է Ogilvy-ն: Տեքստի վրա հիմնված որոնման կայքերը, ինչպիսին է Amazon-ը, նույնպես ավելի լավ կհասկանան մուտքագրված հարցումները:
«Google-ն այստեղ ակնհայտ առաջատարն է, բայց NLP տեխնոլոգիան կլինի ամենուր», - ասաց Օգիլվին: «Տեքստի և ձայնի վրա հիմնված որոնումների համար օգտատերերը կարող են ավելի նկարագրական լինել, քանի որ NLP-ն հասկանում է ավելին, քան պարզապես տեքստը, այն հասկանում է այն համատեքստը, թե ինչ եք փնտրում՝ ավելի լավ արդյունքներ ստանալու համար:«
Քվանտային զրույցներ?
Քվանտային հաշվարկը կարող է լինել NLP-ի ոլորտը առաջ մղելու ճանապարհներից մեկը: Չորեքշաբթի օրը Cambridge Quantum ընկերությունը հայտարարեց lambeq-ը, որը, ըստ նրա, NLP-ի առաջին քվանտային գործիքակազմն է:
…NLP-ն հասկանում է ավելին, քան պարզապես տեքստը. այն հասկանում է այն համատեքստը, թե ինչ եք փնտրում՝ ավելի լավ արդյունքներ ստանալու համար:
Ընկերությունն ասում է, որ գործիքը թույլ է տալիս թարգմանել նախադասությունները բնական լեզուներով՝ օգտագործելով քվանտային սխեմաներ, որոնք աշխատում են քվանտային համակարգիչների վրա: Քվանտային հաշվարկը հաշվարկների մի տեսակ է, որն օգտագործում է քվանտային վիճակների անսովոր հատկությունները, ինչպիսիք են սուպերպոզիցիան, միջամտությունը և խճճվածությունը, հաշվարկներ կատարելու համար:
«Քվանտային համակարգիչները NLP-ի հետ վարվելու եղանակը շատ տարբեր է դասական մեքենաներից: Իրականում, NLP-ն «քվանտային բնիկ է», - Lifewire-ին տված հարցազրույցում ասել է Cambridge Quantum-ի գլխավոր գիտնական Բոբ Կոեկը: «Սա պայմանավորված է մի բացահայտմամբ, որը մենք արել ենք մի քանի տարի առաջ, որ քերականությունը կարգավորող նախադասություններն ու իմաստը շատ նման կառուցվածք ունեն քվանտային համակարգիչները ծրագրավորելու համար օգտագործվող մաթեմատիկային:«
Coecke-ն ասաց, որ քվանտային NLP-ն կարող է հանգեցնել ավելի լավ ձայնային օգնականների և թարգմանչական գործիքների:
Խոսքի ճանաչման բարելավման ևս մեկ խոստումնալից մոտեցում, որը կոչվում է Զաք Լյուն, Hypergiant ընկերության տվյալների գիտնական, Lifewire-ին տված հարցազրույցում ասել է. «Կարճ ասած, երբ տվյալների գիտնականները բարելավում են NLP տվյալները, դա գրեթե երաշխավորում է, որ նրանք կունենան ավելի լավ NLP մոդել և ավելի լավ NLP կարողություն»:
Հաջորդ քայլը համակարգչային տեսողության մոդելների ինտեգրումն է NLP-ի հետ, ինչպես օրինակ՝ արհեստական ինտելեկտի մոդելի ուսուցումը տեսանյութեր դիտելու և այդ տեսանյութի տեքստային ամփոփագիր պատրաստելու համար, ասաց Լյուն:
«Այս առաջընթացի կիրառումը կարող է անսահման լինել՝ սկսած առողջապահությունից, ռադիոլոգիական ֆիլմեր կարդալուց և նախնական ախտորոշման տրամադրումից մինչև տների, հագուստի, զարդերի կամ նմանատիպ իրերի ձևավորում», - ավելացրեց նա: «Հաճախորդը կարող է բացատրել պահանջները բանավոր կամ գրավոր ձևով, և այս նկարագրությունը կարող է ավտոմատ կերպով վերածվել պատկերների կամ տեսանյութերի՝ ավելի լավ պատկերացման համար:«