Ինչպես է աշխատում Google-ի Hum to Search ֆունկցիան

Բովանդակություն:

Ինչպես է աշխատում Google-ի Hum to Search ֆունկցիան
Ինչպես է աշխատում Google-ի Hum to Search ֆունկցիան
Anonim

Հիմնական տանողներ

  • Google-ը գործարկել է նոր գործիք, որը թույլ է տալիս օգտատերերին երգեր որոնել բզզալով, երգելով կամ սուլելով:
  • Նոր գործիքը օգտագործում է մեքենայական ուսուցում, որը համընկնում է հնչեցված հետքերը ավելի քան կես միլիոն երգերի տվյալների բազայի հետ, որոնք անընդհատ թարմացվում են:
  • Google-ի օգտատերերը հարցնում են, թե որ երգն է հնչում ամեն ամիս մոտ 100 անգամ:
Image
Image

Google-ը գործարկել է նոր գործառույթ, որը կոչվում է «Hum to Search»՝ լուծելու հիասթափեցնող խնդիր. երգը խրված է ձեր գլխում և չկարողանալով հասկանալ, թե ինչ է այն կոչվում:

Երգ գտնելու համար բզզալու գաղափարը աներևակայելի պարզ է թվում, ուստի ինչու՞ է Google-ը գործարկում այս գործառույթը միայն 2020 թվականին: Դե, պարզվում է, որ երգերի այս կերպ նույնականացումը իրականում բավականին բարդ է, մասամբ այն պատճառով, որ մեր հռհռացող տարբերակները հակված են բավականին տարբերվել սկզբնական ուղուց: Իր արհեստական ինտելեկտի բլոգում վերջերս արված գրառման մեջ Google-ը բացատրում է, թե ինչպես է օգտագործել մեքենայական ուսուցումն այս խնդիրը լուծելու համար և, ի վերջո, օգնում է մարդկանց գտնել երգը՝ բզզելով, սուլելով կամ երգելով մեղեդին, նույնիսկ երբ դրանց կատարումը ճշգրիտ չէ:

«Hum to Search-ի մեր նպատակն է օգնել մարդկանց բացահայտել և գտնել իրենց գլխում խրված երաժշտությունը», - ասաց Google-ի ներկայացուցիչը Lifewire-ին նամակում:

Պարզապես սկսեք բզզալ

Google-ի օգտատերերը հարցնում են, թե որ երգն է հնչում գրեթե 100 միլիոն անգամ ամեն ամիս,- ասաց Google-ի փոխնախագահ և սպառողական գնումների գլխավոր մենեջեր Ապառնա Չեննապրագադան մի տեսանյութ, որը ներկայացնում է որոնման մի քանի նոր հնարավորություններ: Այժմ կա պարզելու միջոց։

«Hum to Search» ֆունկցիան ներկառուցված է Google-ի բջջային հավելվածում, Google Search վիջեթում և Google Assistant-ում: Հավելվածի միջոցով այն մուտք գործելու համար հպեք խոսափողի պատկերակին և ասեք «What’s this song»: «Որոնել երգ» կոճակի ընտրությունը նույնպես գործում է։

Ճիշտ աշխատելու համար գործառույթը պահանջում է, որ դուք բզզեք առնվազն 10-15 վայրկյան: Android-ի օգտատերերը կարող են բզզալ՝ ավելի քան 20 լեզուներով երգեր գտնելու համար, մինչդեռ iPhone-ներում միայն անգլերեն երգերն են աշխատում: Գործիքը միշտ չէ, որ կարողանում է միանգամից նույնականացնել երգը, բայց երբ դա հաջողվի, արդյունքները բավականին լավ են:

«Փոփոխականների լայն շարքի երգերի կեսից ավելին (հնչյուն, բարձրություն, ձայն և այլն) ճանաչվում են մեր ալգորիթմներով, բայց, իհարկե, ճշգրտությունը կախված է բզզոցի որակից, տեսակից։ երգը և ավելին»,- ասել է Google-ի ներկայացուցիչը Lifewire-ին նամակում: «Բայց երբ այն ճանաչվի, հինգ պատասխաններից մոտավորապես չորսը ճիշտ են»:

Սա առաջին դեպքը չէ, սակայն, որ օգտագործվում է երաժշտությունը նույնականացնող հավելվածում:SoundHound-ն առաջարկում է նմանատիպ հնարավորություն, ինչպես նշում է CNN Business-ը, և հասանելի է նաև Android-ի և iOS-ի համար: Ըստ Google-ի խոսնակի, նոր գործառույթը գաղտնիության հետ կապված որևէ մտահոգություն չի առաջացնում, ոչ էլ «փոխում է այն ձևը, թե ինչպես է Google-ը վարում աուդիո վրա հիմնված փոխազդեցությունները», - ասել են նրանք Lifewire-ին նամակում::

Մեքենայի ուսուցում

Չնայած հայեցակարգի պարզությանը, ստուդիայի ձայնագրությունը գտնելու համար մեղեդի բզզելը տեխնիկապես բավականին դժվար է: Դրա համար կան մի քանի պատճառներ, բացատրում է Google Research-ի Քրիստիան Ֆրանկը նոյեմբերի 12-ի բլոգի գրառման մեջ: Առաջին հերթին, երգի հռհռացող տարբերակը կարող է էապես տարբերվել իրական ձայնագրությունից, ինչը դժվարացնում է այդ երկուսին համապատասխանելը: Այսպիսով, չնայած Shazam-ը և մի շարք այլ հավելվածներ արդեն գոյություն ունեն ռեստորանում կամ այլ հասարակական վայրում լսած երգը նույնականացնելու համար, այդ որոնման հիմքում օգտագործելով բզզոց մեղեդին կարող է ավելի բարդ լինել:

«Երգի խոսքերով, ֆոնային վոկալով և գործիքներով երաժշտական կամ ստուդիական ձայնագրության ձայնը կարող է բավականին տարբերվել հռհռացող մեղեդուց», - գրում է Ֆրենկը:«Սխալմամբ կամ դիզայնով, երբ ինչ-որ մեկը բզզում է երգի իր մեկնաբանությունը, հաճախ հնչյունը, ստեղնը, տեմպը կամ ռիթմը կարող են փոքր-ինչ կամ նույնիսկ զգալիորեն տարբերվել»:

Image
Image

Քանի որ երգերի բզզված տարբերակները կարող են շատ տարբերվել բնօրինակներից, Ֆրենկը նշում է, որ անցյալի շատ մեթոդներ պահանջել են համապատասխանեցնել մարդու բզզոցը երգի այն տարբերակին, որն ունի միայն մեղեդի, կամ երգ, որը ներառում է բզզոց: Սա դժվար է դարձրել իրական աշխարհի օգտագործման դեպքերը, քանի որ այդ երգերի տվյալների շտեմարանները կարող են սահմանափակվել և անհրաժեշտ է ձեռքով թարմացնել:

Google-ը բացատրում է, որ Hum to Search ֆունկցիայի համար այն օգտագործում է մեքենայական ուսուցման մոդելներ՝ ձայնը վերածելու «թվերի վրա հիմնված հաջորդականության», որը ներկայացնում է երգի մեղեդին. այն, ինչ ասում է, կարելի է դիտարկել որպես «մատնահետք»: «

Օգտատերերի համար ավելի հարմար

Google-ի Hum to Search գործառույթում մեքենայական ուսուցման օգտագործումը, ի վերջո, շատ ավելի հեշտ է դարձնում գործիքի օգտագործումը իրական աշխարհում:Քանի որ Hum to Search-ը համընկնում է որոնողի հնչած մեղեդու հետ իրական երգի հետ, գործիքը ի վիճակի է աշխատել նոր երգերի հետ, երբ դրանք թողարկվում են տվյալների բազայի փոխարեն, որն անընդհատ պետք է թարմացվի յուրաքանչյուր երգի հմմմմված տարբերակներով: Բացի այդ, այն օգտագործելու համար ձեզ պետք չէ կատարյալ բարձրացում:

«Ներկայիս համակարգը հասնում է բարձր ճշգրտության երգերի տվյալների բազայում, որը պարունակում է ավելի քան կես միլիոն երգ, որոնք մենք անընդհատ թարմացնում ենք», - ասվում է Google-ի Hum to Search հայտարարության մեջ: «Այս երգի կորպուսը դեռ աճելու տեղ ունի՝ ներառելու աշխարհի բազմաթիվ մեղեդիներ»:

Խորհուրդ ենք տալիս: