Օպտիկական նիշերի ճանաչումը (OCR) վերաբերում է ծրագրային ապահովմանը, որը ստեղծում է տպագիր, տպագրված կամ ձեռագիր փաստաթղթի թվային տարբերակը, որը համակարգիչները կարող են կարդալ՝ առանց տեքստը ձեռքով մուտքագրելու կամ մուտքագրելու անհրաժեշտության: OCR-ն սովորաբար օգտագործվում է PDF ձևաչափով սկանավորված փաստաթղթերի վրա, բայց կարող է նաև ստեղծել համակարգչային ընթեռնելի տեքստի տարբերակ պատկերային ֆայլի մեջ:
Ինչ է OCR
OCR, որը նաև կոչվում է տեքստի ճանաչում, ծրագրային տեխնոլոգիա է, որը փոխակերպում է նիշերը, ինչպիսիք են թվերը, տառերը և կետադրական նշանները (նաև կոչվում են գլիֆեր) տպագիր կամ գրավոր փաստաթղթերից էլեկտրոնային ձևի, որն ավելի հեշտությամբ ճանաչվում և ընթերցվում է համակարգիչների կողմից և այլ ծրագրային ծրագրեր:Որոշ OCR ծրագրեր դա անում են, քանի որ փաստաթուղթը սկանավորվում կամ լուսանկարվում է թվային տեսախցիկով, իսկ մյուսները կարող են կիրառել այս գործընթացը նախկինում սկանավորված կամ լուսանկարված առանց OCR-ի փաստաթղթերի վրա: OCR-ն օգտատերերին թույլ է տալիս որոնել PDF փաստաթղթերում, խմբագրել տեքստը և վերաֆորմատավորել փաստաթղթերը:
Getty Images
Ինչի՞ համար է օգտագործվում OCR:
Արագ, ամենօրյա սկանավորման կարիքների համար OCR-ը կարող է մեծ խնդիր չլինել: Եթե դուք մեծ քանակությամբ սկանավորում եք անում, PDF ֆայլերում փնտրելու հնարավորությունը, որպեսզի գտնեք ձեզ անհրաժեշտը, կարող եք բավականին ժամանակ խնայել և ձեր սկաների ծրագրում OCR գործառույթն ավելի կարևոր դարձնել: Ահա մի քանի այլ բաներ, որոնք օգնում են OCR-ին.
- Տվյալների ավտոմատ մշակում և տվյալների մուտքագրում (Օրինակ. աշխատանքի դիմողների հետագծման համակարգեր ռեզյումեների համար):
- Սկանավորված գրքերը որոնելի դարձնելու համար:
- Ձեռագիր սկանավորումների վերածում համակարգչով ընթեռնելի տեքստի:
- Փաստաթղթերն ավելի օգտագործելի դարձնել ընթերցող ծրագրերի համար, որոնք օգնում են տեսողության խնդիրներ ունեցող օգտատերերին:
- Պահպանելով պատմական փաստաթղթերն ու թերթերը՝ միաժամանակ դարձնելով դրանք որոնելի։
- Տվյալների արդյունահանում և փոխանցում հաշվապահական ծրագրերին (Օրինակ՝ անդորրագրեր և հաշիվ-ապրանքագրեր):
- Փաստաթղթերի ինդեքսավորում՝ որոնման համակարգերի կողմից օգտագործելու համար:
- Վարորդների համարանիշների ճանաչում արագաչափի և կարմիր լույսի տեսախցիկի ծրագրաշարի միջոցով։
- Խոսքի սինթեզատորներ այն մարդկանց համար, ովքեր չեն կարողանում խոսել. տեսական ֆիզիկոս Սթիվեն Հոքինգը, թերեւս, խոսքի սինթեզատոր ծրագրի ամենահայտնի օգտվողն է:
Վերջին գիծ
Ինչու՞ պարզապես չլուսանկարել, այնպես չէ՞: Որովհետև դուք չեք կարողանա որևէ բան խմբագրել կամ որոնել տեքստը, քանի որ այն պարզապես պատկեր կլիներ: Փաստաթուղթը սկանավորելը և OCR ծրագրաշարի գործարկումը կարող են այդ ֆայլը վերածել մի բանի, որը կարող եք խմբագրել և որոնել:
OCR-ի պատմություն
Թեև տեքստի ճանաչման ամենավաղ օգտագործումը թվագրվում է 1914թ.-ին, OCR-ի հետ կապված տեխնոլոգիաների համատարած զարգացումն ու օգտագործումը սկսել են լրջորեն 1950-ական թվականներին, հատկապես շատ պարզեցված տառատեսակների ստեղծմամբ, որոնք ավելի հեշտ էր փոխակերպվում թվային: ընթեռնելի տեքստ. Այս պարզեցված տառատեսակներից առաջինը ստեղծվել է Դեյվիդ Շեպարդի կողմից և սովորաբար հայտնի է որպես OCR-7B: OCR-7B-ն այսօր էլ օգտագործվում է ֆինանսական արդյունաբերության մեջ վարկային և դեբետային քարտերի վրա օգտագործվող ստանդարտ տառատեսակի համար: 1960-ականներին փոստային ծառայությունները մի քանի երկրներում սկսեցին օգտագործել OCR տեխնոլոգիան՝ փոստի տեսակավորումը զգալիորեն արագացնելու համար, այդ թվում՝ ԱՄՆ-ում, Մեծ Բրիտանիայում, Կանադայում և Գերմանիայում: OCR-ը դեռևս հիմնական տեխնոլոգիան է, որն օգտագործվում է փոստային ծառայությունների փոստը տեսակավորելու համար ամբողջ աշխարհում: 2000թ.-ին OCR տեխնոլոգիայի սահմանների և հնարավորությունների հիմնական գիտելիքներն օգտագործվել են CAPTCHA ծրագրերի մշակման համար, որոնք օգտագործվում են բոտերին և սպամերներին կանգնեցնելու համար:
Տասնամյակների ընթացքում OCR-ն դարձել է ավելի ճշգրիտ և կատարելագործված՝ կապված տեխնոլոգիական ոլորտներում առաջընթացների շնորհիվ, ինչպիսիք են արհեստական ինտելեկտը, մեքենայական ուսուցումը և համակարգչային տեսլականը:Այսօր OCR ծրագրաշարն օգտագործում է օրինաչափությունների ճանաչում, առանձնահատկությունների հայտնաբերում և տեքստի մայնինգ՝ փաստաթղթերն ավելի արագ և ճշգրիտ փոխակերպելու համար, քան երբևէ։
ՀՏՀ
Ինչպե՞ս կարող եմ սկանավորել փաստաթղթերը իմ հեռախոսի կամ պլանշետի միջոցով:
iOS-ում բացեք Notes հավելվածը և ստեղծեք նոր նշում: Բացեք տեսախցիկը և սեղմեք Փաստաթղթերի սկան: Android-ում բացեք Google Drive-ը և ընտրեք Plus (+), ապա հպեք Scan՝ սկանավորելու համար: փաստաթուղթ ձեր հեռախոսով։
Ինչպե՞ս կարող եմ OCR օգտագործել Adobe Acrobat-ում:
Բացեք PDF ֆայլ, որը պարունակում է սկանավորված պատկեր, ապա ընտրեք Գործիքներ > Խմբագրել PDF: Acrobat-ը ավտոմատ կերպով կկիրառի OCR, որպեսզի կարողանաք խմբագրել տեքստը: Պարզապես ընտրեք, թե որտեղ եք ցանկանում խմբագրել և սկսեք մուտքագրել:
Ո՞րն է տարբերությունը OCR-ի և OMR-ի միջև:
Optical Mark Recognition-ը (OMR) ծրագրաշար է, որը հայտնաբերում է նշանները թղթի վրա, որպես կանոն, փուչիկների թերթիկ:OMR-ն օգտագործվում է քննությունների, հարցումների, հարցաթերթիկների և նույնիսկ ընտրությունների արդյունքները մշակելու համար: Ի տարբերություն OCR-ի, OMR-ը չի կարող վերծանել էջի նշանները, այլ միայն ստուգել, որ նշաններն այնտեղ են: