Գիտնականներն օգտագործել են Twitter-ը` համակարգչին սարկազմը ճանաչել սովորեցնելու համար

Քարնեգիի համալսարանի գիտնականները օգտագործել են Twitter-ը` համակարգչային ալգորիթմ ստեղծելու համար, որը կճանաչի սարկազմը: Իրենց հետազոտության արդյունքի մասին նրանք պատմել են «Թվիթերում սարկազմի ենթատեքստային հայտնաբերում» գիտական աշխատության մեջ:

Տեքստի մեջ սարկազմ հայտնաբերելն այդքան էլ հեշտ չէ, քանզի նմանատիպ հումորները միայն կոնտեքստում են պարունակում հեգնական երանգ: Եթե խոսքի վերլուծություն արվի, համակարգիչը հնարավոր է ոչ մի հումոր չգտնի:

Դրա համար էլ հետազոտության համար գիտնականներն ընտրել են հենց Twitter-ը: Ալգորիթմում նրանք հաշվի են առել մի շարք կարևոր հանգամանքներ, ներառյալ «բանալի» բառերը (օրինակ՝  «շոկ» և «ապշել» , «ահա, իհարկե»), հեշթեգները (#lol, #sarcasm), ինչպես նաև գտնվելու վայրը, հեղինակի տարիքը, սեռը, այլ օգտատերերի հետ գրառումները, նախորդ թվիթները և այլն:

Շնորհիվ տեքստերի և ենթատեքստերի վերլուծության գիտնականներին հաջողվել է ստեղծել մի ծրագիր, որն արձանագրում է սարկազմի առկայություն 85% հավանականությամբ:

Հետազոտության շրջանակներում նաև պարզվել է, որ սարկազմի ավելի շատ հակված են արական սեռի ներկայացուցիչները։  Բացի այդ՝ հայտնաբերվել է, որ #sarcasm հեշթեգը հիմնականում օգտագործվում է այն մտքերի դեպքում, երբ մտավախություն կա, որ լսարանն իրենց ճիշտ չի հասկանա, այլ ոչ թե իրական սարկազմի դեպքում:

Սոցիալական ցանցերում դեպքերը շատ են, երբ օգտատերերի գրառումներն արգելափակվում են ինչ֊որ հումորի պատճառով, որը վերահսկող և ստուգող ալգորիթմերի կողմից ճիշտ չի ընկալվել:

Աղբյուրը՝ tjournal