O‘ZBEK, TURK VA UYG‘UR TILLARIDA POS TEGLASH VA STEMMING

Authors

  • Botir Elov
  • Shahlo Hamroyeva
  • Oqila Abdullayeva
  • Zilola Xusainova
  • Nizomaddin Xudayberganov

Keywords:

nutq qismlari, teglash, nutq qismlarini teglash, stemming, axborot qidirish, IR, stemming algoritmlari.

Abstract

O‘zbek, turk va uyg‘ur tillari agglutinativ tilllar hisoblanib, morfologik jihatdan va so‘z shakllarining miqdori jihatidan murakkab hisoblanadi. Mazkur tillarda o‘zak va qo‘shimchalarni birlashtirish orqali yangi so‘z va so‘z shakllari hosil qilinadi. O‘zakka qo‘shimchalar qo‘shilganda fonetik uyg‘unlik va disgarmoniya yuzaga kelishi oqibatida ham fonetik, ham morfologik o‘zgarishlar yuzaga keladi. Bu vaziyat matnda so‘z shakllarni POS teglash va stemming jarayonida turli hal qilinishi kerak bo‘lgan muammolarni hosil qiladi. Ko‘pgina NLP vazifalarni hal qilishda so‘z shakllarini ularning o‘zakkacha qisqartirish (stemlash)ga to‘g‘ri keladi. So‘zdan barcha flektiv affikslarni olib tashlash va so‘zning qolgan qismini lemmatizatsiya qilish tabiiy tilni qayta ishlash (NLP)ning muhim vazifalaridan biri hisoblanib, ushbu jarayon stemming deb yuritiladi. Stemming jarayoni axborot qidirish (IR, Information Retrieval) tizimlarida muhim ahamiyat kasb etadi.

Downloads

Published

2023-05-09