CLARIN TIZIMIDAGI OG‘ZAKI KORPUSLAR XUSUSIDA

Авторы

  • Nilufar Muradova

Ключевые слова:

Clarin tizimi, korpus, og‘zaki korpus, lemmatizatsiya, qidiruv tizimi.

Аннотация

Raqamli texnologiyalarning rivojlangani barcha sohalarda o‘z aksini topmoqda. Xususan, tilshunoslikda til korpuslarini yaratish, tabiiy tilga ishlov berish (NLP), mashina tarjimasi masalalari dolzarb. Albatta, bu tadqiqotlar tilimizning rivojlanishi va yashovchanligini oshirishga xizmat qiladi. Bunda, asosan, til korpuslari ahamiyatlidir. Dunyo tilshunosligida mukammal, kengaytirilgan qidiruv imkoniyatiga ega yirik korpus tizimlari ishlab chiqilgan. Bulardan biri Clarin tizimidir. Clarin – til ma’lumotlarini kashf qilish, o‘rganish, izoh qo‘shish, tahlil qilish, birlashtirish va lingvistik tadqiqot o‘tkazish imkonini beradi. Bu tizimga bir qancha til korpuslari ham kiritilgan. Ushbu maqolada Clarin tizimining maqsad, vazifa, imkoniyatlari; tizimdagi korpus, subkorpus, shuningdek, og‘zaki korpuslar tavsiflangan. Og‘zaki korpuslarning turlari, imkoniyatlari va qidiruv tizimi bayon etilgan. Xususan, chex tili og‘zaki korpusi haqida umumiy ma’lumot, korpusning ishlash tizimi, subkorpusdan farqi, qidiruv imkoniyatlari o‘rganilgan.

Загрузки

Опубликован

2024-06-11