Title: Електронні частотні морфемні словники в Корпусі української мови
Other Titles: Electronic Dictionary of Frequency of Morphemic in the Corpus of the Ukrainian Language
Authors: Зубань, Оксана Миколаївна
Zuban, O. M.
Bibliographic description (Ukraine): Зубань О. Електронні частотні морфемні словники в Корпусі української мови / О. Зубань // Науковий вісник Східноєвропейського національного університету імені Лесі Українки. Серія : Філологічні науки. Мовознавство. – Луцьк, 2015. – № 3. – С. 315–320.
Keywords: морфемно-словотвірна база даних
Morphemic-Derivational Data Base
морфемний аналіз
мorphemic analys
Корпус української мови
Сorpus of the Ukrainian language
Abstract: У статті описано частотні морфемні словники (, укладені автоматично на базі текстів Т. Шевченка в Корпусі української мови. Морфемний сегментатор українського тексту в Корпусі української мови – це система, на вході якої знаходяться лексеми аналізованого тексту, представлені у вигляді алфавітно-частотного словника, а на виході – ті ж самі лексеми, індексовані кодами граматичної належності до певної частини мови та розчленовані на морфи – кореневі й афіксальні – з відповідними індексами. Модуль морфем¬ного аналізу в Корпусі української мови – це зручний лінгвістичний інструмент, який допоможе користувачеві в автоматичному режимі проводити дослідження з морфеміки та словотвору на базі величезного ілюстра¬тивного текстового матеріалу Корпусу української мови, що дозволить отримати нові знання про семантичну та формальну структуру українського слова, проводити різноманітні класифікаційні аналізи лексики за кількісно-морфними моделями; створювати кореневі, афіксальні та словотвірні словники різних стилів і дискурсів. The article presents Electronic dictionary of frequency of morphemic (, which was automatically constructed based on texts by T. Shevchenko in the Corpus of the Ukrainian language. The morphic segmentator of the Ukrainian text – is a system, on the input of which there are lexemes (or word forms) of an analysed text. They are presented in a form of an alphabetic-frequency dictionary. On its output there are the same lexemes (word forms)that are index-linked by the codes of grammatical belonging to a definite part of speech and are split into morphs – root morphs, affixal morphs with a proper index. The morphemic analys of the Corpus of the Ukrainian language – is a convenient linguistic tool, which in an online mode helps the user to carry out the research on the study of morphemes and derivation on the basis of a great number of illustrative textual materials of the corpus of the Ukrainian language, which enables to get new knowledge about the semantic and formal structure of the Ukrainian word. It also enables: to carry out various classifying analyses of vocabulary according to the quantitative and morphic models; to form root dictionaries, dictionary of affixes and derivational dictionaries of different styles and discourses.
