Алгоритм разработки словаря для создания автоматизированной модели классификации текстов

dc.contributor.authorЖаксыбаев, Д. О.
dc.date.accessioned2023-09-20T06:16:41Z
dc.date.available2023-09-20T06:16:41Z
dc.date.issued2023
dc.description.abstractАвтоматизированные модели классификации текстов необходимы в различных областях, включая научные исследования. Алгоритм CountVectorizer является широко используемым подходом для извлечения признаков в моделях классификации текстов. Однако стандартный алгоритм CountVectorizer может оказаться неэффективным при извлечении релевантных признаков для конкретных задач, таких как классификация научных текстов. В данной работе предлагается модифицированный алгоритм CountVectorizer, который фокусируется на глагольных сочетаниях слов в научных текстах на тему экологии на казахском языке. Предложенный алгоритм достиг точности 0,604, что превосходит оригинальный алгоритм CountVectorizer и классификатор TfidfVectorizer. Наш анализ результатов показывает, что предложенный алгоритм может повысить точность моделей автоматической классификации текстов, особенно для научных текстов по экологии. Кроме того, мы предполагаем, что будущие исследования могут быть направлены на улучшение работы предложенного алгоритма для других научных тем и языков. В целом, наше исследование вносит вклад в разработку более эффективных моделей классификации текстов для научных исследований.ru
dc.identifier.urihttp://hdl.handle.net/123456789/2629
dc.language.isoruru
dc.publisherҒылым, зерттеулер, білім беру: даму үрдістері: ХХІІІ халықаралық ғылыми-практ. конф. материалдары=Science, research, education: development trends: The materials of the XXIII international scientific and practical conf. =Наука, исследования, образование: тенденции развития: мат. ХХІІІ междунар. науч.-практ. конф. (Уральск, 14 апреля 2023 г.) / ЗКАТУ им. Жангир хана // Ғылым және білім=Наука и образование=Science and education. - 2023. - № 2 (71) : прил. к журналу № 3.ru
dc.subjectнаучный журналru
dc.subjectконференцииru
dc.subjectотечественное изданиеru
dc.subjectмашинное обучениеru
dc.subjectинформатикаru
dc.subjectавтоматизированная классификация текстовru
dc.subjectалгоритм составления словаряru
dc.subjectАлгоритм CountVectorizerru
dc.subjectобработка естественного языкаru
dc.titleАлгоритм разработки словаря для создания автоматизированной модели классификации текстовru
dc.typeArticleru

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
НиО 2023 №2-3 (71)_200-210.pdf
Size:
850.99 KB
Format:
Adobe acrobat reader

License bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description: