Министерство просвещения Российской федерации

Министерство просвещения Российской Федерации
Томский государственный педагогический университет

УПРОЩЕНИЕ ПРОЦЕССА СОСТАВЛЕНИЯ АНКЕТ (ОТ УЧЕНЫХ МГУ)

Ученые факультета вычислительной математики и кибернетики МГУ предложили инновационную систему, которая эффективно подбирает контрольные вопросы для анкет с помощью обработки естественного языка. Созданная система дает возможность минимизировать количество ложной информации в исследованиях.

Для получения максимально корректных и правдивых ответов, правильных выводов и прогнозов в анкету добавляются контрольные вопросы, речь в которых идет об одном и том же, но с использованием различных формулировок. Если ответы на такие вопросы не совпадают, это может указывать на то, что респондент в целом был не очень искренним. Однако создание таких контрольных вопросов может быть сложным и требовать значительных усилий и временных затрат.
Для решения этой проблемы ученые разработали инновационную систему, предназначенную для облегчения процесса составления анкет и эффективного подбора контрольных вопросов с помощью методов обработки естественного языка для поиска похожих вопросов в анкетах и определения наиболее подходящих контрольных вопросов.

№ п/п Методы, применяемые в системе Основы метода Преимущества метода
1.

TF-IDF

(Term Frequency-Inverse Document Frequency)
Основывается на анализе частоты встречаемости слов и обратной частоты документов, что позволяет определить наиболее значимые слова в тексте, использованные для описания его содержания  Облегчает поиск информации в больших коллекциях документов
2. Латентно-семантический анализ (LSA) Использует математическую модель и статистические методы для определения семантических связей между словами в документе. Это позволяет выявить наиболее важные слова, связанные с тематическим направлением, и определить степень их схожести с другими вопросами Помогает более точно подбирать контрольные вопросы и избегать повторений или путаницы
3. Тематическое моделирование Основывается на алгоритмах машинного обучения. С помощью этих алгоритмов система автоматически выявляет наиболее вероятные комбинации тем и слов, обсуждаемых в документах Система определяет распределение вероятностей для каждой темы в каждом документе, что облегчает поиск вопросов, содержащих схожие темы

Использование данной системы значительно упрощает процесс составления анкет, а время и усилия, затрачиваемые экспертами на этот процесс, сокращаются. Эффективность системы уже была подтверждена при составлении анкет с вопросами из областей психологии и социологии. Результаты исследования были представлены на Всероссийской конференции «Ломоносовские чтения-2023».

Источник: МГУ имени М. В. Ломоносова.

 

 
 
 
 

Путеводитель по сайту

Чтобы сообщить о найденной на сайте ошибке - выделите текст ошибки и нажмите CTRL + ENTER