АВТОМАТИЗИРОВАННЫЙ КЛАСТЕРНЫЙ АНАЛИЗ
I. Укажите тексты какой тематики вы использовали?
1 текст был про Лаврова и разговорах об ударах по России американским оружием, 2 текст - Рублев вышел во второй круг "Ролан Гаррос", 3 текст - Фабрицио Романо сообщил о финальной стадии переговоров ПСЖ по Сафонову, 4 текст был про премьера Грузии и его мечте войти в ЕС и 5 текст был про то, что Израиль выпустил 8 ракет из района Рафаха.
II. Поясните на какие группы разделились выбранные вами тексты и дайте обоснование почему именно такие группы были выделены.
Анализ разделил их на две группы, в первой он собрал тексты на тему политики. А вот во второй группе он соединил тексты про спорт и политику. Не знаю почему он определил 5 текст именно в эту группу, так как в этой новости затрагиваются политические темы.
III. Оцените будет ли меняться число групп по общности текстов при изменении уровня кластеризации (меняется через перемещение разделителя масштаба анализа)? В какую сторону (меньшего числа групп текстов или большего числа?) происходят эти изменения?
Меняется, так как чем меньше масштаб анализа, тем тщательнее анализируются сходства текстов.
Комментарии
Отправить комментарий