1. О словесной представимости упрощенных графов де Брейна (arXiv)

Автор : Антоний Владимирович Петюк

Аннотация: Граф G=(V,E) представим в виде слов, если существует слово w над алфавитом V такое, что буквы x и y чередуются в w тогда и только тогда, когда xy∈E. Графы, представимые в виде слов, обобщают несколько важных классов графов, таких как трехцветные графы, круговые графы и графы сравнимости. В литературе имеется большое количество исследований, посвященных графам, представимым в виде слов. В этой статье мы изучаем словесную представимость упрощенных графов де Брейна. Упрощенный граф де Брейна S(n,k) — это простой граф, полученный из графа де Брейна B(n,k) удалением ориентаций и петель и заменой нескольких ребер между парой вершин одним ребром. Графы де Брейна — ключевой объект комбинаторики слов, нашедший многочисленные применения, в частности, при сборке генома. Мы показываем, что бинарные упрощенные графы де Брейна (т.е. \ S(n,2)) представимы в виде слова для любого n≥1, а S(2,k) и S(3,k) не представимы в виде слова для k ≥3. Мы предполагаем, что все упрощенные графы де Брейна S(n,k) не представимы словами для n≥4 и k≥3

2. Обнаружение твитов троллей с использованием контекстуализированных представлений слов (arXiv)

Автор : Сейхмус Йылмаз, Султан Заврак

Аннотация: В этом исследовании мы стремились решить растущую проблему троллингового поведения в социальных сетях, разработав и оценив набор модельных архитектур для автоматического обнаружения твитов троллей. Используя методы глубокого обучения и предварительно обученные методы встраивания слов, такие как BERT, ELMo и GloVe, мы оценили производительность каждой архитектуры с использованием таких показателей, как точность классификации, оценка F1, AUC и точность. Наши результаты показывают, что методы встраивания BERT и ELMo работают лучше, чем метод GloVe, вероятно, из-за их способности обеспечивать контекстуализированное встраивание слов, которое лучше отражает нюансы и тонкости использования языка в социальных сетях. Кроме того, мы обнаружили, что кодировщики CNN и GRU работают одинаково с точки зрения оценки F1 и AUC, что свидетельствует об их эффективности в извлечении релевантной информации из входного текста. Было обнаружено, что наиболее эффективным методом является архитектура на основе ELMo, в которой используется классификатор GRU, с оценкой AUC 0,929. Это исследование подчеркивает важность использования контекстуализированных вложений слов и соответствующих методов кодирования в задаче обнаружения твитов троллей, которые могут помочь социальным системам улучшить их производительность в выявлении и устранении троллингового поведения на их платформах.