Работа с представлениями Word, часть 2 (интеллектуальный анализ данных)

О словесной представимости упрощенных графов де Брейна (arXiv)

Аннотация: Граф G=(V,E) представим в виде слов, если существует слово w над алфавитом V такое, что буквы x и y чередуются в w тогда и только тогда, когда xy∈E. Графы, представимые в виде слов, обобщают несколько важных классов графов, таких как трехцветные графы, круговые графы и графы сравнимости. В литературе имеется большое количество исследований, посвященных графам, представимым в виде слов. В этой статье мы изучаем словесную представимость упрощенных графов де Брейна. Упрощенный граф де Брейна S(n,k) — это простой граф, полученный из графа де Брейна B(n,k) удалением ориентаций и петель и заменой нескольких ребер между парой вершин одним ребром. Графы де Брейна — ключевой объект комбинаторики слов, нашедший многочисленные применения, в частности, при сборке генома. Мы показываем, что бинарные упрощенные графы де Брейна (т.е. \ S(n,2)) представимы в виде слова для любого n≥1, а S(2,k) и S(3,k) не представимы в виде слова для k ≥3. Мы предполагаем, что все упрощенные графы де Брейна S(n,k) не представимы словами для n≥4 и k≥3

2. Обнаружение твитов троллей с использованием контекстуализированных представлений слов (arXiv)

Автор : Сейхмус Йылмаз, Султан Заврак

Аннотация: В этом исследовании мы стремились решить растущую проблему троллингового поведения в социальных сетях, разработав и оценив набор модельных архитектур для автоматического обнаружения твитов троллей. Используя методы глубокого обучения и предварительно обученные методы встраивания слов, такие как BERT, ELMo и GloVe, мы оценили производительность каждой архитектуры с использованием таких показателей, как точность классификации, оценка F1, AUC и точность. Наши результаты показывают, что методы встраивания BERT и ELMo работают лучше, чем метод GloVe, вероятно, из-за их способности обеспечивать контекстуализированное встраивание слов, которое лучше отражает нюансы и тонкости использования языка в социальных сетях. Кроме того, мы обнаружили, что кодировщики CNN и GRU работают одинаково с точки зрения оценки F1 и AUC, что свидетельствует об их эффективности в извлечении релевантной информации из входного текста. Было обнаружено, что наиболее эффективным методом является архитектура на основе ELMo, в которой используется классификатор GRU, с оценкой AUC 0,929. Это исследование подчеркивает важность использования контекстуализированных вложений слов и соответствующих методов кодирования в задаче обнаружения твитов троллей, которые могут помочь социальным системам улучшить их производительность в выявлении и устранении троллингового поведения на их платформах.

Новые материалы

Повышайте продуктивность, создавая лучший код Python

Все приемы, которые я изучил на Python, чтобы писать лучший и быстрый код Представление длинных цифр Очень сложно отследить количество нулей или цифр после определенной длины. А теперь вот..

Распределение выборки и центральная предельная теорема

В нашем реальном мире мы часто ищем параметр или статистику определенной совокупности, например среднее значение или стандартное отклонение. Но оценить эту статистику по населению достаточно..

Различные алгоритмы машинного обучения

Машинное обучение ( ML ) — это изучение компьютерных алгоритмов, которые автоматически улучшаются благодаря опыту. [1] Оно рассматривается как подмножество искусственного интеллекта ...

Очередь сообщений RabbitMQ с использованием веб-API .NET Core 6

Мы собираемся обсудить очередь сообщений RabbitMQ и ее реализацию с использованием .NET Core 6 API в качестве производителя сообщений и консольного приложения в качестве потребителя сообщений...

Варианты графовых нейронных сетей и реализация в TensorFlow

См. Graph Neural Networks и реализация в TensorFlow для введения и основ. Существует множество вариантов GNN, в том числе сверточные сети графов (GCN), GraphSAGE, сети внимания графов (GAT) и..

Построение классификатора изображений без использования глубокого обучения

Классификатор изображений можно легко построить с помощью глубокого обучения, особенно сверточной нейронной сети (CNN). Однако вы можете просто реализовать классификатор изображений, используя..

Я вижу так много неправильного в этой пьесе, что трудно даже организовать…

Я вижу так много неправильного в этой статье, что трудно даже организовать опровержение, но я постараюсь. В произвольном порядке: А) IQ НЕ является показателем «неразумности», крайнего или иного..

Метки

Machine Learning JavaScript Data Science Artificial Intelligence Software Development Web Development Python Coding Deep Learning AI React Software Engineering Nodejs Development Data Java NLP Typescript Computer Science Learning Front End Development Algorithms Tutorial Productivity Angular ChatGPT Tech Programming Languages Javascript Development CSS Neural Networks Python Programming Developer Cybersecurity Science React Native HTML Data Visualization