10 терминов и понятий, которые необходимо знать, чтобы лучше понять ChatGPT и LLM

Получите максимальную отдачу от онлайн-контента

Новая восходящая звезда экосистемы науки о данных и искусственного интеллекта — большие языковые модели (LLM). Быстрый рост популярности LLM начался с ChatGPT и вскоре стал преобладать в социальных сетях, блогах и научных статьях.

Эта статья предназначена для тех, кто хочет узнать о LLM, но им трудно понять содержание LLM из-за технических терминов или концепций предметной области.

Наука о данных и искусственный интеллект — очень широкие области, поэтому даже если вы работаете в этих областях, поначалу вам может быть трудно понять контент, связанный с LLM. Следовательно, знание того, что означают эти термины и понятия заранее, облегчает усвоение другого контента, связанного с LLM.

Трансформер

Трансформатор, впервые представленный в статье Внимание — это все, что вам нужно, представляет собой сетевую архитектуру, полностью основанную на механизме внимания.

Он направлен на устранение недостатков рекуррентных нейронных сетей, которые

медленно учатся
страдают от исчезающего градиента или долгосрочных зависимостей в случае длинных последовательностей

Внимание определяет, на какой части входной последовательности нам нужно сосредоточиться, а преобразователь содержит архитектуру кодера-декодера со слоями внимания.

Преобразователи могут параллельно обрабатывать входную последовательность, что решает проблему медленного обучения. Благодаря слоям внимания они не страдают от проблемы исчезающего градиента.

Модель большого языка (LLM)

Большая языковая модель — это, по сути, преобразователь очень большого масштаба. GPT расшифровывается как Генеративный предварительно обученный преобразователь.

Размер этих моделей обычно выражается числом параметров, которые исчисляются миллиардами.

Токен

LLM преобразуют текст в небольшие фрагменты перед их дальнейшей обработкой. Эти фрагменты называются токенами. Фрагменты обычно представляют собой отдельные слова, но это не всегда так. Иногда одно слово можно разделить на несколько фрагментов.

Новые материалы

Стратегия обновления базы данных React Native SQLite

Проблема: мне нужно обновить пользователей до моей новой схемы базы данных в React Native. Когда вы работаете с SQLite в React Native, вы неизбежно будете вносить изменения в структуру базы..

10 новых вещей, которые стоит прочитать об ИИ

# medium.com Пары знаменитостей больше не единственные, у кого есть умные совмещенные прозвища: Universal Robots USA Inc. Надоело ездить на работу? Понимание «беспокойства Airbnb решит..

Понимание описаний естественного языка, часть 2 (ИИ)

От слов к проводам: создание функционирующих электронных устройств на основе описаний на естественном языке (arXiv) Автор : Питер Янсен Аннотация: В этой работе мы показываем, что..

Обратные вызовы — Понимание запросов и ответов JavaScript API в жизненном цикле выборки данных

Обратный вызов — это метод программирования, при котором функция передается в качестве аргумента другой функции и выполняется. Перед этой статьей я упомянул вам, что я начну серию статей, и я..

Как отобразить PDF в iframe с помощью FileReader API

Все начинается в один прекрасный день, когда я получаю новую историю. Описание истории было следующим: «Я как пользователь хочу увидеть предварительный просмотр документа». Это казалось ясным...

Помните, что сотрудники Google забыли проверить факты о Барде

Первые дни апокалипсиса ИИ выявили худшее в нас всех Google был на красном коде с тех пор, как появление ChatGPT, предшественника Terminator, вошло в жизнь каждого с размахом. Как они..

Создание удаленно доступного кейлоггера с помощью Python

Простая программа на основе сокетов Что такое кейлоггер Кейлоггер — это программа, чаще всего ассоциируемая с хакерами. Хотя он также используется системными администраторами и..

Метки

Machine Learning JavaScript Data Science Artificial Intelligence Software Development Web Development Python Coding Deep Learning AI Software Engineering React Nodejs Development Data Java NLP Typescript Learning Front End Development Tutorial Productivity Algorithms Angular ChatGPT Computer Science Tech Javascript Development CSS Python Programming Programming Languages Developer Neural Networks ES6 HTML Cybersecurity React Native Self Improvement