Загадка параллелизма в системах бронирования

Недавно я участвовал в обсуждении с коллегой извечной проблемы обработки дубликатов при бронировании. Я был удивлен, обнаружив, что даже по прошествии стольких лет не существует хорошей коллекции всех различных способов справиться с этим.

Итак, вот я рассказываю вам о проблеме и различных способах ее решения:

Проблема

Это распространенная проблема, которая может проявляться одним из следующих способов:

Один и тот же пользователь несколько раз нажимает кнопку «Забронировать».
Несколько пользователей пытаются одновременно забронировать одно и то же место/комнату/слот.
Как Airbnb, BookMyShow и MakeMyTrip обрабатывают одновременные запросы на бронирование

Чтобы правильно понять проблему, давайте предположим следующее:

Допустим, у нас есть таблица с именем booking. Я предположил упрощенный дизайн, который можно использовать для любого из упомянутых выше случаев.

2. Существует два способа двойного бронирования:

Пользователи нажимают кнопку «Книга» / API несколько раз

Несколько пользователей пытаются забронировать одно и то же место, особенно в случае с популярным фильмом/шоу и рейсами, это происходит часто

3. Первую проблему легко решить, и ее может решить как клиент, так и сервер, о чем я расскажу в другой статье. Здесь давайте подробно сосредоточимся на проблеме нескольких пользователей, пытающихся забронировать одно и то же место/комнату.

Решения

Несколько пользователей пытаются забронировать одно и то же место

В приведенном выше случае, если наш сервис просто проверяет перед новым бронированием, забронировано ли место, у нас возникнет проблема, если будет n одновременных запросов, что приведет к многократному бронированию одного и того же места.

Самый простой способ решить описанную выше проблему: Блокировка базы данных (оптимистичная и пессимистичная)

Оптимистическая блокировка

Это самый простой способ обеспечить сохранение качества данных. Оптимистическая блокировка — это стратегия, при которой вы читаете запись, записываете номер версии и проверяете, что версия не изменилась, прежде чем записывать запись обратно.

С такими фреймворками, как Spring Data JPA, это легко реализовать с помощью аннотаций. Подробнее об этом можно прочитать на https://www.baeldung.com/jpa-optimistic-locking.

Для таких систем, как Hotel Booking, где количество запросов/запросов/транзакций в секунду может быть не очень высоким, это отличный вариант.

Когда этого недостаточно

Когда есть много одновременных запросов, скажем, как в случае с бронированием рейсов или популярным фильмом, это имеет большие последствия для производительности. Оптимистическая блокировка плохо работает, если одновременно происходит много конфликтов, потому что это приводит к необходимости отказа от многих транзакций.

Если система уже работает с максимальной пропускной способностью, повторная попытка транзакции может снизить производительность. Со временем система сможет обрабатывать все транзакции по порядку, но в то же время некоторые из них могут испытывать задержки.

Пессимистическая блокировка

Пессимистическая блокировка — это блокировка записи для вашего исключительного использования до тех пор, пока вы не закончите с ней работать. Он имеет гораздо лучшую целостность, чем оптимистическая блокировка, но требует осторожности при разработке приложения, чтобы избежать взаимоблокировок.

Он основан на принципе, что если что-то потенциально может пойти не так, лучше подождать, пока ситуация снова не станет безопасной, прежде чем что-либо предпринимать (Аналогично взаимному исключению в многопоточности).

Системы РСУБД, такие как Postgres, MYSQL и ORACLE, предоставляют способы сделать это.

Даже в ORMS, таких как Spring Data JPA, есть простой способ сделать это. В этой статье подробно объясняется это
https://www.baeldung.com/java-jpa-transaction-locks#:~:text=When%20using%20Pessimistic%20Locking%2C%20, укажите% 20значение%20lock%20timeout%20.

Теперь между двумя вышеперечисленными мы бы предположили, что все проблемы будут решены, но здесь начинается сложность.

Что происходит в распределенной системе

Блокировка в распределенной среде — это больше, чем просто мьютекс в многопоточных приложениях. Это более изощренно и сложно, потому что теперь эта блокировка может быть получена разными узлами в системе, и любой из них может выйти из строя. Это многократно увеличивает сложность, поскольку нам нужно, чтобы остальная часть нашей системы по-прежнему работала безупречно, даже если один или несколько узлов вышли из строя.

Распределенные блокировки

Распределенная блокировка — это метод, используемый для координации доступа к общим ресурсам между несколькими процессами в распределенной системе. Основная цель состоит в том, чтобы гарантировать, что только один процесс одновременно может получить доступ к определенному ресурсу, предотвращая условия гонки, повреждение данных или несогласованность.

Для реализации мы можем использовать некоторые решения, такие как:

Redis использует библиотеки, реализующие алгоритмы блокировки, такие как ShedLock и Redisson. Использование этого не рекомендуется, как описано в (https://martin.kleppmann.com/2016/02/08/how-to-do-distributed-locking.html)
Hazelcast предлагает систему блокировки на основе своей подсистемы CP. (https://hazelcast.com/blog/long-live-distributed-locks/)
Zookeeper, я подробно расскажу об этом ниже.

Реализация распределенной блокировки с помощью Apache ZooKeeper

Apache ZooKeeper — это служба распределенной координации, которую можно использовать для реализации распределенной блокировки. В следующем примере кода Java демонстрируется базовая распределенная блокировка с использованием ZooKeeper.

import org.apache.zookeeper.ZooKeeper;
import org.apache.curator.framework.CuratorFramework;
import org.apache.curator.framework.CuratorFrameworkFactory;
import org.apache.curator.retry.ExponentialBackoffRetry;
import org.apache.curator.framework.recipes.locks.InterProcessMutex;

import java.util.concurrent.TimeUnit;

public class DistributedLock {
    private CuratorFramework client;
    private InterProcessMutex lock;

    public DistributedLock(String zkConnectionString, String lockPath) {
        client = CuratorFrameworkFactory.newClient(zkConnectionString, new ExponentialBackoffRetry(1000, 3));
        client.start();
        lock = new InterProcessMutex(client, lockPath);
    }

    public boolean acquire(long waitTime, TimeUnit timeUnit) {
        try {
            return lock.acquire(waitTime, timeUnit);
        } catch (Exception e) {
            e.printStackTrace();
            return false;
        }
    }

    public void release() {
        try {
            lock.release();
        } catch (Exception e) {
            e.printStackTrace();
        }
    }

    public void close() {
        client.close();
    }
}

Применение

public static void main(String[] args) {
    String zkConnectionString = "127.0.0.1:2181";
    String lockPath = "/my_resource_lock";

    DistributedLock lock = new DistributedLock(zkConnectionString, lockPath);

    // Acquire the lock
    if (lock.acquire(100, TimeUnit.MILLISECONDS)) {
        // Access the shared resource
        // Perform your operations here

        // Release the lock
        lock.release();
    }

    // Close the ZooKeeper connection
    lock.close();

}

Блокировка приобретения

Блокировка выпуска

Используя Apache ZooKeeper, мы реализовали распределенный механизм блокировки на Java, который помогает поддерживать согласованность и координировать доступ к общим ресурсам в распределенной системе. Этот механизм позволяет процессам устанавливать и снимать блокировки, гарантируя, что только один процесс имеет доступ к определенному ресурсу в каждый момент времени.

Новые материалы

Dall-E 2: недавние исследования показывают недостатки в искусстве, созданном искусственным интеллектом

DALL-E 2 — это всеобщее внимание в индустрии искусственного интеллекта. Люди в списке ожидания пытаются заполучить продукт. Что это означает для развития креативной индустрии? О применении ИИ в..

«Очень простой» эволюционный подход к обучению с подкреплением

В прошлом семестре я посетил лекцию по обучению с подкреплением (RL) в моем университете. Честно говоря, я присоединился к нему официально, но я редко ходил на лекции, потому что в целом я нахожу..

Освоение информационного поиска: создание интеллектуальных поисковых систем (глава 1)

Глава 1. Поиск по ключевым словам: основы информационного поиска Справочная глава: «Оценка моделей поиска информации: подробное руководство по показателям производительности » Глава 1: «Поиск..

Фишинг — Упаковано и зашифровано

Будучи старшим ИТ-специалистом в небольшой фирме, я могу делать много разных вещей. Одна из этих вещей: специалист по кибербезопасности. Мне нравится это делать, потому что в настоящее время я..

ВЫ РЕГРЕСС ЭТО?

Чтобы понять, когда использовать регрессионный анализ, мы должны сначала понять, что именно он делает. Вот простой ответ, который появляется, когда вы используете Google: Регрессионный..

Не зря же это называют интеллектом

Стек — C#, Oracle Опыт — 4 года Работа — Разведывательный корпус Мне пора служить Может быть, я немного приукрашиваю себя, но там, где я живу, есть обязательная военная служба на 3..

LeetCode Проблема 41. Первый пропущенный положительный результат

LeetCode Проблема 41. Первый пропущенный положительный результат Учитывая несортированный массив целых чисел, найдите наименьшее пропущенное положительное целое число. Пример 1: Input:..

Метки

Machine Learning JavaScript Data Science Artificial Intelligence Software Development Web Development Python Coding Deep Learning React AI Software Engineering Nodejs Development Data Typescript Java NLP Front End Development Computer Science Algorithms Learning Programming Languages ChatGPT Tech Tutorial Reactjs Angular React Native Cybersecurity Productivity Neural Networks Python Programming Javascript Development HTML Developer Javascript Tips CSS