Сравнение асинхронных и синхронизирующих вызовов с API GPT OpenAI

Как разработчики, мы часто оказываемся на распутье: работать асинхронно или оставаться синхронизированным? В условиях растущей популярности приложений реального времени и требований пользователей к немедленному реагированию понимание последствий для производительности имеет решающее значение. На примере GPT API OpenAI мы рассмотрим различия между асинхронным и синхронным временем ответа.

Представьте, что вам поручено создать чат-бота с использованием API GPT OpenAI. У вас все настроено, но возникает вопрос: синхронно или асинхронно это реализовать? Ответ на этот вопрос может существенно повлиять на взаимодействие с пользователем, особенно если ожидается несколько одновременных взаимодействий с пользователем.

Чтобы увидеть разницу в производительности, мы смоделируем несколько пользователей, одновременно отправляющих запросы нашему чат-боту. Затем мы измерим время ответа как синхронизированных, так и асинхронных конечных точек.

Обзор кода:

Используя FastAPI, я разработал две версии конечной точки нашего чата: традиционный синхронный маршрут и его асинхронный аналог.

Синхронная конечная точка:

@app.post(“/chat-sync/”)
def chat_sync(request_data: RequestModel):
 # Process the request and obtain a response from OpenAI
 message_history_as_dicts = […]
 llm_output = openai.ChatCompletion.create(
 model=llm.model,
 messages=[…]
 )
 response = llm_output.get(‘choices’)[0].get(‘message’).get(‘content’)
 return {“response”: response}

Асинхронная конечная точка:

@app.post(“/chat/”)
async def chat(request_data: RequestModel):
 # Process the request and obtain a response from OpenAI
 message_history_as_dicts = […]
 llm_output = await openai.ChatCompletion.acreate(
 model=llm.model,
 messages=[…]
 )
 response = llm_output.get(‘choices’)[0].get(‘message’).get(‘content’)
 return {“response”: response}

Скрипт для отправки параллельных запросов:

import aiohttp
import asyncio
import time

API_URL = "http://127.0.0.1:8080"

SAMPLE_DATA = {
 “user_input”: “Hello”,
 “system_message”: “You are a helpful assistant.”,
 “message_history”: []
}

async def fetch(session, url, data):
   async with session.post(url, json=data) as response:
   return await response.text()

async def main(endpoint):
   async with aiohttp.ClientSession() as session:
   tasks = [fetch(session, f”{API_URL}{endpoint}”, SAMPLE_DATA) for _ in range(5)]
   return await asyncio.gather(*tasks)

Результаты:

После выполнения результаты нарисовали четкую картину:

Async endpoint took: 1.08 seconds
Sync endpoint took: 4.10 seconds

Асинхронный дизайн с его неблокирующей природой продемонстрировал свое мастерство, обработав 5 запросов чуть более чем за секунду. Напротив, синхронная версия заняла более чем в четыре раза больше времени, что подчеркивает эффективность асинхронного программирования, особенно для задач, связанных с вводом-выводом, таких как вызовы API.

Если вы используете такие сервисы, как GPT API OpenAI для чат-ботов или подобных приложений, применение асинхронного подхода может значительно повысить производительность и удовлетворенность пользователей.

Заключительные мысли:

Хотя преимущества асинхронного программирования очевидны, очень важно учитывать потребности вашего конкретного приложения. В определенных сценариях простота и понятность синхронного кода могут быть предпочтительнее. Однако для востребованных приложений реального времени асинхронность, несомненно, лучше всего подходит.

Новые материалы

Создание успешной организации по науке о данных

"Рабочие часы" Создание успешной организации по науке о данных Как создать эффективную группу по анализу данных! Введение Это обзорная статья о том, как создать эффективную группу по..

Технологии и проблемы будущей работы

Изучение преимуществ и недостатков технологий в образовании В быстро меняющемся мире технологии являются решающим фактором в формировании будущего работы. Многие отрасли уже были..

Игорь Минар из Google приедет на #ReactiveConf2017

Мы рады сообщить еще одну замечательную новость: один из самых востребованных спикеров приезжает в Братиславу на ReactiveConf 2017 ! Возможно, нет двух других кланов разработчиков с более..

Я собираюсь научить вас Python шаг за шагом

Привет, уважаемый энтузиаст Python! 👋 Готовы погрузиться в мир Python? Сегодня я приготовил для вас кое-что интересное, что сделает ваше путешествие более приятным, чем шарик мороженого в..

Альтернатива шаблону исходящих сообщений для архитектуры микросервисов

Познакомьтесь с двухэтапным сообщением В этой статье предлагается альтернативный шаблон для папки Исходящие : двухэтапное сообщение. Он основан не на очереди сообщений, а на..

React on Rails

Основное приложение Reverb - это всеми любимый монолит Rails. Он отлично обслуживает наш API и уровень просмотра трафика. По мере роста мы добавляли больше интерактивных элементов..

Что такое гибкие методологии разработки программного обеспечения

Что представляют собой гибкие методологии разработки программного обеспечения в 2023 году Agile-методологии разработки программного обеспечения заключаются в следующем: И. Введение A...

Метки

Machine Learning JavaScript Data Science Artificial Intelligence Software Development Web Development Python Coding Deep Learning AI React Software Engineering Nodejs Development Typescript Data Java NLP Front End Development Computer Science Algorithms Learning Programming Languages ChatGPT Tech Tutorial Productivity Reactjs React Native Angular Cybersecurity Javascript Development Python Programming Developer CSS Swift Learning To Code Science