Pandas AI — это новый инструмент, созданный на основе библиотеки python pandas и использующий в своей работе генеративный ИИ и LLM. PandasAI генерирует информацию из данных, просто предоставляя текстовое приглашение.

Pandas ai упрощает анализ и визуализацию данных.

Вы можете загрузить любой CSV в pandas ai и использовать текстовое приглашение для визуализации и анализа данных. Не человек, а машина поймет, обработает предоставленную информацию и сгенерирует вывод без написания каких-либо формул csv/xsl.



Поддерживаемые модели:

Pandas ai в настоящее время поддерживает несколько моделей и постоянно развивается. Поддерживается несколько моделей, как указано ниже.

OpenAI
StarCoder by Huggingface
Falcon by Huggingface
Google PaLM
ChatGPT API

Цели обучения:

Этот учебник призван помочь вам достичь следующих целей обучения:

  1. Установите библиотеку пандасай.
  2. Настройте API_TOKEN, используя либо платформу OpenAI, либо платформу Hugging Face.
  3. Исследуйте и запускайте основные функции, предоставляемые pandasai.
  4. Выполняйте примеры, используя pandasai с предопределенными подсказками для экспериментов.

Обратите внимание, что хотя платформа OpenAI не является бесплатной, модель StarCoder от Hugging Face доступна бесплатно.

Код ниже может работать как для OpenAI, так и для Hugging Face.

!pip install --upgrade pandas pandasai

Сгенерировать токен API: (достаточно любого)

  1. Если у вас есть лицензия open ai или бесплатные кредиты, используйте ниже для получения токена API https://platform.openai.com/account/api-keys (ИЛИ)
  2. API-токен Huggingface https://huggingface.co/settings/tokens
# Import basis libraries
!pip3 install PandasAI
import pandas as pd
from pandasai import PandasAI
from pandasai.llm.openai import OpenAI
from pandasai.llm.starcoder import Starcoder
# Define 2 Models
models = {
    "OpenAI": OpenAI,
    "Starcoder": Starcoder,
}
#Select Model to Run
model_to_run = 'Starcoder'
print(f"Enter API for {model_to_run} platform")
# Enter API Key
API_KEY_HGFace ='<enter API key>'
API_KEY_OPEN_AI='<enter API Key>'
# Model Initialisation
llm = models[model_to_run](api_token=API_KEY_HGFace)
pandas_ai = PandasAI(llm, conversational=False, verbose=True)
file_path='wrscore.csv'. # you can use any available online csv file most used ones are IMDB movie ratings 
df = pd.read_csv(file_path)
print(df.size)

Примечание. Я использовал файл CSV, содержащий столбцы, как показано ниже.

stocksymbol
earnings_date
wrscore       #( numeric 1 to 5)

prompt = "Plot the bar chart where stocksymbol is TATAMOTORS.NS for each earnings_date, using different colors"

response = pandas_ai.run(df, prompt=prompt, is_conversational_answer=False)
print(response)

Ниже приведен вывод без единой строки кода для визуализации.

Как вы можете видеть из приведенных выше экспериментов, имея verbose=True, мы можем видеть код, сгенерированный API LLM, а затем этот код запускается для создания и ответа на полный набор данных.

Еще одна подсказка

prompt = "list all stocksymbols where wrscore is above 4.5"

response = pandas_ai.run(df, prompt=prompt, is_conversational_answer=False)
print(response)