Pandas AI — это новый инструмент, созданный на основе библиотеки python pandas и использующий в своей работе генеративный ИИ и LLM. PandasAI генерирует информацию из данных, просто предоставляя текстовое приглашение.
Pandas ai упрощает анализ и визуализацию данных.
Вы можете загрузить любой CSV в pandas ai и использовать текстовое приглашение для визуализации и анализа данных. Не человек, а машина поймет, обработает предоставленную информацию и сгенерирует вывод без написания каких-либо формул csv/xsl.
Поддерживаемые модели:
Pandas ai в настоящее время поддерживает несколько моделей и постоянно развивается. Поддерживается несколько моделей, как указано ниже.
OpenAI StarCoder by Huggingface Falcon by Huggingface Google PaLM ChatGPT API
Цели обучения:
Этот учебник призван помочь вам достичь следующих целей обучения:
- Установите библиотеку пандасай.
- Настройте API_TOKEN, используя либо платформу OpenAI, либо платформу Hugging Face.
- Исследуйте и запускайте основные функции, предоставляемые pandasai.
- Выполняйте примеры, используя pandasai с предопределенными подсказками для экспериментов.
Обратите внимание, что хотя платформа OpenAI не является бесплатной, модель StarCoder от Hugging Face доступна бесплатно.
Код ниже может работать как для OpenAI, так и для Hugging Face.
!pip install --upgrade pandas pandasai
Сгенерировать токен API: (достаточно любого)
- Если у вас есть лицензия open ai или бесплатные кредиты, используйте ниже для получения токена API https://platform.openai.com/account/api-keys (ИЛИ)
- API-токен Huggingface https://huggingface.co/settings/tokens
# Import basis libraries !pip3 install PandasAI import pandas as pd from pandasai import PandasAI from pandasai.llm.openai import OpenAI from pandasai.llm.starcoder import Starcoder # Define 2 Models models = { "OpenAI": OpenAI, "Starcoder": Starcoder, } #Select Model to Run model_to_run = 'Starcoder' print(f"Enter API for {model_to_run} platform") # Enter API Key API_KEY_HGFace ='<enter API key>' API_KEY_OPEN_AI='<enter API Key>' # Model Initialisation llm = models[model_to_run](api_token=API_KEY_HGFace) pandas_ai = PandasAI(llm, conversational=False, verbose=True) file_path='wrscore.csv'. # you can use any available online csv file most used ones are IMDB movie ratings df = pd.read_csv(file_path) print(df.size)
Примечание. Я использовал файл CSV, содержащий столбцы, как показано ниже.
stocksymbol earnings_date wrscore #( numeric 1 to 5) prompt = "Plot the bar chart where stocksymbol is TATAMOTORS.NS for each earnings_date, using different colors" response = pandas_ai.run(df, prompt=prompt, is_conversational_answer=False) print(response)
Ниже приведен вывод без единой строки кода для визуализации.
Как вы можете видеть из приведенных выше экспериментов, имея verbose=True
, мы можем видеть код, сгенерированный API LLM, а затем этот код запускается для создания и ответа на полный набор данных.
Еще одна подсказка
prompt = "list all stocksymbols where wrscore is above 4.5" response = pandas_ai.run(df, prompt=prompt, is_conversational_answer=False) print(response)