Хобрук: Ваш путь к мастерству в программировании

Делим по урнам с пандами

У меня есть кадр данных в pandas, который выглядит ниже. Индекс представляет собой объект даты и времени, упорядоченный по дням и разделенный на 5-минутные интервалы. У меня есть столбец с именем «col1». Так что если я сделаю

df['col1']

Я получил:

DateTime
2008-04-28 09:40:00     300.0
2008-04-28 09:45:00    -800.0
2008-04-28 09:50:00       0.0
2008-04-28 09:55:00    -100.0
2008-04-28 10:00:00       0.0    
2008-04-29 09:40:00     500.0
2008-04-29 09:45:00     800.0
2008-04-29 09:50:00     100.0
2008-04-29 09:55:00    -100.0
2008-04-29 10:00:00       0.0

У меня есть еще один кадр данных в pandas, полученный с использованием groupby в исходном кадре данных с использованием

df2 = df([df.index.time])[['col2']].mean()    

который выводит:

           col2
09:40:00   4603.585657
09:45:00   5547.011952
09:50:00   8532.007952
09:55:00   6175.298805
10:00:00   4236.055777

Что я хотел бы сделать, так это разделить col1 на col2 для каждого из 5-минутных интервалов без использования цикла for. Чтобы лучше объяснить, для всех дней для каждого бина разделите col1 на col2. Например, разделите все значения 9:40:00 в col1 на значение 9:40:00 в col2.

Я понятия не имею, как начать делать это без цикла for, но у меня сложилось впечатление, что это должно быть выполнимо с пандами.

Ожидаемый результат:

DateTime
2008-04-28 09:40:00     300.0/4603.585657
2008-04-28 09:45:00    -800.0/5547.011952
2008-04-28 09:50:00       0.0/8532.007952
2008-04-28 09:55:00    -100.0/6175.298805
2008-04-28 10:00:00       0.0/4236.055777  
2008-04-29 09:40:00     500.0/4603.585657
2008-04-29 09:45:00     800.0/5547.011952
2008-04-29 09:50:00     100.0/8532.007952
2008-04-29 09:55:00    -100.0/6175.298805
2008-04-29 10:00:00       0.0/4236.055777

  • groupby 5 minutes? Я думаю, не все случаи такие, но здесь нет временных шагов ‹, чем 5 минут 19.03.2019
  • извините, группапо дню 19.03.2019
  • Я ответил, что вы пытаетесь сделать? 19.03.2019
  • Не знаю, я сейчас очень потерян. Извиняюсь. Я пытаюсь понять. 19.03.2019
  • @python_энтузиаст - Можете ли вы добавить ожидаемый результат? 19.03.2019
  • Итак, вы хотите ежедневно группировать df1 и делить каждое значение на соответствующее ему среднее значение? 19.03.2019
  • @yatu да! каждое 5-минутное значение, деленное на среднее значение за все дни для этого бина. 19.03.2019
  • Да, основываясь на вашем обновлении, вы хотите сгруппировать, используя только время индекса даты и времени, поэтому используйте @jezraels sol 19.03.2019
  • @yatu - Извини, yatu... 19.03.2019

Ответы:


1

Если нужно разделить на раз:

df['new'] = df['col1'].div(df.groupby(df.index.time)['col1'].transform('mean'))
print (df)
                      col1   new
DateTime                        
2008-04-28 09:40:00  300.0  0.75
2008-04-28 09:45:00 -800.0  -inf
2008-04-28 09:50:00    0.0  0.00
2008-04-28 09:55:00 -100.0  1.00
2008-04-28 10:00:00    0.0   NaN
2008-04-29 09:40:00  500.0  1.25
2008-04-29 09:45:00  800.0   inf
2008-04-29 09:50:00  100.0  2.00
2008-04-29 09:55:00 -100.0  1.00
2008-04-29 10:00:00    0.0   NaN

Или, если нужно разделить по дням:

df['new'] = df['col1'].div(df.groupby(df.index.date)['col1'].transform('mean'))
print (df)
                      col1       new
DateTime                            
2008-04-28 09:40:00  300.0 -2.500000
2008-04-28 09:45:00 -800.0  6.666667
2008-04-28 09:50:00    0.0 -0.000000
2008-04-28 09:55:00 -100.0  0.833333
2008-04-28 10:00:00    0.0 -0.000000
2008-04-29 09:40:00  500.0  1.923077
2008-04-29 09:45:00  800.0  3.076923
2008-04-29 09:50:00  100.0  0.384615
2008-04-29 09:55:00 -100.0 -0.384615
2008-04-29 10:00:00    0.0  0.000000
19.03.2019
  • Как это делит col1 на col2? 19.03.2019
  • Что такое print (df2.index[:10])? 19.03.2019
  • Индекс([09:35:00, 09:40:00, 09:45:00, 09:50:00, 09:55:00, 10:00:00, 10:05:00, 10:10:00 , 10:15:00, 10:20:00], dtype='объект') 19.03.2019
  • @python_энтузиаст - и print (type(df2.index[0])) ? 19.03.2019
  • ‹класс 'datetime.time'› 19.03.2019
  • извините, можно еще вопросы? 19.03.2019
  • Я не знаю, как здесь появляется col2 19.03.2019
  • я должен изменить второй col1 на col2? 19.03.2019
  • @python_энтузиаст - Да, решать вам. вместо col2 используется df.groupby(df.index.time)['col1'].transform('mean') 19.03.2019
  • Я понимаю! Спасибо еще раз! 19.03.2019
  • Новые материалы

    Создание кнопочного меню с использованием HTML, CSS и JavaScript
    Вы будете создавать кнопочное меню, которое имеет состояние наведения, а также позволяет вам выбирать кнопку при нажатии на нее. Финальный проект можно увидеть в этом Codepen . Шаг 1..

    Внедрите OAuth в свои веб-приложения для повышения безопасности
    OAuth — это широко распространенный стандарт авторизации, который позволяет приложениям получать доступ к ресурсам от имени пользователя, не раскрывая его пароль. Это позволяет пользователям..

    Классы в JavaScript
    class является образцом java Script Object. Конструкция «class» позволяет определять классы на основе прототипов с чистым, красивым синтаксисом. // define class Human class Human {..

    Как свинг-трейдеры могут использовать ИИ для больших выигрышей
    По мере того как все больше и больше профессиональных трейдеров и активных розничных трейдеров узнают о возможностях, которые предоставляет искусственный интеллект и машинное обучение для улучшения..

    Как построить любой стол
    Я разработчик программного обеспечения. Я люблю делать вещи и всегда любил. Для меня программирование всегда было способом создавать вещи, используя только компьютер и мое воображение...

    Обзор: Машинное обучение: классификация
    Только что закончил третий курс курса 4 часть специализации по машинному обучению . Как и второй курс, он был посвящен низкоуровневой работе алгоритмов машинного обучения. Что касается..

    Разработка расширений Qlik Sense с qExt
    Использование современных инструментов веб-разработки для разработки крутых расширений Вы когда-нибудь хотели кнопку для установки переменной в приложении Qlik Sense? Когда-нибудь просили..