Делим по урнам с пандами

У меня есть кадр данных в pandas, который выглядит ниже. Индекс представляет собой объект даты и времени, упорядоченный по дням и разделенный на 5-минутные интервалы. У меня есть столбец с именем «col1». Так что если я сделаю

df['col1']

Я получил:

DateTime
2008-04-28 09:40:00     300.0
2008-04-28 09:45:00    -800.0
2008-04-28 09:50:00       0.0
2008-04-28 09:55:00    -100.0
2008-04-28 10:00:00       0.0    
2008-04-29 09:40:00     500.0
2008-04-29 09:45:00     800.0
2008-04-29 09:50:00     100.0
2008-04-29 09:55:00    -100.0
2008-04-29 10:00:00       0.0

У меня есть еще один кадр данных в pandas, полученный с использованием groupby в исходном кадре данных с использованием

df2 = df([df.index.time])[['col2']].mean()

который выводит:

           col2
09:40:00   4603.585657
09:45:00   5547.011952
09:50:00   8532.007952
09:55:00   6175.298805
10:00:00   4236.055777

Что я хотел бы сделать, так это разделить col1 на col2 для каждого из 5-минутных интервалов без использования цикла for. Чтобы лучше объяснить, для всех дней для каждого бина разделите col1 на col2. Например, разделите все значения 9:40:00 в col1 на значение 9:40:00 в col2.

Я понятия не имею, как начать делать это без цикла for, но у меня сложилось впечатление, что это должно быть выполнимо с пандами.

Ожидаемый результат:

DateTime
2008-04-28 09:40:00     300.0/4603.585657
2008-04-28 09:45:00    -800.0/5547.011952
2008-04-28 09:50:00       0.0/8532.007952
2008-04-28 09:55:00    -100.0/6175.298805
2008-04-28 10:00:00       0.0/4236.055777  
2008-04-29 09:40:00     500.0/4603.585657
2008-04-29 09:45:00     800.0/5547.011952
2008-04-29 09:50:00     100.0/8532.007952
2008-04-29 09:55:00    -100.0/6175.298805
2008-04-29 10:00:00       0.0/4236.055777

python pandas pandas-groupby

19.03.2019

groupby 5 minutes? Я думаю, не все случаи такие, но здесь нет временных шагов ‹, чем 5 минут 19.03.2019
извините, группапо дню 19.03.2019
Я ответил, что вы пытаетесь сделать? 19.03.2019
Не знаю, я сейчас очень потерян. Извиняюсь. Я пытаюсь понять. 19.03.2019
@python_энтузиаст - Можете ли вы добавить ожидаемый результат? 19.03.2019
Итак, вы хотите ежедневно группировать df1 и делить каждое значение на соответствующее ему среднее значение? 19.03.2019
@yatu да! каждое 5-минутное значение, деленное на среднее значение за все дни для этого бина. 19.03.2019
Да, основываясь на вашем обновлении, вы хотите сгруппировать, используя только время индекса даты и времени, поэтому используйте @jezraels sol 19.03.2019
@yatu - Извини, yatu... 19.03.2019

Ответы:

Если нужно разделить на раз:

df['new'] = df['col1'].div(df.groupby(df.index.time)['col1'].transform('mean'))
print (df)
                      col1   new
DateTime                        
2008-04-28 09:40:00  300.0  0.75
2008-04-28 09:45:00 -800.0  -inf
2008-04-28 09:50:00    0.0  0.00
2008-04-28 09:55:00 -100.0  1.00
2008-04-28 10:00:00    0.0   NaN
2008-04-29 09:40:00  500.0  1.25
2008-04-29 09:45:00  800.0   inf
2008-04-29 09:50:00  100.0  2.00
2008-04-29 09:55:00 -100.0  1.00
2008-04-29 10:00:00    0.0   NaN

Или, если нужно разделить по дням:

df['new'] = df['col1'].div(df.groupby(df.index.date)['col1'].transform('mean'))
print (df)
                      col1       new
DateTime                            
2008-04-28 09:40:00  300.0 -2.500000
2008-04-28 09:45:00 -800.0  6.666667
2008-04-28 09:50:00    0.0 -0.000000
2008-04-28 09:55:00 -100.0  0.833333
2008-04-28 10:00:00    0.0 -0.000000
2008-04-29 09:40:00  500.0  1.923077
2008-04-29 09:45:00  800.0  3.076923
2008-04-29 09:50:00  100.0  0.384615
2008-04-29 09:55:00 -100.0 -0.384615
2008-04-29 10:00:00    0.0  0.000000

19.03.2019

Как это делит col1 на col2? 19.03.2019

Что такое print (df2.index[:10])? 19.03.2019

Индекс([09:35:00, 09:40:00, 09:45:00, 09:50:00, 09:55:00, 10:00:00, 10:05:00, 10:10:00 , 10:15:00, 10:20:00], dtype='объект') 19.03.2019

@python_энтузиаст - и print (type(df2.index[0])) ? 19.03.2019

‹класс 'datetime.time'› 19.03.2019

извините, можно еще вопросы? 19.03.2019

Я не знаю, как здесь появляется col2 19.03.2019

я должен изменить второй col1 на col2? 19.03.2019

@python_энтузиаст - Да, решать вам. вместо col2 используется df.groupby(df.index.time)['col1'].transform('mean') 19.03.2019

Я понимаю! Спасибо еще раз! 19.03.2019

Новые материалы

Создание кнопочного меню с использованием HTML, CSS и JavaScript

Вы будете создавать кнопочное меню, которое имеет состояние наведения, а также позволяет вам выбирать кнопку при нажатии на нее. Финальный проект можно увидеть в этом Codepen . Шаг 1..

Внедрите OAuth в свои веб-приложения для повышения безопасности

OAuth — это широко распространенный стандарт авторизации, который позволяет приложениям получать доступ к ресурсам от имени пользователя, не раскрывая его пароль. Это позволяет пользователям..

Классы в JavaScript

class является образцом java Script Object. Конструкция «class» позволяет определять классы на основе прототипов с чистым, красивым синтаксисом. // define class Human class Human {..

Как свинг-трейдеры могут использовать ИИ для больших выигрышей

По мере того как все больше и больше профессиональных трейдеров и активных розничных трейдеров узнают о возможностях, которые предоставляет искусственный интеллект и машинное обучение для улучшения..

Как построить любой стол

Я разработчик программного обеспечения. Я люблю делать вещи и всегда любил. Для меня программирование всегда было способом создавать вещи, используя только компьютер и мое воображение...

Обзор: Машинное обучение: классификация

Только что закончил третий курс курса 4 часть специализации по машинному обучению . Как и второй курс, он был посвящен низкоуровневой работе алгоритмов машинного обучения. Что касается..

Разработка расширений Qlik Sense с qExt

Использование современных инструментов веб-разработки для разработки крутых расширений Вы когда-нибудь хотели кнопку для установки переменной в приложении Qlik Sense? Когда-нибудь просили..

Метки

Machine Learning JavaScript Data Science Artificial Intelligence Software Development Web Development Python Coding Deep Learning React AI Software Engineering Nodejs Development Typescript Data Java NLP Front End Development Computer Science Algorithms Learning Programming Languages ChatGPT Tutorial Tech Reactjs Angular Productivity React Native Cybersecurity Python Programming Javascript Development HTML Learning To Code Developer Neural Networks Swift