Хобрук: Ваш путь к мастерству в программировании

Что происходит внутри, когда вы указываете больше разделов, чем количество доступных ядер?

Например, у моего ноутбука 8 ядер, и если я отправлю:

sc.parallelize(1 to 100, 30).count

Выполняет ли он сначала 8 задач, а затем остальные 22 задачи выполняются одна за другой, когда ядро ​​становится доступным?

Есть ли способ проверить, что происходит под капотом, через SparkUI или журналы?

09.02.2017

Ответы:


1

Выполняет ли он сначала 8 задач, а затем остальные 22 задачи выполняются одна за другой, когда ядро ​​становится доступным?

Да. Пользовательский интерфейс Spark имеет представление временной шкалы событий для наблюдения за ним [1]. Вы также можете увидеть, когда задача была запущена в журналах Spark.

[1] https://databricks.com/blog/2015/06/22/understanding-your-spark-application-through-visualization.html

10.02.2017
  • Ссылка оказалась очень полезной! Дополнительный вопрос: если количество задач никогда не может превышать количество ядер, то нет причин/выгод когда-либо назначать больше разделов, чем количество ядер, верно? 10.02.2017
  • Полностью зависит от данных, например, плохое разделение, перекосы данных, отставшие (медленные узлы). Я бы рассмотрел возможность использования большего количества разделов, чем количество ядер, если ваши разделы большие, а накладные расходы на планирование задач довольно низкие. 11.02.2017
  • Извините, я не понял ваш последний ответ (из-за моих ограниченных знаний). Я создал еще один вопрос для этого. Не могли бы вы ответить там? stackoverflow.com/questions/42284477/ 16.02.2017
  • Новые материалы

    Создание кнопочного меню с использованием HTML, CSS и JavaScript
    Вы будете создавать кнопочное меню, которое имеет состояние наведения, а также позволяет вам выбирать кнопку при нажатии на нее. Финальный проект можно увидеть в этом Codepen . Шаг 1..

    Внедрите OAuth в свои веб-приложения для повышения безопасности
    OAuth — это широко распространенный стандарт авторизации, который позволяет приложениям получать доступ к ресурсам от имени пользователя, не раскрывая его пароль. Это позволяет пользователям..

    Классы в JavaScript
    class является образцом java Script Object. Конструкция «class» позволяет определять классы на основе прототипов с чистым, красивым синтаксисом. // define class Human class Human {..

    Как свинг-трейдеры могут использовать ИИ для больших выигрышей
    По мере того как все больше и больше профессиональных трейдеров и активных розничных трейдеров узнают о возможностях, которые предоставляет искусственный интеллект и машинное обучение для улучшения..

    Как построить любой стол
    Я разработчик программного обеспечения. Я люблю делать вещи и всегда любил. Для меня программирование всегда было способом создавать вещи, используя только компьютер и мое воображение...

    Обзор: Машинное обучение: классификация
    Только что закончил третий курс курса 4 часть специализации по машинному обучению . Как и второй курс, он был посвящен низкоуровневой работе алгоритмов машинного обучения. Что касается..

    Разработка расширений Qlik Sense с qExt
    Использование современных инструментов веб-разработки для разработки крутых расширений Вы когда-нибудь хотели кнопку для установки переменной в приложении Qlik Sense? Когда-нибудь просили..