Хобрук: Ваш путь к мастерству в программировании

Значимость проигрыша в классификации с Керасом

Я тренирую трехслойную нейронную сеть с помощью keras:

    model = models.Sequential()
    model.add(Conv2D(32, (3, 3), padding="same",
                     input_shape=input_shape, strides=2, kernel_regularizer=l2(reg)))

    model.add(BatchNormalization(axis=channels))
    model.add(Activation("relu"))
    model.add(Conv2D(64, (3, 3), padding="same",
                     input_shape=input_shape, strides=2, kernel_regularizer=l2(reg)))

    model.add(BatchNormalization(axis=channels))
    model.add(Activation("relu"))
    model.add(Conv2D(128, (3, 3), padding="same",
                     input_shape=input_shape, strides=2, kernel_regularizer=l2(reg)))

    model.add(BatchNormalization(axis=channels))
    model.add(Activation("relu"))
    model.add(layers.Flatten())
    model.add(layers.Dense(neurons, activation='relu', kernel_regularizer=l2(reg)))
    model.add(Dropout(0.50))
    model.add(Dense(2))
    model.add(Activation("softmax"))

Мои данные имеют два класса, и я использую разреженную категориальную перекрестную энтропию:

 model.compile(loss='sparse_categorical_crossentropy', optimizer=opt, metrics=['accuracy'])
 history = model.fit(x=X, y=y, batch_size=batch_size, epochs=epochs, validation_data=(X_val, y_val),
                            shuffle=True,
                            callbacks=callbacks,
                            verbose=1)

Мои данные имеют следующую форму:

X: (232, 100, 150, 3)
y: (232,)

Где X - изображения, а y - либо 1, либо 0, из-за использования функции разреженных потерь

Потери очень высоки как для точности, так и для проверки, даже если точность обучения равна 1! Я получаю значения больше 20 за убыток, что, как я понимаю, неразумно.

Если я настрою модель на несколько эпох и выведу прогнозы для меток и истинных значений, и я получу от них категориальную перекрестную энтропию, то полученное мной значение будет <1, как и ожидалось, даже когда я делаю расчет с функцией keras (я меняю на категоричный, потому что разреженный дает ошибку)

21/21 [==============================] - 7s 313ms/step - loss: 44.1764 - acc: 1.0000 - val_loss: 44.7084 - val_acc: 0.7857 

cce = tf.keras.losses.CategoricalCrossentropy()

    pred = model.predict(x=X_val, batch_size=len(X_val))
    loss = cce(true_categorical, pred)
    Categorical loss 0.6077293753623962

Есть ли способ точно узнать, как это рассчитывается и почему такие высокие значения? Размер партии 8.


Ответы:


1

Убыток, напечатанный Керасом, - это общая потеря. Регуляризация также является потерей, добавляемой к модели на основе значений весов.

Поскольку у вас много весов, вы также вносите большой вклад в общую потерю.

Вот почему он большой. Если вы удалите регуляризацию, вы увидите окончательные потери, равные категориальным потерям кроссэнтропии.

31.10.2019
  • Большое спасибо за быстрый ответ, похоже, это то, что я искал, поэтому я приму его. Есть ли шансы, что вы знаете, где находится полное определение потерь, включая регуляризацию, веса классов ...? 31.10.2019
  • Вы имеете в виду в исходном коде? Нет, это сложный код. 01.11.2019
  • Новые материалы

    Не зря же это называют интеллектом
    Стек — C#, Oracle Опыт — 4 года Работа — Разведывательный корпус Мне пора служить Может быть, я немного приукрашиваю себя, но там, где я живу, есть обязательная военная служба на 3..

    LeetCode Проблема 41. Первый пропущенный положительный результат
    LeetCode Проблема 41. Первый пропущенный положительный результат Учитывая несортированный массив целых чисел, найдите наименьшее пропущенное положительное целое число. Пример 1: Input:..

    Расистский и сексистский робот, обученный в Интернете
    Его ИИ основан на предвзятых данных, которые создают предрассудки. Он словно переходит из одного эпизода в другой из серии Черное зеркало , а вместо этого представляет собой хронику..

    Управление состоянием в микрофронтендах
    Стратегии бесперебойного сотрудничества Микро-фронтенды — это быстро растущая тенденция в сфере фронтенда, гарантирующая, что удовольствие не ограничивается исключительно бэкэнд-системами..

    Декларативное и функциональное программирование в стиле LINQ с использованием JavaScript с использованием каррирования и генератора ...
    LINQ - одна из лучших функций C #, которая обеспечивает элегантный способ написания кода декларативного и функционального стиля, который легко читать и понимать. Благодаря таким функциям ES6,..

    Структуры данных в C ++ - Часть 1
    Реализация общих структур данных в C ++ C ++ - это расширение языка программирования C, которое поддерживает создание классов, поэтому оно известно как C с классами . Он используется для..

    Как я опубликовал свое первое приложение в App Store в 13 лет
    Как все началось Все началось три года назад летом после моего четвертого класса в начальной школе. Для меня, четвертого класса, лето кажется бесконечным, пока оно не закончится, и мой отец..