У меня есть набор данных с несколькими переменными, которые представляют пациентов, идентификаторы лабораторий и результаты. Это выглядит примерно так:
id lab.1 result.1 lab.2 result.2 lab.3 result.3 lab.4 result.4
1 110 2039 0 2039 0 NA NA NA NA
2 203 1778 5694 1778 908 1778 786 NA NA
3 218 13490 579 13490 276 1067 243 13490 152
4 222 495 0 495 495 0 495 495 0
5 231 1067 966117 306 82794 NA NA NA NA
6 238 2821 89 2821 NA NA NA NA NA
Проблема в том, что мне нужно создать новую переменную, которая указывает, одинакова ли лаборатория во всех переменных «лаборатории» (0/1). Результат, который я ожидаю, выглядит следующим образом:
samelab
1 1
2 1
3 0
4 1
5 0
6 1
Однако многие переменные являются NA, и я не могу понять, как это решить, поскольку я не могу перекодировать NA, потому что это что-то значит.
Я пытался использовать df$samelab = ifelse(df$lab.1 == df$lab.2 & df$lab.3 & df$lab.4, 1, 0)
, но он дает результаты NA.
Буду очень признателен за любую помощь в решении этой проблемы. Спасибо!