У меня есть набор данных, которые я пытаюсь отсортировать по размеру, однако размер элементов сильно варьируется от ~ 140 КБ до ~ 130 ГБ, поэтому отображение в байтах вообще не очень легко читается. Я могу изменить входные данные, чтобы они имели удобочитаемые размеры, но когда я вывожу их в виде графика, они не упорядочены, как можно было бы ожидать. Как бы я отсортировал это по удобочитаемости?
Код:
library(ggplot2)
mydata <- read.csv("/path/to/test.csv")
restore.df = data.frame(
Start = as.POSIXct(mydata$start),
Size = mydata$size,
Labels = gsub(" [0-9]{1,2}:[0-9]{1,2}:[0-9]{1,2}","",mydata$start)
)
p <- ggplot(restore.df, aes(x=Start,y=Size)) + geom_point()
p + scale_x_date(date_labels = "%y-%m-%d", limits = as.Date('2018-06-14', "%y-%m-%d"), as.Date('2018-06-20', "%Y-%m-%d"))
png(filename="/path/to/test.png",width=1368,height=1060,units="px")
print(p)
dev.off()
Результат: а>
Сокращенный набор данных:
start,stop,time,size
"2018-06-14 17:30:05","2018-06-14 17:30:05",3.6,7.3G
"2018-06-14 17:33:47","2018-06-14 17:33:47",1.05,304M
"2018-06-14 17:35:07","2018-06-14 17:35:07",62.9666666666667,132G
"2018-06-14 23:33:51","2018-06-14 23:33:51",0,880K
"2018-06-14 23:34:13","2018-06-14 23:34:13",1.16666666666667,305M
"2018-06-17 01:34:56","2018-06-17 01:34:56",20.2666666666667,6.2G
"2018-06-17 01:56:13","2018-06-17 01:56:13",15.7833333333333,9.4G
"2018-06-22 17:34:33","2018-06-22 17:34:33",0,144K