我有一个100000行的数据集,其中order_date显示订单日期,user_id显示用户的ID。我正在尝试创建一个新变量来显示用户在同一天内的总订单。我的数据是这样的:
order_date=structure(c(15587, 15647, 15734, 15560, 15599, 15778, 15708,
15520, 15592, 15447, 15718, 15787, 15519, 15486, 15514, 15784,
15619, 15705, 15552, 15734, 15493, 15661, 15563, 15600, 15790,
15485, 15546, 15767, 15704, 15726), class = "Date")
user_id=c(22607, 28275, 32238, 20202, 4391, 7983, 29590, 11820, 22956,
3196, 31125, 11709, 6586, 2920, 9698, 36814, 6954, 30368, 19052,
827, 6599, 517, 8761, 20174, 37367, 11647, 18764, 27271, 30302,
14808)
daten = data.frame(order_date = order_date, user_id = user_id)
我使用的是以下代码:
daten<-join(daten, count(daten, c("order_date", "user_id")))
它创建了一个名为"freq“的新变量,它一直工作到今天。现在它不起作用了,我收到了如下的错误消息:
mutate_impl(.data,点)中出错:列c("order_date", "user_id")
的长度必须为100000 (行数)或1,而不是2
我使用str
检查了这两个变量的结构,结果显示它们都有100000行。
转载请注明出处:http://www.souyuntu.com/article/20230526/2248284.html