Ci-dessous, je groupe d'abord mon data.frame ( d
) par deux variables catégoriques. Premièrement, par gender
(2 niveaux; H / F). Deuxièmement, par sector
( éducation, industrie, ONG, privé, public ). Ensuite, je veux échantillonner à partir de chaque niveau de sector
avec les probabilités suivantes:, c(.2, .3, .3, .1, .1)
et gender
en suivant les probabilités c(.4, .6)
.
J'utilise le code ci-dessous pour atteindre mon objectif sans succès? Y a-t-il une solution à cela?
Pourriez-vous s'il vous plaît commenter si généralement mon code fait ce que je décris correctement?
d <- read.csv('https://raw.githubusercontent.com/rnorouzian/d/master/su.csv')
library(tidyverse)
set.seed(1)
(out <- d %>%
group_by(gender,sector) %>%
slice_sample(n = 2, weight_by = c(.4, .6, .2, .3, .3, .1, .1))) # `Error: incorrect number of probabilities`