source("common.R") # Beschreibung der Punktzahl summary(sites$score) # Punkte ## Verteilung der Punkte ggplot(sites, aes(score)) + geom_histogram(bins = 15) + labs(title="Verteilung der Punktzahlen", x="Punktzahl", y="Anzahl Sites") ggsave("plots/punkte_verteilung.png") ## Verteilung der Punktzahlen (nur KV) summary(sites_kv$score) ggplot(sites_kv, aes(score)) + geom_histogram(bins = 15) + labs(title="Verteilung der Punktzahlen (nur KV)", x="Punktzahl", y="Anzahl Sites") ggsave("plots/punkte_verteilung_kv.png") ## Verteilung der Punktzahlen (nur OV) summary(sites_ov$score) ggplot(sites_ov, aes(score)) + geom_histogram(bins = 15) + labs(title="Verteilung der Punktzahlen (nur OV)", x="Punktzahl", y="Anzahl Sites") ggsave("plots/punkte_verteilung_ov.png") ## Punkte nach Gliederungsebene ggplot(sites, aes(x = reorder(meta.level, score, FUN=median), y = score)) + coord_flip() + geom_boxplot() + labs(title="Punktzahl nach Gliederungsebene", x="Gliederung", y="Punkte") ggsave("plots/punkte_nach_gliederungsebene.png") ## Punkte KV nach Bundesland ggplot(sites_kv, aes(x=reorder(meta.state, -score, FUN=median), y=score)) + coord_flip() + geom_boxplot() + labs(title="Punktzahl nach Bundesland", x="Bundesland", y="Punkte") ggsave("plots/punkte_kv_nach_bundesland.png") ## Punkte nach CMS ggplot(sites_top_cms, aes(x=reorder(generator, -score, FUN=median), y=score)) + coord_flip() + geom_boxplot() + labs(title="Punktzahl nach CMS", y="Punkte", x="CMS") ggsave("plots/punkte_nach_cms.png") ## Einzelne Site-Kriterien # Feeds nach CMS ggplot(sites_top_cms, aes(rating.FEEDS.value)) + geom_bar(aes(fill = generator)) + scale_x_discrete(labels=c("Ohne Feed","Mit Feed")) + scale_fill_discrete(name = "CMS") + labs(title="Sites mit und ohne Feed nach CMS", x="", y="Anzahl Sites") ggsave("plots/feeds_nach_cms_a.png") ggplot(sites_top_cms, aes(generator)) + geom_bar(aes(fill = rating.FEEDS.value)) + coord_flip() + scale_fill_discrete(name = "Feed vorhanden", labels = c("Nein", "Ja")) + labs(title="Sites mit und ohne Feed nach CMS", x="", y="Anzahl Sites") ggsave("plots/feeds_nach_cms_b.png") ## Alle Kriterien sites_rating_criteria <- select(sites, rating.DNS_RESOLVABLE_IPV4.value, rating.SITE_REACHABLE.value, rating.CANONICAL_URL.value, rating.WWW_OPTIONAL.value, rating.HTTPS.value, rating.RESPONSIVE.value, rating.CONTACT_LINK.value, rating.SOCIAL_MEDIA_LINKS.value, rating.NO_NETWORK_ERRORS.value, rating.NO_SCRIPT_ERRORS.value, rating.NO_THIRD_PARTY_COOKIES.value, rating.FAVICON.value, rating.USE_SPECIFIC_FONTS.value, rating.FEEDS.value, ) sites_rating_criteria_long <- tidyr::gather(sites_rating_criteria, key = type_col, value = categories) sapply(sites_rating_criteria_long,table) # requires library(qdapTools) mtabulate(sites_rating_criteria_long) (sum(sites_rating_criteria$rating.FEEDS.value) / count(sites)) * 100 (sum(sites_rating_criteria$rating.SOCIAL_MEDIA_LINKS.value) / count(sites)) * 100 (sum(sites_rating_criteria$rating.RESPONSIVE.value) / count(sites)) * 100 (sum(sites_rating_criteria$rating.NO_THIRD_PARTY_COOKIES.value) / count(sites)) * 100 ggplot(sites_rating_criteria_long, aes(x = categories, fill = categories)) + geom_bar() + coord_flip() + facet_wrap(~ type_col, scales = "free_x") ggplot(sites_rating_criteria_long, aes(x = categories, fill = categories)) + geom_bar()