基礎データ
> 分野:#E 教育
#E9101 最終学歴人口(卒業者総数)(人)
,#E9106 最終学歴人口(大学・大学院)(人)
> 確定
read.csv()
:csvファイルの読込.edu_back
と名付ける.
sep=","
はデータがカンマで区切られていることを意味する.CSV形式のデータをメモ帳やEXCELで開くと,データがカンマで区切られていることがわかる.header=TRUE
は列名が含まれていることを意味する.仮に列名がなければFALSE
.skip=1
は1番最初の行を削除することを意味する.CSV形式のデータをメモ帳やEXCELで開くと,最初の2行に列名(項目名)が記されている.ここでは,1行目は利用しない.fileEncoding="CP932"
により文字化けを回避.#最終学歴人口(卒業者総数),最終学歴人口(大学・大学院)の読込
edu_back<-
read.csv("FEI_CITY_221121140604.csv",
sep=",", header=TRUE, skip=1,
fileEncoding="CP932")
#データの中身
edu_back
3
列名(地域.コード),6
列目(E9101_最終学歴人口.卒業者総数..人.),7
列目(E9106_最終学歴人口.大学.大学院..人.).大学・大学院卒以上割合計算
univ_ratio
)の列を加える.利用しない市区町村の削除
if_else()
を使用してダミー変数を作成する.
if_else()
:第1引数に条件,第2引数に条件を満たす場合の値,第3引数に条件を満たさない場合の値を示す.#if_else()利用を利用してダミー変数を作成する方法
if_else(条件式, 1, 0)
政令指定都市(さいたま市,千葉市,横浜市,川崎市,相模原市)は区レベルで表現したいため,取り除きたい.
filter()
を用いてデータ(edu_back
)の一部を選抜.filter()
内に利用するデータの条件を指示.!=
は否定等号(左辺が右辺と等しくない).すなわち,政令指定都市,離島の市町村ではない市区町村を利用するという条件.境界データのダウンロード
大学・大学院卒割合は現在の市区町村単位で計算しているため,行政区域は最新のファイルをダウンロード.
read_sf()
:シェープファイル読込.rbind()
:1都3県を一つのファイルに縦方向に合併.Greater_Tokyo
と名付ける.#1都3県合併の行政区域のシェープファイルの読込
Saitama_map<-
read_sf("N03-20220101_11_GML/N03-22_11_220101.shp")
Chiba_map<-
read_sf("N03-20220101_12_GML/N03-22_12_220101.shp")
Tokyo_map<-
read_sf("N03-20220101_13_GML/N03-22_13_220101.shp")
Kanagagawa_map<-
read_sf("N03-20220101_14_GML/N03-22_14_220101.shp")
#1都3県合併
Greater_Tokyo <-
rbind(Saitama_map, Chiba_map,
Tokyo_map, Kanagagawa_map)
統計データedu_back
とシェープファイルの合併のための準備.
#変数名の変更
Greater_Tokyo %>%
rename(city_code=N03_007) ->
Greater_Tokyo
#離島の市町村ダミーの作成
Greater_Tokyo %>%
mutate(island=
ifelse(city_code>=13361 & city_code<=13421,
1, 0)) ->
Greater_Tokyo
#離島の市町村を除いたシェープファイルの作成
Greater_Tokyo %>%
subset(island!=1)->
Greater_Tokyo2
#可視化
ggplot()+
geom_sf(data=Greater_Tokyo2)
地図上に可視化.
Greater_Tokyo2
)と卒業者割合を格納した統計データ(edu_back2
)をcity_code
で結合(left_join)し,改めてGreater_Tokyo2
と名付ける.edu_back2 %>%
mutate(city_code=as.character(city_code)) ->
edu_back2
#地図データ(シェープファイル)と統計データとの合併
Greater_Tokyo2<-
left_join(Greater_Tokyo2, edu_back2, by=c("city_code"))
可視化
ggplot()+
geom_sf(data=Greater_Tokyo2, aes(fill=univ_ratio),
color="white")+
scale_fill_viridis_c(option="G", direction=-1)+
labs(fill="%", x="", y="",
caption="出典:国土交通省国土数値情報,総務省都道府県・市区町村のすがた(社会・人口統計体系)")+
ggtitle("1都3県大学・大学院卒割合(2010年度)")+
theme_bw()+
theme(plot.caption=element_text(hjust=0))
Rによる地理空間データの可視化