基礎データ > 分野:#E 教育#E9101 最終学歴人口(卒業者総数)(人),#E9106 最終学歴人口(大学・大学院)(人) > 確定
read.csv():csvファイルの読込.edu_backと名付ける.
sep=","はデータがカンマで区切られていることを意味する.CSV形式のデータをメモ帳やEXCELで開くと,データがカンマで区切られていることがわかる.header=TRUEは列名が含まれていることを意味する.仮に列名がなければFALSE.skip=1は1番最初の行を削除することを意味する.CSV形式のデータをメモ帳やEXCELで開くと,最初の2行に列名(項目名)が記されている.ここでは,1行目は利用しない.fileEncoding="CP932"により文字化けを回避.ただし,完全ではなく,列名の「.」は変換に失敗している.#最終学歴人口(卒業者総数),最終学歴人口(大学・大学院)の読込
edu_back <-
read.csv("FEI_CITY_221121140604.csv",
sep=",", header=TRUE, skip=1,
fileEncoding="CP932")
#データの中身
edu_back 3列名(地域.コード),6列目(E9101_最終学歴人口.卒業者総数..人.),7列目(E9106_最終学歴人口.大学.大学院..人.).大学・大学院卒以上割合計算
univ_ratio)の列を加える.利用しない市区町村の削除
if_else()を使用してダミー変数を作成する.
if_else():第1引数に条件,第2引数に条件を満たす場合の値,第3引数に条件を満たさない場合の値を示す.#if_else()利用を利用してダミー変数を作成する方法
if_else(条件式, 1, 0)
政令指定都市(さいたま市,千葉市,横浜市,川崎市,相模原市)は区レベルで表現したいため,取り除きたい.
filter()を用いてデータ(edu_back)の一部を選抜.filter()内に利用するデータの条件を指示.!=は否定等号(左辺が右辺と等しくない).すなわち,政令指定都市,離島の市町村ではない市区町村を利用するという条件.境界データのダウンロード
大学・大学院卒割合は現在の市区町村単位で計算しているため,行政区域は最新のファイルをダウンロード.
read_sf():シェープファイル読込.rbind():1都3県を一つのファイルに縦方向に合併.オブジェクトをGreater_Tokyoとする.#1都3県合併の行政区域のシェープファイルの読込
Saitama_map <-
read_sf("N03-20220101_11_GML/N03-22_11_220101.shp")
Chiba_map <-
read_sf("N03-20220101_12_GML/N03-22_12_220101.shp")
Tokyo_map <-
read_sf("N03-20220101_13_GML/N03-22_13_220101.shp")
Kanagagawa_map <-
read_sf("N03-20220101_14_GML/N03-22_14_220101.shp")
#1都3県合併
Greater_Tokyo <-
rbind(Saitama_map, Chiba_map,
Tokyo_map, Kanagagawa_map)統計データedu_backとシェープファイルの合併のための準備.
#変数名の変更
Greater_Tokyo %>%
rename(city_code=N03_007) ->
Greater_Tokyo
#離島の市町村ダミーの作成
Greater_Tokyo %>%
mutate(island=
ifelse(city_code>=13361 & city_code<=13421,
1, 0)) ->
Greater_Tokyo
#離島の市町村を除いたシェープファイルの作成
Greater_Tokyo %>%
subset(island!=1)->
Greater_Tokyo2
#可視化
ggplot()+
geom_sf(data=Greater_Tokyo2)地図上に可視化.
Greater_Tokyo2)と卒業者割合を格納した統計データ(edu_back2)をcity_codeで結合(left_join)し,改めてオブジェクトをGreater_Tokyo2とする.edu_back2 %>%
mutate(city_code=as.character(city_code)) ->
edu_back2
#地図データ(シェープファイル)と統計データとの合併
Greater_Tokyo2<-
left_join(Greater_Tokyo2, edu_back2, by=c("city_code"))可視化
ggplot()+
geom_sf(data=Greater_Tokyo2, aes(fill=univ_ratio),
color="white")+
scale_fill_viridis_c(option="G", direction=-1)+
labs(fill="%", x="", y="",
caption="出典:国土交通省国土数値情報,総務省都道府県・市区町村のすがた(社会・人口統計体系)")+
ggtitle("1都3県大学・大学院卒割合(2010年度)")+
theme_void()Rによる地理空間データの可視化