びょーりさんの長文置き場

Twitterで書きにくい長文をまとめる場所。

「佐藤」より「山田」の方が多そうに感じるのはなぜ? 数字にして納得したい! ③解決編

前回の記事→

nezaren.hatenablog.com

 

苗字の一文字目に使われてる場合。

苗字の二文字目に使われてる場合。

これをそれぞれで集計すると、こうなります。(データは相変わらず100位までです)

 

どん。

f:id:NeZaReN:20180202110027p:plain

 

100位までだと、三文字の苗字である「佐々木」「長谷川」が出てくるので、三文字目も用意しました。

いやぁExcel(っぽいやつ)は便利ですねぇ。

 

こう見ますと、やはり100位までですから偏りもありますよね。

「本」「川」から始まる苗字が現れてなかったり、「〇松」って苗字が現れてなかったり。国語のゴリ松……

もうちょっとデータ増やせば現れるはず。

 

で、これをクリックしてソートすると……

 

一文字目に多い順↓

f:id:NeZaReN:20180202110937p:plain

 

二文字目に多い順↓

f:id:NeZaReN:20180202110933p:plain

 

並び変わった~~~~!!!

すご~~~~~~~い!!!

(幼女の声で脳内再生してください)

 

しかも全然違う順番になってるから、やっぱり傾向があるってことですよね!

 

一文字目で最も多いのは「山」。一文字目だけで並べているので「藤」などの順位が下がっています。そのぶん「佐」「高」などが上位に。

二文字目で最も多いのは「田」。二文字目だけで並べているので「中」などの順位が下がっています。そのぶん「野」「村」などが上位に。

 

……ん?

 

 

一文字目で最も多いのは「山」。

二文字目で最も多いのは「田」。

 

と、いうことは……最も「ありふれ度」の高い苗字は……

 

 

山田じゃん!!!!!!!!!!!!

 

◇◆◇◆◇

 

いやー、僕たちの感覚も捨てたもんじゃないですね。カタルシスってこういうことを言うんでしょうか。迫真の伏線回収。

 

確かに「苗字」単位で一番多いのは「佐藤」なんですけど、

「漢字」単位で見てみると、一番多そうなのは「山田」なんですね。

一文字目に最もよく使われる「山」と二文字目に最もよく使われる「田」。これを組み合わせた「山田」が、日本の苗字の代表として扱われるのにも納得できますね。市役所に大量に山田太郎くんが生息しているのも、さもありなん、という感じ。

 いやぁ、めでたしめでたし。

 

◇◆◇◆◇

 

自分で作っときながら、この表、いいなぁ……田山さんより山田さんの方が多そうってことも数字で表せてるもんなぁ……

 

そうだなぁ……例えば、この表を応用して、「任意の苗字を入れたらその苗字のありふれ度を測れる関数」とか作れないかなぁ……

 

 

でも僕、プログラミングはおろかスクリプトも組めないしなぁ……Excelもほとんど使ったことないし……

 

 

……

 

 

……

 

 

f:id:NeZaReN:20180202230229p:plain

 

……かみんぐすーん!