マンション価格の高騰、住宅ローン金利の上昇懸念など、マンション購入のハードルが高まっていくなかで、スムログ読者の皆さんはどのようなところに関心をお持ちなのか。
2023年も残り少し。スムログ読者から送られてきた相談に回答した件数は、マンマニ氏を中心に今年は296件(23年12月1日現在)。296件のうち、世帯年収が分かっている159件について、世帯年収別の関心事を見える化してみた。
※以下の分析の元となったデータはすべて、スムログの「質問&お便りへの回答」として掲載されている公開情報。
相談者の世帯年収
まずは、相談者の世帯年収の確認から。世帯年収が明記されている159件について、世帯年収分布を可視化してみた(次図)。
- 「700万円以下」は10件(6%)と少ない。
- 「700万円超1000万円以下」「1000万円超1300万円以下」「1300万円超1600万円以下」の各層は37~40件(23~25%)。
- 「1600万円超」は35件(22%)、うち「2500万円超」は3件(2%)!
※1:都の平均世帯年収データ
2019年「全国家計構造調査」(第3-0表 都道府県,世帯の種類(3区分),世帯区分(4区分),世帯主の年齢階級(32区分),収支項目分類(中分類)別1世帯当たり1か月間の収入と支出-都道府県)のうち、東京都・2人以上の勤労世帯の1世帯当たり1か月間の「実収入」を12倍した値を用いた。
8万文字をテキストマイニング
159件の相談内容は、合計すると約8万文字で記されている。世帯年収別の関心事項を見える化するために、フリーソフトのテキストマイニング・ツール「KH Coder」を使って、文章を単語や文節で区切り、それらの出現回数や出現傾向などを解析することにした。
具体的には、相談文章の約8万文字を世帯年収別に対応分析(コレスポンデンス分析)するのだ。特徴のある言葉(特徴語)の上位60語の分布は次図のとおりである。
メモ
- 円の大きさは、各言葉の出現頻度の多さを表す。
- オレンジ色の文字は世帯年収を表す。オレンジ色▢の大きさは質問件数の多さを表す。
- 原点(0,0)から見て、各世帯年収の周辺にある言葉で、かつ原点から離れているほど特徴的な言葉であることを示している。
この結果をどのように解釈すればいいのか。
世帯年収別の関心事
対応分析結果をどのように解釈するか。特徴語の上位60語の分布をにらみ、エイヤっと次のように解釈してみた(次図参照)。- 「1000万円以下」の層は、新築マンションを断念し、中古マンションに関心を抱いている。中古であっても、リセールバリューは気にしている。
- 「1000万円超1600万円以下」の層は、エリアと資産性に関心を抱いている。
- 「1600万円超」の層は、タワマンと子育てへの関心が高い。
他の解釈も、もちろんあり得る。皆さんは、どのように読み解かれますか。
少し早いけど、Happy Holidays !
あわせて読みたい
コレポンとワードマッピングで本当にこんな分布になるんでしょうか?
縦軸・横軸の指標はなんですか?
解釈は恣意的でもいいと思いますが、グラフは違うかと。。
データサイエンスかじった身として教えていただきたく!
コレポン(コレスポンデンス分析)は、クロス集計表から抽出された要因成分を縦軸と横軸にマッピングする手法です。縦軸と横軸の指標は、分析結果から得られる固有値に基づいています。
横軸は、たとえば「経済的な余裕度」(右にいくほど世帯年収が高くなっています)のように解釈できますが、縦軸はどのように解釈していいのか、適切な表現が思いつきませんね。
今なら、ChatGPTに分析やサマライズさせると面白いかもです。