こんにちは!株式会社VillageAI取締役の松本祐輝です!
ChatGPTプラグインの「Noteable」を使って、特徴量の選択・欠損値処理・モデル評価をしていきたいと思います。
前回のデータ加工編を見逃した方は、こちらをチェックしてみてください!
では、さっそくNishikaさんの「中古マンション価格予測」のデータ分析をしていきましょう!
Nishika:中古マンション価格予測 2023春の部
まずはChatGPTに、前回に続き特徴量の選択をしてもらいます。
とりあえずChatGPTが選択したカラムのみで、欠損値の処理をしていきます。
欠損値の処理もこれでいいのかな〜と疑問を持ちながらも、ChatGPTの指示に従ってやってみます。
残りの地区名は欠損値数がそこまで多くないので、欠損データは削除します。
最寄駅:名称はChatGPTの指示通りに’不明’に置き換えます。
とりあえず、特徴量の選択と欠損値の処理が終わりました。
続いては、各要素と取引価格ついて説明をしてもらいましょう。
こんな簡単に可視化から説明ができるのは本当に面白いですね!
それではモデル評価してもいましょう!
とりあえず最初は決定木を使用してみます。
なんだと…
せっかくコーディングまで上手く行っているのに、メモリの関係でできないと…
悔しいのでgoogle colaboratoryにコードをコピーして実行してみます。
評価は0.118、参考にnishikaのランキングをみてみると、103位/135位くらいの精度ですね。
ランダムフォレストでも試してみましょう。
77位/135位くらいまで上がりました。
ChatGPTにコードは書いてもらいましたが、noteable上でモデルを実行できていないので、
ChatGPTに質問して精度を上げるのは難しそうです…
今度はもっと小さいデータセットで精度を探求していくのも面白そうですね。
データの読み込み・可視化・簡単な説明にChatGPTを活用してみるのはいいかもしれませんね!
コメント