Blogブログ

BLOGブログ

6

ChatGPT でデータ分析-中古マンション価格予測:データ加工編

Blog

こんにちは!株式会社VillageAI取締役の松本祐輝です!

ChatGPTプラグインの「Noteable」を使って、データ加工をしていきたいと思います。
前回のデータアップロード編を見逃した方は、こちらをチェックしてみてください!

では、さっそくNishikaさんの「中古マンション価格予測」のデータを加工していきましょう!

参考サイト


中古マンション価格予測2023春の部


Nishika株式会社
締切:2023/06/30
▶Nishika「中古マンション価格予測2023春の部」へ

まずはChatGPTに、価格予測のために何から始めればいいか聞いてみます。

それではデータの前処理からやっていきます。
まずは全て欠損しているカラムを削除しましょう!

次に、建築年が「戦前・昭和・平成」といった数値データでなく、分かりづらいため、
築年数に変換できるか聞いてみます。

おおー!これはすごいですね!
エラーが出ても、自己判断して次の処理へと挑戦してくれるみたいですね!
ちゃんと築年数に変換されました!

次は最寄駅の距離(分)に「30?60」のようなデータが含まれているため、
このカラムは数値データに変換できるか聞いてみます。

中央値で数値データに変換しましょう!

めちゃめちゃ楽ですね!
他に数値データにした方が良いカラムがあるかChatGPTに聞いてみます。

これは、、、間取りの解釈がおかしいですね!笑
築年数と最寄駅のカラムはすでに処理しているので、
最後に健ぺい率などを数値データに変換しようとしたらここで問題が発生!!

?????????
最初からfloat型で’以上’などは含まれていない???
念の為ノートブック上でも確認してみます。

中身は数値データですね。。。
ということは、ChatGPTはデータの中身から判断して答えている訳ではなさそうですね!
まだまだ謎が多いChatGPTですが、コードを書かずにカラム削除や数値データ変換など、
場面によっては便利ですね!

それでは今回はここまでです!またね〜!

RELATED

関連記事

コメント

この記事へのコメントはありません。

PAGE TOP