このチュートリアルでは、Pythonを使用して住宅データセットを調査します。まず、必要に応じてデータセットのプルーニングを行います。その後、データセットに適合する機械学習モデルを構築し、将来の予測を行う方法を見ます。
PythonとGridDBを用いたLDAによるトピックモデリング
自然言語処理において、トピックモデリングは与えられたコーパスに含まれる単語を基にトピックを割り当てます。
ランダムフォレストアルゴリズムによる購買習慣の予測
ランダムフォレストは分類や回帰の問題を解決するために用いられる教師ありの機械学習アルゴリズムです。 このアルゴリズムは、複雑な問題を解決し、モデルの性能を向上させるために、多くの分類器を組み合わせるプロセスであるアンサンブル学習の概念を使用しています。
GrafanaとGridDBを使ってジオメトリデータのヒートマップを作成する
今回のブログでは、同じデータセットを使って、GridDBとGrafanaを使って犯罪の苦情のヒートマップを描きます。完成したら、ニューヨークの地図の上に明示的なヒートマップを重ね、様々な苦情が頻度とともに表示される分かりやすいグラフィックになることを目指します。