PythonとGridDBを用いたマルチクラステキスト分類

インターネット上には、日々膨大な量のニュースを提供するソースが存在します。また、ユーザーの情報に対する要求も高まり続けており、ユーザーが興味のある情報に素早く、効率的にアクセスできるようなニュースの分類が重要です。マルチクラステキスト分類のモデルを用いることで、ユーザは、追跡されていないニュースのトピックを特定したり、事前の興味に基づいた推薦をしたりすることができるようになります。そこで、ニュースの見出しと短い説明を入力とし、ニュースのカテゴリを出力とするモデルを構築することを目指します。

PythonとGridDBを用いた米国経済指標に基づくS&P500指数価格のモデル化

経済指標と広く知られた統計的手法を使って株価を予測する数多くの研究がこれまでに行われてきました。そして2010年以降のコンピュータの性能の上昇により、機械学習による新しい手法が開発されることになりました。それらのアルゴリズムが、様々な数学的・統計的手法を用いて株式市場を予測できるかどうかを発見することは、興味深いことです。本ブログの目的は、GridDBを使ってデータを抽出し、次に統計的検定を行い、最後に機械学習モデルを構築して、米国の経済指標に基づくS&P500指数の月次価格をモデル化することです。

GridDBを用いて気候変動が鳥類に与える影響を予測する

私たちは「スマート」な世界を目指しながら、それが自然現象に与えるダメージを軽視しています。環境保護主義者の間で高まっている懸念のひとつに、地球温暖化による気候の変化があります。この気候変動は、動物やその生息地にも影響を及ぼしています。多くの動物は、気候の変化に対応するために、その特徴を変えたり、別の生息地に移動したりしています。

Javaによるランダムフォレストの実装方法

ランダムフォレストは、分類などに用いられる機械学習アルゴリズムの一つです。本ブログでは、アヤメ科植物のクラスを予測するランダムフォレストアルゴリズムのJavaによる実装を説明します。そのためにまずは要件定義を行い、必要なパッケージをインポートします。次に、アイリスデータセットを提示し、Weka ライブラリを用いてランダムフォレストアルゴリズムを実装します。ファイルからデータを取得し、GridDBに格納します。そしてデータを取得し、ランダムフォレストアルゴリズムを実行します。最後に、その結果について考察します。