このブログでは、Rで大規模なデータセットを取り込み、その状態で様々なSQLクエリを実行し、データセットからどのような情報が得られるかを見ていきます。その後に、R言語はデータのグラフ化に優れているため、gplotを使って結果をプロットしてみます。
JavaとGridDBを用いたテキスト分類器
テキストデータは、電子メール、チャットでの会話、ソーシャルメディア、Webサイトなど、あらゆるところに存在します。テキストデータには多くの情報が含まれていますが、その非構造化データの性質上、情報を抽出することが困難な場合があります。 今回は、JavaとGridDBを使って、テキスト分類器を実装します。テキスト分類器の目的は、メールをspamとhamのどちらかに分類することです。
PythonとGridDBを用いた地球気候変動の解析
気候変動の影響とそれに伴う地域・地方スケールでの異常気象を理解することは、実現可能な適応策を計画・開発する上で非常に重要です。 気候変動は、間違いなく現代における人類への最も深刻な脅威です。IPCCによれば、気候変動による悪影響を緩和するためには、世界の平均気温を産業革命以前の水準から1.5℃に抑える必要があるとされています。 今回は、PythonとGridDBの力を使って、気温変動のマップチャートやアニメーションを作成する方法について分析します。
機械学習、Java、GridDBを利用した不正取引検知
今日、金融の世界では、金融データが新しい通貨となっています。しかし、ますます拡大する金融データを従来の統計的手法で処理することは難しくなってきています。機械学習は、企業価値や株価、あるいは金融詐欺の検出といった形で金融データを予測するプログラムの作成を可能にする一連のテクニックとモジュールを提供します。 本稿では、クレジットカード決済を利用したお客様の不正取引を検知することができる決定木の作成について説明します。