Pandas データフレームは、そのドキュメントで定義されているように、「2次元の、サイズ変更可能な、潜在的に異種の表形式データ」であるデータ構造です。データフレームは、開発者やデータサイエンティストが長いコードブロックを書くことなく迅速に実験を行うことを可能にし、データ分析を素早くかつ簡単に行うことができます。
バウンディングボックスで地理的クエリを使う
以前のニューヨークの犯罪に関するブログでは、GridDBのジオメトリ(幾何学)機能を使った地理空間データのクエリについて紹介しました。
GridDB Community Edition v4.6 新機能の紹介
はじめに GridDB Community Edition version 4.6がリリースされたことを受けて、私たちが最も期待している新機能をこのブログを読んでいる皆様に紹介したいと思います。今回は、新機能であるSQLアグリゲート機能と、新機能であるコマンドラインインターフェース(CLI)ツールを中心にご紹介します。この新リリースは、通常通り、 GitHub.com から無料で入手することができます。 インストールするには、ダウンロードして、Getting Started: Using RPM/YUM にある標準的な手順に従ってください。また、v4.6の新機能を最大限に活用するためには、GridDB CLIツールのインストールが必要となります。このコマンドラインツールはクラスタ運用管理用のコマンドインタプリタですが、ここでは単にgs_shと表記します。このツールの主な目的は、開発者がGridDBのクラスタやデータの運用を管理する手段を提供することです。また、新たにSQLアグリゲーションの機能が追加されました。ここでは説明しませんが、以下のページで紹介されています。https://docs.griddb.net/sqlreference/sql-commands-supported/#aggregate-functions インストール gs_shは、RPMのパッケージに含まれているので非常に簡単にインストールすることができます。 $ wget https://github.com/griddb/cli/releases/download/v4.6.0/griddb-ce-cli-4.6.0-linux.x86_64.rpm $ sudo rpm -ivh griddb-ce-cli-X.X.X-linux.x86_64.rpm また、以下のようにして /usr/share/java/ ディレクトリに griddb-jdbc.jar をセットアップしてください。詳細はこちらを参照してください。https://griddb.net/en/blog/connecting-to-griddb-via-jdbc-with-sqlworkbench-j/。ここでは簡単にまとめてみました。 $ wget https://repo1.maven.org/maven2/com/github/griddb/gridstore-jdbc/4.5.0/gridstore-jdbc-4.5.0.jar 最新版のjdbcファイルを使用しているかどうかは、GitHubで確認できます。 インストールについては以上です。 クラスタ操作制御コマンドインタプリタ (gs_sh) 特徴 前述したように、このツールは開発者がGridDBクラスタやデータの運用を管理する手段を提供するためのものです。つまり、このツールを使用することで以下のことが可能になります。 クラスタステータスの表示 データベースとユーザーの管理 コレクションとトリガーの表示 インデックス設定、インデックス削除 TQL/SQLを使った検索 使用方法 基礎編 それでは、早速使ってみましょう。まずは、シェルに直接入力してください。 $ gs_sh gs> version gs_sh-ce...
カーレース用のパフォーマンストラッカーを作る – レースデータの収集 (Part 2)
データ分析とは、生データから意味のあるデータを得るためのプロセスです。適切な分析を行わなければ、どんなデータセットも単なる情報の集まりになってしまいます。この記事では、データ可視化の手法を用いて、構造化されたデータを意味のあるデータに変換する方法を学びます。