Amazon Redshift 連携 :破 〜フローサービス編〜

前回の投稿では「Amazon Redshift」の環境を準備しました。

今回は「ASTERIA Warp」の「フローサービス」を使った連携を行なっていきます。

ASTERIA WarpとAWSの連携フロー

コネクションの作成

◆JDBCドライバの用意

Redshiftは、PostgresqlのJDBCで接続可能ですので、JDBCドライバを用意しASTERIA WarpのJDBCを保存するフォルダにコピーします。Windows環境の標準だと「C:\Program Files\asteriawarp\flow\lib\ext」です。

JDBCドライバはAmazonの解説で使用されていたものとバージョンを合わせ「postgresql-8.4-703.jdbc4.jar」にしました。

すでにASTERIA Warpが起動している場合は再起動が必要です。

 

◆Redshiftのコネクションを作成

JDBCドライバ接続設定

 

フローデザイナーを起動してコネクションを作成します。

Postgresqlの接続と同様に、Redshiftで設定したサーバー、クラスタ名、ポート番号を含んだURLと、ユーザー名、パスワードを設定します。

「URL」は以下の様な形式です。

jdbc:postgresql://<クラスタ名>.<サーバーのアドレス>:<ポート番号>/<データベース名>

「AWS Management Console」からRedshiftのクラスター一覧を開き、内容を確認すると「JDBC URL」の欄がありますので、ここをそのまま記載するだけでOKです。

AWS Management ConsoleからRedshiftクラスター一覧にある「JDBC URL」欄に接続設定を記載

 

テーブルの作成

Redshiftと接続可能となったので、まずRedshiftにテーブルを作成します

Redshiftにテーブルを作成

SQLCallコンポーネントを使って通常のCREATE TABLE文でテーブルを作成します。

RedshiftはPostgresqlと完全互換ではないので、一部使えないSQLや使えない型があるようです。

Redshiftへのデータ転送

Redshiftへのデータ転送はRDBPutコンポーネントを利用してInsertすることも可能ですが、大容量を扱うRedshiftでは同じAmazonのストレージサービス「S3」を利用して転送を行うことが推奨されています。

Redshiftへデータ転送

S3へのデータ転送はデータを分割して並列でアップロードすることによって高速化することが可能です。

RecordGetコンポーネントを使ってまとまった単位でループ、ParallelSubFlowコンポーネントで並列化します。

ParallelSubFlowで呼び出すサブフローはAWS S3putコンポーネントを使って保存するだけです。

分割ファイル名を設定し、S3に保存

 

S3からRedshiftへのコピー

S3へ複数ファイルとして保存されたデータはRedshiftからコピーコマンドを実行することによって取り込むことが可能です。フローとしてはSQLCallコンポーネントでコピーコマンドを実行するのみです。

Copyコマンドを実行

コマンドはAmazonの資料を参照してください。

 

Redshiftでのデータ集計、取得

Redshiftからのデータ取得にはRDBGetコンポーネントを使用します。コネクションを設定したRDBPutコンポーネントをダブルクリックすると、SQLビルダーが起動されます。

画面操作でRedShiftのデータ集計、取得が可能です。

SQLビルダー

取得したデータは、Excelに取り込んだり、HTMLを生成して簡易BI画面を作ったりと様々に利用可能です。

 

是非ASTERIA WarpとRedshiftを活用してビッグデータを有効活用してください。

関連記事



クラウド版

手ぶら de ASTERIA Warp
体験 5日間を申し込んで
簡単データ連携を体験してみよう!

サーバー準備の手間なくデータ連携ツール「ASTERIA Warp」の
全ての機能を5日間お試しいただけます。

今すぐ体験してみる 書籍の詳細についてはこちらをご覧ください。
基礎と実践 使い方マニュアル
執筆者:森 一弥

執筆者:
森 一弥

ASTERIA Warpシリーズ担当のシニアプロダクトマネージャー。ホワイトペーパーの執筆のほか、開発経験を活かしたASTERIA Warpを使ったデモ作成等を実施。

ASTERIA Warpと色々つないでみた特集!記事はこちら>

「ASTERIA Warp、データ分析、クラウド、業務効率化、最新技術」人気!ホワイトペーパーダウンロード受付中!今すぐチェック

ASTERIA Warp 関連サイトのご紹介

X ASTERIA Warp Developer Network(ADN)サイト

技術情報をお探しの方

ASTERIA Warp Developer Network
(ADN)サイト

ASTERIA Warp製品の技術情報やTips、また情報交換の場として「ADNフォーラム」をご用意しています。

X アステリア製品オンラインコミュニティ

ASTERIA Warpデベロッパーの方

アステリア製品オンラインコミュニティ
Asteria Park

アステリア製品デベロッパー同士をつなげ、技術情報の共有やちょっとしたの疑問解決の場とすることを目的としたコミュニティです。

X ASTERIA Warpユーザーサイト

ASTERIA Warpユーザーの方

ASTERIA Warpユーザーサイト
Login

製品更新版や評価版のダウンロード、各種ドキュメントのご提供、また 技術的なお問合せもこちらで受付ています。

X ASTERIA Warpパートナーサイト

ASTERIA Warpパートナーの方

ASTERIA Warpパートナーサイト
Login

パートナーライセンスの発行や各種ドキュメントのご提供をしています。

ページ先頭へ