Cloudera データアナリストトレーニング (Cloudera Data Analyst Training)

Cloudera Data Analyst Training (Japan)

Summary

この4日間のトレーニングコースは、従来のデータ分析とBIのスキルをビッグデータに適用します。このコースでは、データプロフェッショナルが、SQLと馴染みのあるスクリプト言語を使用して、複雑なデータにアクセス、操作、変換、分析に必要なツールを紹介します。本コースは日本語で提供します。テキストや演習問題も日本語に翻訳されています。

Duration

4 Days

Objectives

このコースを完了すると、次のことができるようになります

  • ビッグデータのオープンソースエコシステムが、従来の RDBMS では解決できなかった課題に対してどのように対処するのかを説明する
  • Apache Hive と Apache Impala を使用して、データへの SQL でのアクセスを提供する方法を説明する
  • 必要に応じて、関数やサブクエリなどの Hive や Impala の構文とデータ形式を使用してデータに関する質問に答える
  • パーティション、および異なるファイル形式の使用
  • 必要に応じて、 JSON または UNION を使用して2つ以上のデータセットを結合する
  • 分析関数とウィンドウ関数を用いてデータに関する質問に答える
  • 複雑な、またはネストしたデータ構造の保存とクエリ
  • 半構造化データ、および非構造化データの処理と分析
  • Hive と Impala のクエリを最適化するためのさまざまな手法の使用
  • パラメータ、カスタムファイルフォーマットと SerDe、および外部スクリプトを使用して Hive と Impala の機能を拡張する
  • Hive、Impala、RDBMS、またはこれらの組み合わせが特定のタスクに適切かどうかを判断する

Prerequisites

このコースはSQL、および基本的なUNIXまたはLinuxのコマンドの使用経験がある、データアナリスト、ビジネスインテリジェンスのスペシャリスト、開発者とシステムアーキテクト、データベース管理者に適しています。少なくとも一つのスクリプト言語(例: Perl, Python, Ruby)の知識があると役立ちますが、必須ではありません。Apache Hadoopの予備知識は必要ありません。

ハンズオン演習

コース全体を通して、ハンズオン演習は受講生が知識を深め、議論されている概念を適用するのに役立ちます

認定資格試験

コース終了後、受講者は学習を続けてCCAデータアナリスト認定試験に登録することをお勧めします。認定資格は大きな差別化要因です。資格により、あなたはその分野におけるリーダーとして確率し、スキルと専門知識の明白な証拠を提供します。

Outline

  • はじめに
  • Hadoopの基本
  • HiveとImpala入門
  • HiveとImpalaによるクエリ
  • 一般的な操作と組み込み関数
  • データ管理
  • データストレージとパフォーマンス
  • HiveとImpalaでリレーショナルデータの分析
  • 複数のデータセットを扱う
  • 分析関数とウィンドウ関数
  • 複雑なデータ
  • テキストの分析
  • Hiveの最適化
  • Impalaの最適化
  • HiveとImpalaの拡張
  • ジョブに最適なツールを選択する
  • まとめ

Upcoming Classes

No classes have been scheduled, but you can always Request a Quote.

Onsite Training

Request a quote for a private training session.

Request Quote

Public Training

Check out our FAQ page.