Cloudera Apache Hadoop 管理者向けトレーニング - (Cloudera Administrator Training for Apache Hadoop)

Administrator (Japan)

Summary

ClouderaのApache Hadoopトレーニングと認定資格は、参加者の知識を次のレベルに引き上げます。Cloudera Universityの4日間のApache Hadoop管理者向けトレーニングコースでは、Cloudera Manager を使用してHadoopクラスタを運用およびメンテナンスするために必要な全ての手順を包括的に理解することができます。インストールから設定、運用、チューニングに至るまで、ClouderaのトレーニングコースはHadoop管理者が直面している現実の課題に対する準備として最適です。
講義は日本語で行います。また、テキストと演習の手順書も日本語化されています。

コース概要は下記のOutlineをご覧下さい

Duration

4 Days

Objectives

インストラクタとのディスカッションやインタラクティブで実践的な演習を通じて、参加者はHadoopのエコシステムを操作するための以下のようなトピックについて学習します:

  • YARN、MapReduce、MapReduceの内部構造
  • クラスタに適したハードウェアとインフラストラクチャを決定する
  • データセンターと統合するためのクラスタの正しい設定と展開
  • Flumeを使用して動的に生成されたファイルから、およびSqoopを使用してRDBMSからクラスタにデータをロードする方法
  • Fairスケジューラを設定してクラスタの複数のユーザーにSLAを提供する
  • 本番環境でのApache Hadoopの準備と運用のベストプラクティス
  • Hadoopの問題のトラブルシューティング、診断、チューニングおよび解決

Prerequisites

本コースはHadoopクラスタのセットアップや運用を行いたいシステム管理者に適しています。講義ではLinuxを使用しますので、基本的なLinuxのシステム管理の知識が必要です。Hadoopの事前知識は必要ありません。

ハンズオン演習

コース全体を通したハンズオン形式の演習は、受講者が講義のコンセプトの理解と知識の確立に役立ちます。

認定試験

CCA Administratorは、Apache Hadoopクラスタを設定、展開、保守、および保護する能力に関する技術知識の習得が認定された管理者に与えられます。CCA Administratorの詳細はこちら

Outline

1. はじめに 2. Cloudera Enterprise Data Hub

  • Cloudera Enterprise Data Hub
  • CDH の概要
  • Cloudera Manager の概要
  • Hadoop の管理者の責務
3. Cloudera Manager と CDH のインストール
  • Cluster のインストールの概要
  • Cloudera Manager のインストール
  • CDH のインストール
  • CDH クラスターサービス
4. Cloudera クラスターの設定
  • 概要
  • 構成の設定
  • サービス構成の変更
  • 設定ファイル
  • ロールインスタンスの管理
  • 新しいサービスの追加
  • ホストの追加と削除
5. Hadoop 分散ファイルシステム
  • 概要
  • HDFS のトポロジーと役割
  • 編集ログとチェックポイント処理
  • HDFS のパフォーマンスとフォールトトレランス
  • HDFS と Hadoop セキュリティの概要
  • HDFS の Web ユーザーインターフェイス
  • HDFS コマンドラインインターフェイスの使用
  • その他のコマンドラインユーティリティー
6. HDFS のデータ取り込み
  • データ取り込みの概要
  • ファイル形式
  • ファイル転送または REST インターフェイスを用いたデータ取り込み
  • Apache Sqoop によるリレーショナルデータベースからデータをインポート
  • Apache Flume による外部ソースからのデータのインポート
  • データインポートのベストプラクティス
7. Hive と Impala
  • Apache Hive
  • Apache Impala
8. YARN と MapReduce
  • YARN の概要
  • YARN でアプリケーションの実行
  • YARN アプリケーションの表示
  • YARN アプリケーションのログ
  • MapReduce アプリケーション
  • YARN のメモリと CPU の設定
9. Apache Spark
  • Spark 概要
  • Spark アプリケーション
  • YARN で Spark アプリケーションを実行する方法
  • Spark アプリケーションの監視
10. クラスターを計画する
  • 一般的な計画に関する考慮事項
  • 適切なハードウェアの選択
  • ネットワークの考慮事項
  • 仮想化オプション
  • クラウドデプロイのオプション
  • ノードの設定
11. 高度なクラスター設定
  • サービスポートの設定
  • HDFS と MapReduce のチューニング
  • HDFS 高可用性の有効化
12. リソース管理
  • 静的サービスプールを使用した cgroups の設定
  • フェアスケジューラー
  • 動的リソースプールの設定
  • Impala クエリのスケジューリング
13. クラスターのメンテナンス
  • HDFS のステータスを確認する
  • クラスター間でデータをコピーする
  • HDFS のデータの再バランス
  • HDFS のディレクトリスナップショット
  • クラスターのアップグレード
14. クラスターの監視
  • Cloudera Manager のモニタリング機能
  • ヘルステスト
  • イベントとアラート
  • チャートとレポート
  • モニタリングの推奨事項
15. クラスターのトラブルシューティング
  • 概要
  • トラブルシューティングのツール
  • 設定ミスの例
16. Hue のインストールと管理
  • 概要
  • Hue の管理と設定
  • Hue の認証と認可
17. セキュリティ
  • Hadoop セキュリティのコンセプト
  • Kerberos を使用した Hadoop での認証
  • Hadoop での認可
  • Hadoop での暗号化
  • Hadoop クラスターのセキュア化
18. まとめ 付録A. Apache Kudu
  • Kudu の概要
  • アーキテクチャー
  • インストールと設定
  • 監視と管理ツール
付録B. Apache Kafka
  • Apache Kafka とは何か
  • Apache Kafka の概要
  • Apache Kafka クラスターのアーキテクチャー
  • Apache Kafka のコマンドラインツール
  • Flume と Kafka を使用する
付録C. クラウドでのオブジェクトストア
  • オブジェクトストレージ
  • Hadoop をオブジェクトストレージに接続する

Upcoming Classes

Japan

Location Aug 2019 Sep 2019 Oct 2019 Nov 2019
Tokyo, Japan (Trainocate) Sep 24 – Sep 27
Nov 11 – Nov 14

Classes in bold are guaranteed to run!