Big Data: Hadoop| MapReduce| Hive| Pig| NoSQL| Mahout| Oozie

Why take this course?
この説明に基づいて、Hadoopエコシステムを使用したプロジェクトの例をいくつか挙げることができます。以下は、Hadoopの様々なコンポーネント(Hive、Pig、MapReduce、Sqoopなど)を使用して実施する可能性のあるプロジェクトの概要です。
-
データサイエンスとビッグデータ分析のためのHadoopの基礎知識: このプロジェクトでは、HDFSの動作原理、MapReduceのプログラミングモデル、YARNのリソース管理について学びます。実際にHadoopフレームワークを使用してシンプルなマッピングとリダキングタスクを実行する経験を積みます。
-
Hiveを使用したデータウェアハウジの構築: このプロジェクトでは、Apache Hiveを使用してデータモデリング、データ操作、ビジネスインテリジェンス(BI)レポートの生成など、データウェアハウジを構築する方法を学びます。SQLを使用してHiveQLでクエリを実行し、大規模なデータセットから意味的なインサイトを抽出する方法を経験します。
-
Pig Latinを使用したデータフローの自動化: このプロジェクトでは、Apache Pig Latinを使用してデータの前処理、変換、および分析を自動化するPigのスクリプトを書きます。MapReduceを使用して複雑なデータ処理タスクを実行し、Pig Latinのプログラミングモデルを通じて効率的なデータ処理を行う方法を学びます。
-
Sqoopを使用したデータのインポート/エクスポート: このプロジェクトでは、Apache Sqoopを使用してHadoop HDFSやHiveにあるデータベース間でデータを移行する方法を学びます。Sqoopコマンドを使用してデータセットを効率的にインポートしたりエクスポートしたりするためのテクニックを経験します。
-
MapReduceを使用したビッグデータの分析: このプロジェクトでは、MapReduceフレームワークを使用して大規模なデータセットに対して複雑なデータ処理を実行する方法を学びます。実際のビッグデータセット(例えば、天気データやロジンアクティビティ)に対してマッピングとリダキングプログラムを書き、結果を解釈する方法を経験します。
-
HiveおよびPigを使用したソーシャルメディアデータの分析: このプロジェクトでは、Apache HiveとPigを組み合わせてソーシャルメディアプラットフォームから生成されるデータを分析します。ユーザーの行動パターンや嫌気分析、トレンドの発現(Sentiment Analysis)など、ソーシャルメディアの感じるタスクを実装します。
-
Hiveを使ったデータウェアハウジの構築: このプロジェクトでは、Apache Hiveを使用してビックデータの大きされたデータをモデリングし、そのデータから意味的なインスナー(EDW)の構築を学びます。これにより、Hiveと共有型のデータベースシステム(RDBMS)で大きされたデータを取りしむ(For a more nuanced discussion about RDBMS in Hadoop Ecosystem, refer to...)
-
Sparc++ otr - MapReduceの実装: このプロジェクトでは、MapReduceの実装を学びます。特定の種(Species)の特徴(Characteristics)を抽出し、それらの特徴を抽出する�と(And and and and and or or or or or and and and and and and and and and and and)(…)できる(Can be done by...)。 これらのプロジェクトは、Hadoopエコシステム内であり特定の種類のデータ処理に焦点を当てることができます。プロジェクトは、ビックデータセットの分析、データウェアハウジの構築、ソーシャルメディアの分析など、Hadoopエコシステムを使用して様の問題を解決するために設計されます。実際のビックデータセットや天気データを�げ取りしてリアルな識明や、Sqoopのデータ移動(Data Migration with Sqoop)を行うなど、Hadoopにおける様多様のある分野でさすすすす(…)。
Course Gallery




Loading charts...