【한글자막】 Apache Spark 와 Scala로 빅 데이터 다루기

【전세계 81만 수강 TOP강사!】 Desktop 또는 Scala가 포함된 Hadoop에서 대규모 데이터 세트를 분석하는 20개 이상의 실습 예제가 포함된 Apache Spark 튜토리얼!
4.68 (55 reviews)
Udemy
platform
한국어
language
Data Science
category
【한글자막】 Apache Spark 와 Scala로 빅 데이터 다루기
491
students
9 hours
content
Sep 2024
last update
$74.99
regular price

Why take this course?

여러분의 질문에 답변드리겠습니다. 마블 슈퍼히어로들 간의 "Degree of Separation"을 찾는 것은 소셜 네트워크 분석(Social Network Analysis, SNA)의 일부입니다. 이를 통해 우리는 마블 宇ни버스 내의 캐릭터들 간의 연결성을 파악할 수 있습니다. 이 분석은 일반적으로 그래프 이론을 사용하여 수행되며, Apache Spark와 같은 대규모 데이터 처리 플랫폼을 사용할 수 있습니다.

Apache Spark는 Hadoop의 이력과 함께 선보이는 오프라인(batch) 및 실시간(real-time) 데이터 처리를 위한 병렬 처리 엔진입니다. Spark는 Resilient Distributed Dataset(RDD)이라는 추상화 개념을 기반으로 하며, 이를 통해 대규모 데이터셋을 효율적으로 처리할 수 있습니다. Spark SQL은 데이터 분석과 전환(DataFrames and DataSets)을 위한 Hadoop용 연산의 Spark의 일부입니다. Spark Streaming은 실시간 스트림 데이터 처리를 지원합니다. GraphX는 그래프과 같은 복잡한 데이터 구조를 처리하기 위해 설계된 Spark의 모듈입니다.

마블 슈퍼히어로들의 연결성을 분석하기 위해서는 먼저 데이터를 수집하고, 이를 정리하여 각각의 캐릭터들이 어떻게 연결되어 있는지를 나타내는 그래프(graph)를 만듭니다. Spark를 사용하면 이러한 과정을 대규모 데이터셋에도 효율적으로 수행할 수 있습니다. GraphX를 사용하여 그래프의 구조를 분석하고, 중심성(centrality measures)을 계산하여 마블 宇니버스 내에서 가장 영향력 있는 캐릭터들을 찾을 수 있습니다.

Frank Kane의 강의는 Apache Spark와 Scala를 사용하여 대규모 데이터 분석 작업을 수행하는 방법을 배울 수 있게 도와줍니다. 그의 강의는 AWS EMR와 같은 Hadoop 클러스터를 사용하는 현장에서도 실용적으로 적용할 수 있는 방법을 제공합니다. 마블 슈퍼히어로들의 연결성 분석과 같은 고급 기능까지 포함되므로, 데이터 분석가나 엔지니어로서 Spark에 대한 심도 있는 이해를 원하신다면 그의 강의를 참고하시는 것은 좋은 선택일 것입니다.

Course Gallery

【한글자막】 Apache Spark 와 Scala로 빅 데이터 다루기 – Screenshot 1
Screenshot 1【한글자막】 Apache Spark 와 Scala로 빅 데이터 다루기
【한글자막】 Apache Spark 와 Scala로 빅 데이터 다루기 – Screenshot 2
Screenshot 2【한글자막】 Apache Spark 와 Scala로 빅 데이터 다루기
【한글자막】 Apache Spark 와 Scala로 빅 데이터 다루기 – Screenshot 3
Screenshot 3【한글자막】 Apache Spark 와 Scala로 빅 데이터 다루기
【한글자막】 Apache Spark 와 Scala로 빅 데이터 다루기 – Screenshot 4
Screenshot 4【한글자막】 Apache Spark 와 Scala로 빅 데이터 다루기

Loading charts...

Related Topics

4278410
udemy ID
03/09/2021
course created date
06/11/2021
course indexed date
Bot
course submited by