Skip to content

dhkdn9192/data_engineer_career

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

banner

데이터 엔지니어 직무와 관련된 지식, 기술질문 등을 정리합니다.

Table of Contents


1. Data Engineering

1-1. Hadoop

1-2. Spark

1-3. Kafka

1-4. ELK Stack

1-5. Airflow

1-6. Hive

  • HiveServer2 (link)
  • Hive Design and Architecture (link)
  • Hive ACID (link)
  • Hive Replication (link)
  • Hive Query Planner and Optimizer (link)
  • Partition, Bucket, Index
  • Which is faster, SORT BY or ORDER BY in HiveQL?
  • What is HCatalog?
  • Hive UDF란?
  • Hive의 View와 Table
  • HiveQL Merge Into
  • STORED AS의 INPUTFORMAT, OUTPUTFORMAT, SERDE (link1, link2)

1-7. others


2. Cloud Computing

2-1. Docker and k8s

2-2. AWS


3. Computer Science

3-1. Operation System

3-2. Database

3-3. Network

3-4. Data Structure and Algorithm

3-5. Programming Language

3-6. common

객체지향프로그래밍, 디자인패턴, 아키텍처패턴, 개발방법론, 소프트웨어공학 등

  • OOP
    • 캡슐화
    • 상속
      • 메소드 오버라이딩
    • 다형성
      • 메소드 오버로딩
    • 객체지향 5원칙: SOLID
    • 객체-관계 매핑 (Object Relational Mapping, ORM) (link)
  • Idempotence(멱등성)
  • 테스트 도구와 절차
  • 트래픽/트랜잭션량 측정
  • Lambda architecture (link)
  • ETL과 ELT

4. Back-end


5. Fields of study

기타 읽을거리 및 관심있는 연구주제, 토이 프로젝트 등


Reference