ADSP 기출문제 요약집 1-3 가치 창조를 위한 데이터 사이언스와 전략 인사이트

ADSP 기출문제 요약집

 1-3 가치 창조를 위한 데이터 사이언스와 전략 인사이트

 

 

글을 읽기 전 공부 방법에 대한 글을 반드시 먼저 읽고 오시는 것을 추천드립니다.

https://killxxi.tistory.com/100

 

ADSP 기출문제 요약집 공부방법 및 시험 후기

ADSP 기출문제 요약집 공부방법 및 시험 후기 안녕하세요! 킬씨입니다. 오늘은 저가 공부해서 자격증을 취득한 ADSP 시험에 관한 요약집을 공부하는 방법에 대하여 알려드리겠습니다. 0. 시작에 앞선 인증 일단..

killxxi.tistory.com

 


 

 

ADSP 기출요약집 가치 창조를 위한 데이터 사이언스와 전략 인사이트

 

 

산업별 분석 애플리케이션

- 금융 서비스 : 신용점수 산정, 사기 탐지, 가격 책정, 고객 수익성 분석,, 클레임 분석

- 병원 : 가격 책정, 고객 로열티, 수익 관리

- 에너지 : 트레이딩, 공급, 수요 예측

- 정부 : 사기 탐지, 사례관리, 범죄 방지, 수익 최적화

 

# 다음은 어느 산업의 데이터의 일차원적인 분석 애플리케이션 사례인가? 트레이딩, 공급, 수요예측

에너지 (O)

# ( )란 데이터 로터 의미 있는 정보를 추출해내는 학문이며, 정형 또는 비정형 막론하고 인터넷, 휴대전화, 감시용 카메라 등에서 생성되는 숫자와 문자, 영상 정보 등 다양한 유형의 데이터를 대상으로 하며, 분석뿐 아니라 이를 효과적으로 구현하고 전달하는 과정까지 포함한 포괄적 개념이다. 데이터사이언스

 

 

 

 

데이터 사이언스의 영역

- IT 컨설팅 : IT + 비즈니스 분석

- 전략 컨설턴트 : Analytics + 비즈니스 분석

- 분석적 영역(Analytics), 비즈니스 컨설팅 영역(비즈니스 분석), 데이터 처리와 관련된 IT 영역(IT)

 

# 외국의 각 전문가들은 호기심이야말로 데이터 사이언티스트의 중요한 특징이 와 생각한다.

# 데이터 사이언스는 과학과 인문학의 교차로에 서 있다고 할 수 있다.

# 통계학은 정형 또는 비정형을 막론하고 다양한 유형의 데이터를 대상으로 한다. (X)

# 데이터 사이언스의 핵심 구성요소로는 IT 영역, 분석적 영역, 비즈니스 컨설팅 영역이 있다.

# 데이터 사이언스가 기존의 통계학과 다른 점은 데이터 사이언스는 총체적 접근법을 사용한다는 것이다.

# 강력한 호기심이야말로 데이터 사이언티스트의 중요한 특징이라고 할 수 있다.

# 데이터 사이언스란 데이터로부터 의미 있는 정보를 추출해내는 학문이다.

# 통계학이 정형화된 데이터를 분석 대상으로 하지만 데이터 사이언스는 다양한 데어 유형을 대상으로 한다.

# 데이터 마이닝은 분석이 포괄적인 개념이지만 데이터 사이언스는 분석에 초점이 있다. (X)

# 데이터 사이언스는 기존 통계학과 다른 점은 총체적 접근법을 사용한다는 점이다.

# 데이터 사이언스란 데이터로부터 의미 있는 정보를 추출해내는 학문이다.

 

 

 

 

데이터 사이언티스트의 요구 역량

- Hard Skill : 빅데이터 이론적 지식, 분석 기술 등

- Soft Skill : 통찰력(창의적 사고, 호기심, 논리적,호기심, 비판), 설득력(스토리텔링,시각화), 협력(커뮤니케이션)

 

# 인문학 열풍의 이유는 단순 세계화에서 복잡한 세계로의 변화

# 인문학 열풍의 이유는 비즈니스의 중심이 제품 생산에서 서비스의 변화

# 인문학 열풍의 이유는 경제와 산업의 논리가 생산에서 시장 창조로 바뀌었다..

# 인문학 열풍의 이유는 빅데이터 분석 기법 및 방법론의 확대(X)

# 가트너가 언급한 데이터 사이언티스트의 역량이 아닌 것은?

데이터 관리, 비즈니스 분석, 하드 스킬(X), 분석 모델링

# 데이터 사이언티스트들은 주로 데이터 처리나 분석 기 술과 관련된( 1)만을 요구받고 있는 것처럼 보인 다. 하지만 이러한 ( 1 ) 은 훌륭한 데이터 사이언 티 스트가 갖춰야 하는 능력의 절반에 불과하다. 나머지 절반은 통찰력 있는 분석, 설득력 있는 전달, 협력 등 ( 2 )이다. 하드스킬하드 스킬, 소프트스킬

 

 

 

 

전략적 통찰력과 인문학의 부활

- 컨버전스 -> 디버전스 : 단순 세계화에서 복잡한 세계화로의 변화

- 생산 -> 서비스 : 비즈니스 중심이 제품 생산에서 서비스로 이동

- 생산 -> 시장창조 : 공급자 중심의 기술경쟁에서 무형자산의 경쟁으로 변화

 

 

 

 

빅데이터 가치 패러다임의 변화

- 과거(디지털화 Digitalization) : 아날로그 세상을 어떻게 효과적으로 디지털화하는가

-> 현재(연결 Connection) : 연결을 더 효과적이고 효율적으로 제공해 주는가

-> 미래(에이전시 Agency) : 복잡한 연결을 얼마나 효과적이고 믿을 수 있게 관리하는가

 

 

 

 

데이터 사이언스의 한계

- 인간의 해석이 개입

- 사람에 따라 전혀 다른 해석과 결론

- 모든 분석은 가정에 근거

 

 

 

 

DBMS(Data Base management System)

- 데이터베이스를 관리하여 응용 프로그램들이 데이터베이스를 공유하며 사용하라 수 있는 환경을 제공

- 효율적인 데이터 검색, 저장 기능 등 제공

- 오라클, 인포믹스, 액세스

DBMS의 종류

- 관계형 DBMS

칼럼과 로우를 이루는 하나 이상의 테이블로 정리

키가 존재

- 객체지향 DBMS

정보를 객체 형태로 표현하는 데이터베이스 모델

- 네트워크 DBMS

레코드=노드, 관계=간선, 관계=간선,으로 표현되는 그래프 기반 데이터베이스 모델

- 계층형 DBMS

트리 구조를 기반으로 하는 계층 데이터베이스 모델

 

 

 

 

개인정보 비식별 기술

- 데이터 마스킹 : 데이터를 익명으로 생성 (**, **대학)

- 가명처리 : 다른 값으로 대체 (홍국돈(홍국 돈, 항곡대학)

- 총계처리 : 총합 값으로 대체 (키 합:750cm, 평균키:185cm)

- 데이터 값 삭제 : 개인 식별에 중요한 값 삭제 (90년대 생, 남자)

- 데이터 범주화 : 범주의 값으로 변환 (홍씨(홍 씨, 30~40)

 

 

 

 

데이터 무결성

- 데이터에 대한 정확한 일관성, 유효성, 신뢰성 보장을 위해 제한

 

 

 

 

데이터 레이크

- 데이터 형식, 방식에 상관없이 데이터를 저장하는 시스템

 

 

 

 

빅데이터 분석 기술

- 하둡(Hadoop) : 여러 개의 컴퓨터를 하나인 것처럼 묶어 대용량 데이터를 처리하는 기술

- Apache Spark : 실시간 분산형 컴퓨팅 플랙폼, In-Memory 방식으로 하둡에 비해 처리속도가 빠름

- Smart Factory : 공장 내 설비와 기계에 사물인터넷이 설치되어, 공정 데이터가 실시간으로 수집되고 데이터에 기반한 의사결정이 이뤄짐으로써 생산성을 극대화

- Machine Learning : 인간의 학습 능력과 같은 기능을 컴퓨터에서 실현하고자 하는 기술 및 기법

- Deep Learning : 컴퓨터가 많은 데이터를 이용해 사람처럼 스스로 학습할 수 있도록 인공신경망 등의 기술을 기반하여 구축한 기계학습 기술 중 하나

 

 

 

 

데이터의 유형

- 정형데이터 : 형태 존재, 연산 가능, RDBMS에 저장 (RDBMS, CSV, spread sheet )

- 반정형데이터 : 형태 존재, 연산 불가능, 파일로 저장 (XML, HTML, JSON, 웹로그, 센서 데이터 등)

- 비정형데이터 : 형태 없음, 연산 불가능, NoSQL에 저장 (소셜데이터, 영상, 이미지, 음성, 텍스트 등)

 

# 데이터 저장 방식에는RDB, NoSQL, 분산 파일 시스템 저장 방식이 있다. 다음 중 NoSQL 관련이 없는 도구는?

MongoDB ,Hbase , Redis , mySQL“ (X)

 

 

 

댓글

Designed by JB FACTORY