ADSP 기출문제 요약집
1-3 가치 창조를 위한 데이터 사이언스와 전략 인사이트
글을 읽기 전 공부 방법에 대한 글을 반드시 먼저 읽고 오시는 것을 추천드립니다.
https://killxxi.tistory.com/100
ADSP 기출문제 요약집 공부방법 및 시험 후기
ADSP 기출문제 요약집 공부방법 및 시험 후기 안녕하세요! 킬씨입니다. 오늘은 저가 공부해서 자격증을 취득한 ADSP 시험에 관한 요약집을 공부하는 방법에 대하여 알려드리겠습니다. 0. 시작에 앞선 인증 일단..
killxxi.tistory.com
ㅇ 산업별 분석 애플리케이션
- 금융 서비스 : 신용점수 산정, 사기 탐지, 가격 책정, 고객 수익성 분석,, 클레임 분석
- 병원 : 가격 책정, 고객 로열티, 수익 관리
- 에너지 : 트레이딩, 공급, 수요 예측
- 정부 : 사기 탐지, 사례관리, 범죄 방지, 수익 최적화
# 다음은 어느 산업의 데이터의 일차원적인 분석 애플리케이션 사례인가? 트레이딩, 공급, 수요예측
에너지 (O)
# ( )란 데이터 로터 의미 있는 정보를 추출해내는 학문이며, 정형 또는 비정형 막론하고 인터넷, 휴대전화, 감시용 카메라 등에서 생성되는 숫자와 문자, 영상 정보 등 다양한 유형의 데이터를 대상으로 하며, 분석뿐 아니라 이를 효과적으로 구현하고 전달하는 과정까지 포함한 포괄적 개념이다. 데이터사이언스
ㅇ 데이터 사이언스의 영역
- IT 컨설팅 : IT + 비즈니스 분석
- 전략 컨설턴트 : Analytics + 비즈니스 분석
- 분석적 영역(Analytics), 비즈니스 컨설팅 영역(비즈니스 분석), 데이터 처리와 관련된 IT 영역(IT)
# 외국의 각 전문가들은 호기심이야말로 데이터 사이언티스트의 중요한 특징이 와 생각한다.
# 데이터 사이언스는 과학과 인문학의 교차로에 서 있다고 할 수 있다.
# 통계학은 정형 또는 비정형을 막론하고 다양한 유형의 데이터를 대상으로 한다. (X)
# 데이터 사이언스의 핵심 구성요소로는 IT 영역, 분석적 영역, 비즈니스 컨설팅 영역이 있다.
# 데이터 사이언스가 기존의 통계학과 다른 점은 데이터 사이언스는 총체적 접근법을 사용한다는 것이다.
# 강력한 호기심이야말로 데이터 사이언티스트의 중요한 특징이라고 할 수 있다.
# 데이터 사이언스란 데이터로부터 의미 있는 정보를 추출해내는 학문이다.
# 통계학이 정형화된 데이터를 분석 대상으로 하지만 데이터 사이언스는 다양한 데어 유형을 대상으로 한다.
# 데이터 마이닝은 분석이 포괄적인 개념이지만 데이터 사이언스는 분석에 초점이 있다. (X)
# 데이터 사이언스는 기존 통계학과 다른 점은 총체적 접근법을 사용한다는 점이다.
# 데이터 사이언스란 데이터로부터 의미 있는 정보를 추출해내는 학문이다.
ㅇ 데이터 사이언티스트의 요구 역량
- Hard Skill : 빅데이터 이론적 지식, 분석 기술 등
- Soft Skill : 통찰력(창의적 사고, 호기심, 논리적,호기심, 비판), 설득력(스토리텔링,시각화), 협력(커뮤니케이션) 등
# 인문학 열풍의 이유는 단순 세계화에서 복잡한 세계로의 변화
# 인문학 열풍의 이유는 비즈니스의 중심이 제품 생산에서 서비스의 변화
# 인문학 열풍의 이유는 경제와 산업의 논리가 생산에서 시장 창조로 바뀌었다..
# 인문학 열풍의 이유는 빅데이터 분석 기법 및 방법론의 확대(X)
# 가트너가 언급한 데이터 사이언티스트의 역량이 아닌 것은?
데이터 관리, 비즈니스 분석, 하드 스킬(X), 분석 모델링
# 데이터 사이언티스트들은 주로 데이터 처리나 분석 기 술과 관련된( 1)만을 요구받고 있는 것처럼 보인 다. 하지만 이러한 ( 1 ) 은 훌륭한 데이터 사이언 티 스트가 갖춰야 하는 능력의 절반에 불과하다. 나머지 절반은 통찰력 있는 분석, 설득력 있는 전달, 협력 등 ( 2 )이다. 하드스킬하드 스킬, 소프트스킬
ㅇ 전략적 통찰력과 인문학의 부활
- 컨버전스 -> 디버전스 : 단순 세계화에서 복잡한 세계화로의 변화
- 생산 -> 서비스 : 비즈니스 중심이 제품 생산에서 서비스로 이동
- 생산 -> 시장창조 : 공급자 중심의 기술경쟁에서 무형자산의 경쟁으로 변화
ㅇ 빅데이터 가치 패러다임의 변화
- 과거(디지털화 Digitalization) : 아날로그 세상을 어떻게 효과적으로 디지털화하는가
-> 현재(연결 Connection) : 연결을 더 효과적이고 효율적으로 제공해 주는가
-> 미래(에이전시 Agency) : 복잡한 연결을 얼마나 효과적이고 믿을 수 있게 관리하는가
ㅇ 데이터 사이언스의 한계
- 인간의 해석이 개입
- 사람에 따라 전혀 다른 해석과 결론
- 모든 분석은 가정에 근거
ㅇ DBMS(Data Base management System)
- 데이터베이스를 관리하여 응용 프로그램들이 데이터베이스를 공유하며 사용하라 수 있는 환경을 제공
- 효율적인 데이터 검색, 저장 기능 등 제공
- 오라클, 인포믹스, 액세스
ㅇ DBMS의 종류
- 관계형 DBMS
ㄴ 칼럼과 로우를 이루는 하나 이상의 테이블로 정리
ㄴ 키가 존재
- 객체지향 DBMS
ㄴ 정보를 객체 형태로 표현하는 데이터베이스 모델
- 네트워크 DBMS
ㄴ 레코드=노드, 관계=간선, 관계=간선,으로 표현되는 그래프 기반 데이터베이스 모델
- 계층형 DBMS
ㄴ 트리 구조를 기반으로 하는 계층 데이터베이스 모델
ㅇ 개인정보 비식별 기술
- 데이터 마스킹 : 데이터를 익명으로 생성 (홍**, **대학)
- 가명처리 : 다른 값으로 대체 (홍국돈(홍국 돈, 항곡대학)
- 총계처리 : 총합 값으로 대체 (키 합:750cm, 평균키:185cm)
- 데이터 값 삭제 : 개인 식별에 중요한 값 삭제 (90년대 생, 남자)
- 데이터 범주화 : 범주의 값으로 변환 (홍씨(홍 씨, 30~40세)
ㅇ 데이터 무결성
- 데이터에 대한 정확한 일관성, 유효성, 신뢰성 보장을 위해 제한
ㅇ 데이터 레이크
- 데이터 형식, 방식에 상관없이 데이터를 저장하는 시스템
ㅇ 빅데이터 분석 기술
- 하둡(Hadoop) : 여러 개의 컴퓨터를 하나인 것처럼 묶어 대용량 데이터를 처리하는 기술
- Apache Spark : 실시간 분산형 컴퓨팅 플랙폼, In-Memory 방식으로 하둡에 비해 처리속도가 빠름
- Smart Factory : 공장 내 설비와 기계에 사물인터넷이 설치되어, 공정 데이터가 실시간으로 수집되고 데이터에 기반한 의사결정이 이뤄짐으로써 생산성을 극대화
- Machine Learning : 인간의 학습 능력과 같은 기능을 컴퓨터에서 실현하고자 하는 기술 및 기법
- Deep Learning : 컴퓨터가 많은 데이터를 이용해 사람처럼 스스로 학습할 수 있도록 인공신경망 등의 기술을 기반하여 구축한 기계학습 기술 중 하나
ㅇ 데이터의 유형
- 정형데이터 : 형태 존재, 연산 가능, RDBMS에 저장 (RDBMS, CSV, spread sheet 등)
- 반정형데이터 : 형태 존재, 연산 불가능, 파일로 저장 (XML, HTML, JSON, 웹로그, 센서 데이터 등)
- 비정형데이터 : 형태 없음, 연산 불가능, NoSQL에 저장 (소셜데이터, 영상, 이미지, 음성, 텍스트 등)
# 데이터 저장 방식에는RDB, NoSQL, 분산 파일 시스템 저장 방식이 있다. 다음 중 NoSQL 관련이 없는 도구는?
MongoDB ,Hbase , Redis , mySQL“ (X)
'Study of GifMan > ADSP' 카테고리의 다른 글
ADSP 기출문제 요약집 2-2 분석 마스터 플랜 (2) | 2020.04.16 |
---|---|
ADSP 기출문제 요약집 2-1 데이터 분석 기획의 이해 (0) | 2020.04.15 |
ADSP 기출문제 요약집 1-2 데이터의 가치와 미래 (0) | 2020.04.13 |
ADSP 기출문제 요약집 1-1 데이터의 이해 (0) | 2020.04.13 |
ADSP 기출문제 요약집 공부방법 및 시험 후기 (0) | 2020.04.13 |