서브메뉴

본문

빅데이터 활용서 1 (R을 이용한 중ㆍ고급 데이터 분석)
빅데이터 활용서 1 (R을 이용한 중ㆍ고급 데이터 분석)
저자 : 김경태|안정국|김동현
출판사 : 시대인
출판년 : 2016
ISBN : 9791125426929

책소개

[빅데이터(Big Data) 활용서]는 실전을 접해보고 싶은 독자들에게 비즈니스 관점의 시각으로 분석을 경험할 수 있는 기회를 제공한다. 여기에 쓰인 데이터는 저자가 프로젝트로 실제 작업했고, 교육과정에서 워크샵을 통해 4~32시간의 과정을 거쳐 검증된 사례들이다. 책은 빅데이터 이용 목적과 접근방법, 데이터 획득 및 가공, 모델링 및 검증, 결과물에 대한 커뮤니케이션을 하나하나 설명하며 제시 한다. 전체적으로 새로운 패키지들로 작성을 했고, 특히 Visualization, Financial Analysis, Social Network Analysis, Simulation에 관한 내용을 많이 수록했다. 금융분석은 환율 및 KOSPI200 예측에도 일부 사용되었고, 소셜 네트워크 분석은 이전에는 간단한 그래프 표현을 통한 인사이트에 주력했다면 이번에는 구체적인 통계량을 갖고 해설할 수 있는 수준으로 제시했으며, 시뮬레이션은 개념 수준에서 구체적인 모델링을 할 패키지와 함께 예제를 제시했다.
[교보문고에서 제공한 정보입니다.]

출판사 서평

도서 특징
★★ 다른 빅데이터 도서와의 차별점 ★★


ㆍR관련 데이터 처리, 마이닝, 시뮬레이션, 최적화에 이르는 빅데이터 분석 대부분을 포함
ㆍ빅데이터 분야에 대해 유일하게 Simulation, Optimization 제시
ㆍR 관련 새로운 package 소개
ㆍR sample script가 아닌 실제 사용가능한 script 활용
ㆍ다양한 분야에 대한 활용 예시
ㆍ저자의 기존 도서와 함께 보면 단기간에 다양한 시각 및 비즈니스적인 분석 관점 획득가능
ㆍ후속 시리즈를 통한 지속적인 학습 가능

출판사 서평
빅데이터 분석은 테크닉이라는 편견을 산산이 깨어주마!
빅데이터는 사이언스다!


아이폰과 갤럭시 중 어떤 게 시장에서 반응이 더 좋을까?
이미지도 데이터화 시켜 식별할 수 있을까?
내 애인의 말은 진실일까? 거짓일까?
데이터 분석을 통해 상장폐지될 종목을 미리 알 수 있다고?!!

최근 서점에 가보면 빅데이터의 붐을 느낄 수 있다. 통계에서부터 시작해 분석 툴인 R, SAS, SPSS, 그리고 Python. 빅데이터 기술서도 많고, 빅데이터 관련 인문 서적도 많다. 그 중에서 데이터 마이닝 책도 꽤 된다. 그런데 이 중에서 데이터 사이언티스트가 되려면 어떤 책을 봐야 할까?
이 책이 위의 의문사항에 해답을 제시한다고 감히 말하고 싶다. 본서는 실전을 접해보고 싶은 독자들에게 비즈니스 관점의 시각으로 분석을 경험할 수 있는 기회를 제공한다. 여기에 쓰인 데이터는 저자가 프로젝트로 실제 작업했고, 교육과정에서 워크샵을 통해 4~32시간의 과정을 거쳐 검증된 사례들이다.
본서에서는 빅데이터 이용 목적과 접근방법, 데이터 획득 및 가공, 모델링 및 검증, 결과물에 대한 커뮤니케이션을 하나하나 설명하며 제시 한다. 분량이 많기 때문에 단기간 집중적으로 따라해 보는 게 필요하다. 그리고 본서 이후에 나올 흥미로운 주제들이 계속 나올 것이므로 1달 안에 마스터 한다고 해보기를 권유한다. 빅데이터 시대의 경쟁력은 속도와 창의력이다.

전체적으로 새로운 패키지들로 작성을 했고, 특히 Visualization, Financial Analysis, Social Network Analysis, Simulation에 관한 내용을 많이 수록했다. 금융분석은 환율 및 KOSPI200 예측에도 일부 사용되었고, 소셜 네트워크 분석은 이전에는 간단한 그래프 표현을 통한 인사이트에 주력했다면 이번에는 구체적인 통계량을 갖고 해설할 수 있는 수준으로 제시했으며, 시뮬레이션은 개념 수준에서 구체적인 모델링을 할 패키지와 함께 예제를 제시했다.
요즘 스마트폰 앱을 이용해 데이터를 모으고 분석하여 사용자에게 무언가를 제안하는 것이 가장 hot하다. 이러한 분석은 데이터 마이닝의 다양한 유형과 알고리즘을 통해 패턴을 찾고 이를 응용한 것이다. 지금까지 이론적으로만 공부해 왔다면 이 책에 수록된 예제들을 익히고 분석으로 접근해 실력 있는 데이터 사이언티스트에 한 발 더 다가서게 될 것이다.

● 베타테스터 서평

통계분석을 넘어서 마이닝기법을 실제 사례를 이용해 알기 쉽게 전개하고 있다. 지금까지의 책들이 통계에 치우치거나 마이닝의 특정 기법에 대해 이론적으로 접근하는 한계가 있었는데, 이를 넘어서는 매우 의미 있는 책이다.
- asui**

다른 책에서는 찾아보기 힘든 Simulation과 Optimization을 다루고 있어 마음에 든다. 내용이 상당히 포괄적이면서 동시에 깊이도 있어 중고급 이상의 수준을 가진 분석자에게도 도움이 될 것이다.
- 1byte**

그동안 많은 강연을 들으면서 소개되었던 사례들이 손에 들어왔다. 처음에는 다른 책처럼 이론과 약간의 내용을 공개하는 수준으로 생각했으나 사례가 매우 구체적이어서 깜짝 놀랐다. 비법 공개서라는 생각이 들 정도이다.
- carey14**

이렇게 많은 사례를 공개하다니… 이러면 안되는 거 아닌가 싶은데… 시리즈로 나온다고 하니 앞으로의 책도 상당히 기대가 된다. 멈추지 말고 공개를 계속 해주시길…
- tomorr**

오랜 기간 데이터분석을 해왔지만 데이터마이닝을 이렇게 다양하게 활용할 수 있다는 것에 감동받았다. 재무적인 분야에서 의학, 범죄, 이미지까지 정말 다양한 분야에 경험이 있다는 것에 놀라울 뿐이다.
- shduop**

이 책을 읽기 전에는 선입견을 갖고 있었는데 테크닉 정도로 생각했던 데이터 분석이 이런 거구나라는 맛 볼 계기가 되었다. 데이터 사이언티스트라고 불리는 이유가 있었군.
- coolgood**
[교보문고에서 제공한 정보입니다.]

목차정보

● 1장 R을 이용한 빅데이터 분석 이론 및 실습
1절 빅데이터 분석 개요
2절 최근 빅데이터 분석 이슈
1. 빅데이터 시장 상황
2. 빅데이터 추진방향
3. 전문인력 부족 및 양성
4. 빅데이터를 활용한 예측
5. 소셜 또는 비정형 데이터 분석
6. 시각화 활용
7. 인사관리 분야에 대한 적용
8. 개인정보 보호
3절 데이터 마이닝
1. Data Preprocessing
2. Clustering
3. Text Mining
4절 시각화
1. d3Chart
2. d3Network
5절 시뮬레이션
6절 최적화
7절 Image Processing
8절 프로젝트 관리 및 문서화
1. 프로젝트(project) 관리
2. 마크다운(Markdown)을 이용한 문서화

● 2장 평판 분석

● 3장 거짓식별
1절 배 경
2절 모델설계
3절 모델구현
4절 활 용

● 4장 자동차 이미지 식별

● 5장 코호트 DB를 이용한 질병예측
1절 개요 및 배경
2절 필요성
3절 분석항목
4절 데이터 구성
5절 모델링 및 예상결과
6절 검증 및 향후과제

● 6장 원/달러 환율 예측
1절 환율 메커니즘
2절 원/달러 환율 예측 개괄
3절 데이터 수집
4절 Mart 만들기
5절 모델링(Modeling)
6절 step을 이용한 변수 선택
7절 정 리

● 7장 소셜 네트워크 분석을 결합한 NASDAQ 주가예측
1절 소셜분석과 주가변동 예측 개요
2절 분석방안 및 데이터 준비
1. 분석 대상 기업
2. 활용데이터
3. 분석절차
4. 트위터 데이터 입수
5. 주가정보 입수
6. 뉴스데이터 입수
7. 트위터 데이터 전처리
8. 감성분석
3절 분석용 데이터 정의

● 8장 상장폐지 예측 모델
1절 상장 폐지 예측 개요
1. 주식투자자로서 피하고 싶은 상장폐지
2. 그외 이해관계인도 상장폐지는 주 관심사
3. 예측된 회사인 경우의 대응 방안
4. 그 외 활용 방안
5. 모델링 개요
6. 변수와 모델의 제한
2절 Data의 이해
1. 일반 정보
2. 재무 정보
3. 재무 비율
4. 파생 변수
3절 상장폐지 모델 R script
1. 데이터 마트 구성
2. 3년 단위분할 마트 생성
3. 3개data 통합 후 상장폐지사 예측 모델링
4. 단일연도 상장폐지사 예측 모델링
5. caret 패키지를 이용한 모델링
6. 탐지율을 높이는 방법
4절 정 리
[교보문고에서 제공한 정보입니다.]