서브메뉴

본문

비즈니스를 위한 데이터 과학 (빅데이터를 바라보는 데이터 마이닝과 분석적 사고)
비즈니스를 위한 데이터 과학 (빅데이터를 바라보는 데이터 마이닝과 분석적 사고)
저자 : 포스터 프로보스트|톰 포셋
출판사 : 한빛미디어
출판년 : 2014
ISBN : 9788968481093

책소개

『비즈니스를 위한 데이터 과학』는 데이터 과학에서 가장 중요한 기본 개념을 설명한다. 이 개념들은 문제에 대한 계획을 세우는 일부터 데이터 과학 기법을 적용하고 더 나은 의사 결정을 하기 위해 결과를 배치하는 과정까지 폭 넓게 적용될 뿐만 아니라 다양한 비즈니스 분석 방법론 및 기법의 기반이 되기도 한다.
[교보문고에서 제공한 정보입니다.]

출판사 서평

이 책은 비즈니스 의사 결정을 향상시키기 위해 대량의 데이터에서 유용한 정보와 지식을 추출하는 방법에 대해 설명한다.

데이터 과학이란?
‘데이터 과학’과 ‘데이터 마이닝’이라는 용어는 종종 혼용해서 사용되지만, 다양한 특징을 가진 개인과 기관이 ‘데이터 과학’을 통해 이익을 얻으려고 함에 따라 새로운 의미를 지니게 되었다. 간단히 말해 데이터 과학은 데이터로부터 지식을 뽑아내는 방법을 알려주는 근본적인 원리를 말하며, 데이터 마이닝은 이 원리에 따르는 기술을 이용해 데이터에서 지식을 뽑아내는 기법을 말한다. 용어의 범위를 따지자면 ‘데이터 과학’은 기존에 사용해 오던 ‘데이터 마이닝’에 비해 더 넓은 범위를 가리키며, 데이터 마이닝 기법은 데이터 과학의 원리를 잘 보여준다고 할 수 있다.

왜 이 책을 읽어야 할까?
데이터 과학을 직접 응용할 일이 없더라도 데이터 과학을 이해하는 일은 매우 중요하다. 데이터 분석적 사고 방식에 익숙해지면 데이터 마이닝 프로젝트를 평가하는 데 도움이 된다. 예를 들어 어떤 컨설턴트나 잠재적인 투자자가 데이터에서 지식을 추출하는 업무를 개선하고자 제안할 경우, 제안서를 체계적으로 평가함으로써 제안이 과연 타당한지, 아니면 문제가 있는지를 판단할 수 있다. 그렇다고 해서 프로젝트가 성공한다고는 확신할 수 없지만(데이터 마이닝 프로젝트는 실제로 시도해봐야 결과를 알 수 있는 경우가 많다) 적어도 제안서에 있는 결함이나 비현실적 가정, 빠진(놓치는) 부분은 알아낼 수 있다.

데이터 과학에 대한 이 책의 개념적 접근 방법
이 책에서는 데이터 과학에서 가장 중요한 기본 개념을 설명한다. 이 개념의 일부는 각 장의 ‘제목’이 되기도 하고 다른 일부는 설명을 통해 자연스럽게 소개된다(설명에 들어 있는 개념은 기본 개념이라고 표시되어 있지 않다). 이 개념들은 문제에 대한 계획을 세우는 일부터 데이터 과학 기법을 적용하고 더 나은 의사 결정을 하기 위해 결과를 배치하는 과정까지 폭 넓게 적용될 뿐만 아니라 다양한 비즈니스 분석 방법론 및 기법의 기반이 되기도 한다.

대상 독자
-. 데이터 과학자와 함께 일을 하거나 데이터 과학 중심의 프로젝트를 관리하는 사람들
-. 데이터 과학 벤처 기업에 투자하려는 기업가
-. 데이터 과학 프로젝트를 구현하려는 개발자
-. 데이터 과학자를 지망하는 사람

이 책으로 가르치는 분들께
“이 책은 매우 다양한 데이터 과학 과정 교재로 훌륭히 사용되어 왔습니다. 초기에 이 책은 포스터 교수가 2005년 가을 뉴욕대 스턴 스쿨에서 여러 과의 주제를 종합해 가르치기 위해 만든 교재에서 시작되었습니다*. 원래 강의는 MBA와 MSIS 학생을 대상으로 했지만, 대학의 다른 학과의 학생들이 많이 몰려와 원래 이 강의 대상이었던 MBA 및 MSIS 학생들뿐만 아니라 기계 학습 등에서 든든한 기반이 있는 학생들에게도 특히 유용했다는 점이 이채롭습니다. 아마도 그들의 교과 과정에서는 알고리즘 이외에 근본적인 원리에 대해 주목하지 않았기 때문일 것 같습니다.
뉴욕대에서는 현재 이 책을 데이터 과학에 관련된 다양한 강의에서 교재로 사용하고 있습니다. 원래의 MBA 및 MSIS 과정은 물론이고, 학부 비즈니스 분석학, 뉴욕대 스턴 스쿨의 비즈니스 분석학 석사 과정, 뉴욕대에 신설된 데이터 과학 석사과정을 위한 데이터 과학 입문 교재로 사용되고 있습니다. 게다가 이 책이 출판되기도 전에 이미 7개국 10여 개 대학의 경영대, 컴퓨터 과학과 및 데이터 과학에 대한 입문 일반 과정에서 이 책을 교재로 채택해 사용해 왔습니다.”

추천평
“빅데이터가 제공하는 기회를 잡으려는 모든 사람이 꼭 읽어야 할 책”
- 크레이그 본
SAP 글로벌 부사장

“결국 현대 사회에서 데이터는 비즈니스며, 데이터를 생각하지 않고는 더 이상 비즈니스를 생각할 수 없습니다. 이 책은 이 점을 명확히 설명하고 있습니다. 필요한 시기에 나와준 이 책을 통해 데이터를 과학적으로 생각하는 방법에 대해 이해하게 되리라 생각합니다.”
- 론 베커먼
카멜 벤처(Carmel Ventures) 데이터 총괄 이사

“데이터 과학자를 관리하거나 함께 작업하는, 기술적인 내용에 파묻히지 않고 데이터 과학에 대한 주요 내용과 알고리즘을 더 쉽게 이해하려는 비즈니스 관리자에게 최고의 책입니다.”
- 로니 코하비
마이크로소프트 온라인 서비스 부문 공동 아키텍트

“저자 프로보스트와 포셋은 실세계에서 적용하고 있는 데이터 분석 기술에 정통하며, 이 분야에서 누구도 따라올 수 없을 만큼 잘 요약해 설명하고 있습니다.”
- 지오프 웹
Data Mining and Knowledge Discovery지 수석 편집자

“나와 함께 일하는 모든 사람이 이 책을 읽었으면 좋겠습니다.”
- 클로디아 펄릭
M6D(Media6Degrees) 수석 과학자
2013년 Advertising Research Foundation 혁신 대상 입상자

“빠르게 발전해가는 데이터 과학 분야의 기초, 빅데이터 혁명에 관심 있는 사람들의 필독서”
- 저스틴 개퍼
Teledyne Scientific and Imaging 비즈니스 부문 분석 관리자

“두 저자는 모두 데이터 과학이라는 이름이 존재하기도 전부터 잘 알려져 있었으며, 복잡한 주제를 모든 사람들이 이해할 수 있게 설명하고 있습니다. 특히 데이터 과학에 입문하는 사람들에게 도움이 될 것입니다. 내가 알기로 비즈니스 문제에 데이터 과학 문제를 적용하는 데 중점을 두고 있는 책은 이 책이 최초입니다. 이 책은 고객 이탈, 타겟 마케팅, 심지어 위스키 분석처럼 실제 비즈니스에서 발생하는 익숙한 문제를 여러 곳에서 예제로 다룹니다.
이 책은 알고리즘을 나열하기보다는 데이터 과학에 깔려 있는 개념을 독자가 잘 이해할 수 있게 해주며, 무엇보다도 문제를 해결하기 위해 어떻게 접근해 성공적으로 해결하는지에 대한 방법을 알려줍니다. 데이터 과학에 대한 좋은 입문서를 찾거나 데이터 과학자를 지망하는 독자를 위한 필독서입니다.”
- 크리스 볼린스키
AT&T 연구소 통계 연구부장, 넷플릭스 백만 불 도전 우승팀원

“이 책은 단순한 데이터 분석학 입문서가 아닙니다. 이 책은 세상에 널린 데이터를 이용해 비즈니스를 하고 있는 사람들, 즉 우리 모두를 위한 핵심적인 안내서며 데이터에 기반해 의사 결정을 하기 위한 필독서입니다.”
- 톰 필립스
Media6Degrees CEO, 전 구글 검색 및 웹로그 분석팀장

“데이터를 현명하게 사용하면 비즈니스 경쟁력을 새로운 차원으로 끌어올릴 수 있습니다. 데이터가 주도하는 환경에서 성공하려면 엔지니어, 분석가, 관리자 모두 자신 앞에 놓여 있는 선택 사항, 설계 결정 사항, 장단점을 반드시 이해하고 있어야 합니다. 『비즈니스를 위한 데이터 과학』은 흥미로운 예제, 명확한 설명, ‘방법’뿐만 아니라 ‘이유’도 자세하고 폭넓게 설명하고 있으므로, 데이터 주도 시스템을 개발하고 응용하는 업무를 수행하려는 모든 사람에게 완벽한 입문서입니다.”
- 조쉬 애텐버그
Etsy 데이터 과학팀장

“생산성 향상, 혁신, 고객에 대한 이해 증대의 기반에 데이터가 있습니다. 최근에서야 기업 간 경쟁에서 우위를 선점하기 위해서는 데이터를 잘 다뤄야 비즈니스를 유지할 수 있다는 인식이 급속히 퍼져나가고 있습니다. 저자의 깊이 있는 경험이 녹아 있는 이 책은 비즈니스 경쟁력 향상을 위해 반드시 읽어야 할 필독서입니다.”
- 앨런 머레이
다수의 스타트업 투자자, Coriolis Ventures 공동 투자자

“외환 거래를 하고 있는 나는 유동성 분석하는 데 있어서 이 책으로부터 많은 아이디어를 얻었습니다. 데이터 마이닝에 대한 최고의 책입니다. 훌륭한 예제를 통해 데이터 과학에 대해 깊이 있게 이해할 수 있게 되었습니다. 이 책은 내 서재에 평생 놓여 있을 겁니다.”
- 니디 카수리아
스코틀랜드 왕립 은행 FX 부사장
[교보문고에서 제공한 정보입니다.]

목차정보

1장. 개요 : 데이터 분석적 사고 방식
__1.1 데이터가 제공하는 무한한 기회
__1.2 예 : 허리케인 프란시스
__1.3 예제 : 고객 이탈 예측
__1.4 데이터 과학, 데이터 공학, 데이터 주도 의사 결정
__1.5 데이터 처리와 ‘빅 데이터’
__1.6 빅 데이터 1.0에서 빅 데이터 2.0으로
__1.7 전략적 자산으로서의 데이터 및 데이터 과학 능력
__1.8 데이터 분석적 사고
__1.9 이 책에 대하여
__1.10 다시 보는 데이터 마이닝과 데이터 과학
__1.11 데이터 과학과 데이터 과학자의 일은 화학과 시험관의 관계
__1.12 요약

2장 비즈니스 문제와 데이터 과학 해결책
__2.1 비즈니스 문제에서 시작해 데이터 마이닝 작업으로
__2.2 감독 방법과 자율 방법
__2.3 데이터 마이닝과 그 결과
__2.4 데이터 마이닝 프로세스
__2.5 데이터 과학팀을 관리한다는 것은?
__2.6 그 외 분석 기법 및 기술
__2.7 요약

3장. 예측 모델링 개요 : 연관성에서 감독 세분화까지
__3.1 모델, 유도, 예측
__3.2 감독 세분화
__3.3 세분화 과정의 시각화
__3.4 규칙 집합으로서의 트리
__3.5 확률 추정
__3.6 사례 : 트리 유도로 고객 이탈 문제 해결하기
__3.7 요약

4장. 데이터에 대한 모델 적합화
__4.1 수학 함수를 통한 분류
__4.2 수학 함수를 이용한 회귀 분석
__4.3 계층 확률 추정과 로지스틱 회귀 분석
__4.4 사례 : 로지스틱 회귀 분석과 트리 유도 비교
__4.5 비선형 함수, 지원 벡터 기계, 신경망
__4.6 요약

5장. 과적합화 문제 해결
__5.1 일반화
__5.2 과적합화
__5.3 과적합화 검사
__5.4 사례 : 선형 함수 과적합화
__5.5 * 사례 : 왜 과적합화가 문제인가?
__5.6 예비 데이터 평가에서 교차 검증까지
__5.7 다시 모델링한 고객 이탈 문제
__5.8 학습 곡선
__5.9 과적합화 회피와 복잡도 제어
__5.10 요약

6장. 유사도, 이웃, 군집
__6.1 유사도와 거리
__6.2 최근접 이웃 추론
__6.3 유사도 및 이웃에 관한 주요 세부 사항
__6.4 군집화
__6.5 비즈니스 문제 해결과 데이터 탐사 문제
__6.6 요약

7장. 결정 분석적 사고 1 : 좋은 모델은?
__7.1 분류자 평가
__7.2 모델 평가에 대한 일반적인 원리
__7.3 핵심 분석 프레임워크 : 기댓값
__7.4 평가, 기준선 성능, 데이터 투자의 영향
__7.5 요약

8장. 모델 성능 시각화
__8.1 분류 대신 서열화하기
__8.2 수익 곡선
__8.3 ROC 그래프와 곡선
__8.4 ROC 곡선 하위 영역(AUC)
__8.5 누적 응답 곡선과 향상도 곡선
__8.6 예제 : 고객 이탈 모델링에 대한 성능 분석
__8.7 요약

9장. 증거와 확률
__9.1 예제 : 온라인 고객 광고 타겟팅
__9.2 증거의 통계적 조합
__9.3 데이터 과학에 베이즈 규칙 응용
__9.4 증거 ‘향상도’ 모델
__9.5 예제 : 페이스북 ‘좋아요’의 증거 향상도
__9.6 요약

10장. 텍스트 표현 및 마이닝
__10.1 텍스트가 중요한 이유
__10.2 텍스트가 어려운 이유
__10.3 텍스트 표현법
__10.4 예제 : 재즈 음악가
__10.5 * IDF와 엔트로피의 관계
__10.6 단어 주머니보다 복잡한 표현들
__10.7 예제 : 주가 변동을 예측하기 위한 뉴스 기사 마이닝
__10.8 요약

11장. 결정 분석적 사고 2 : 분석 공학
__11.1 자선 단체 후원할 가능성이 높은 후원자 타겟팅
__11.2 훨씬 더 복잡한 고객 이탈 문제
__11.3 요약

12장. 기타 데이터 과학 작업과 기법
__12.1 동시 발생과 연관성의 발견
__12.2 프로파일링 : 전형적인 행동의 발견
__12.3 연결 예측과 친구 추천
__12.4 데이터 축소, 잠재 정보, 영화 추천
__12.5 편중, 편차, 조합 기법
__12.6 데이터 주도 인과 관계 설명과 바이럴 마케팅 예제
__12.7 요약

13장. 데이터 과학과 비즈니스 전략
__13.1 돌아온 데이터 분석적 사고
__13.2 데이터 과학으로 경쟁 우위 획득
__13.3 데이터 과학으로 경쟁 우위 유지
__13.4 데이터 과학자 및 팀의 영입과 육성
__13.5 데이터 과학 사례 연구 조사
__13.6 모든 창조적인 아이디어의 수용
__13.7 데이터 과학 프로젝트 제안서 평가
__13.8 기업의 데이터 과학 성숙도

14장. 결론
__14.1 데이터 과학의 기본 개념
__14.2 데이터가 할 수 없는 일 : 사람이 중심에
__14.3 개인 정보 보호, 윤리, 데이터 마이닝
__14.4 데이터 과학에 대한 남은 이야기
__14.5 마지막 사례 : 크라우드 소싱에서 클라우드 소싱으로
__14.6 책을 마치며

부록 A.1 제안서 검토 가이드
부록 A.2 또 다른 제안서 예제
부록 A.3 용어 정리
[교보문고에서 제공한 정보입니다.]