서브메뉴

본문

인공지능을 이용한 빅데이터 처리 입문 (빅데이터 분석을 위한 AI 학습의 시작!)
인공지능을 이용한 빅데이터 처리 입문 (빅데이터 분석을 위한 AI 학습의 시작!)
저자 : 오다카 토모히로
출판사 : 길벗
출판년 : 2014
ISBN : 9788966187201

책소개

인공지능을 이용한 빅데이터 처리 기술을 다룬 입문서이다. 다양한 예제 프로그램을 이용해 주어진 빅데이터에서 필요한 정보를 효율적으로 찾아내는 탐색과 지식 표현, 언어 처리 알고리즘 등의 내용을 구체적으로 설명한다.
[교보문고에서 제공한 정보입니다.]

출판사 서평

빅데이터 분석에 위력을 더하는 인공지능 학습의 시작!
이 책은 인공지능을 이용한 빅데이터 처리 기술을 다룬다. 또한 주어진 빅데이터에서 필요한 정보를 효율적으로 찾아내는 탐색, 빅데이터를 지식으로써 이용 가능하게 정리하는 지식 표현, 빅데이터 처리에 효과적인 진화적 기법과 집단 지능, 인터넷 상에 대량으로 축적된 자연 언어를 다루는 언어 처리 알고리즘을 다양한 예제 프로그램을 이용해 구체적으로 설명한다. 이 책의 예제 프로그램은 일반 컴퓨터로도 충분히 실행할 수 있기 때문에 설명만으로는 도달할 수 없는 더욱 깊은 이해를 얻을 수 있다.

인터넷에는 다양한 성질과 형식의 데이터가 대량으로 유통되고 축적되고 있다. 이런 데이터는 오늘날과 같은 인터넷이 형성되기 전에는 상상조차 할 수 없었던 규모가 되었고 그 양도 나날이 증가하고 있다. 그리고 데이터가 대량으로 축적되자 축적된 데이터를 적극적으로 활용하는 시스템이 구축되기 시작했다. 예를 들면, 고객 한 사람 한 사람의 기호에 맞는 추천 상품을 제안하는 쇼핑몰 시스템이나 SNS의 방대한 텍스트 정보를 기반으로 주식 변동을 예측하는 주식 매매 시스템 등이 있다. 앞으로도 대규모 데이터를 기반으로 하는 시스템은 점점 발전해갈 것이다.
이 책은 이러한 빅데이터 처리의 기반이 되는 인공지능 기술을 다양한 사례와 예제로 배우고 기초를 확립할 수 있도록 구성되어 있다. 인공지능을 이용한 빅데이터 분석에 관심과 열정이 있다면 약간의 C 프로그래밍 경험만으로도 분명 재미있게 학습할 수 있을 것이다.

이 책에서 다루는 내용
1장 인공지능에서의 지식 표현과 지식 처리 알고리즘
- 대규모 데이터를 활용한 지적 응용 시스템
- 인공지능 기술과 대규모 데이터 처리
- 이 책의 프로그래밍 환경
2장 탐색
- 맹목적 탐색 방법
- 경험적 탐색
- 상대가 있는 탐색
3장 지식 표현
- 지식 네트워크
- 논리적 표현
4장 진화적 기법 · 집단 지능
- 유전 알고리즘 · 유전 프로그래밍
- 집단 지능 알고리즘
5장 언어 처리 알고리즘
- 텍스트 처리 알고리즘
- 언어 처리와 통계적 기법의 융합

이 책의 독자
- 기업 CRM, 데이터 분석 서비스 업체, 포탈 등 빅데이터 분석 분야에서 일하는 개발자
- 인공지능과 인공생명 분야의 연구원

[추천평]
네트워크 인프라가 발전하고 IT 기술이 급속히 진화하면서 모든 기기와 사용자가 연결된, 인터넷 공간을 넘어선 이른바 사물인터넷(Internet of Things) 시대가 도래하고 있습니다. 고속도로가 개통되면 더 많은 물자가 교류되듯이 사물인터넷 시대를 대변하는 물자는 서비스/사용자/기기/공공 등의 ‘데이터’이며 기하급수적으로 증가 추세에 있습니다.
과거에 있던 동일한 제품일지라도 데이터를 활용하면 그 가치가 배가됩니다. 최근에 구글은 온도조절장치(Thermostat) 개발사인 네스트(Nest Lab)를 3조원에 인수했습니다. 네스트의 실제 기업 가치의 수 십배에 인수한 배후는 온도조절장치 자체가 아닙니다. 사용자의 온도 조절 패턴을 학습한 후 자동으로 운전하면서 기존보다 10% 이상 에너지를 절감해주는 인공지능 빅데이터 처리 기술의 가치 때문입니다. 구글은 계속해서 딥마인드(DeepMind) 테크놀로지 등의 대용량 데이터 분석 알고리즘 전문 기업을 인수하는 행보를 이어가며 사물인터넷 시대를 철저하게 준비하고 있습니다.
이 책은 이 분야에 입문하는 열정적인 미래의 전문가들에게 적합한 도서로 약간의 C 프로그래밍 경험과 전산학 지식이 있으면 소화할 수 있습니다. 특히, 실 경험 속에서 다뤄진 다양한 예제는 이 책의 백미입니다. 제 2의 구글, 네스트를 꿈꾸는 모두에게 이 책을 추천합니다.

- LG 전자 컨버전스 서비스팀 팀장, 《Hadoop&NoSQL》 저자 서상원

이 책은 인공지능 분야의 다양한 구성 요소를 쉽고 체계적으로 설명한 입문서입니다. 탐색(깊이 우선, 너비 우선, A* 등), 지식 표현(의미 네트워크, 프레임, 스크립트), 진화적 알고리즘과 집단 지능(유전 알고리즘, 집단 지능 알고리즘), 언어 처리 알고리즘(n-gram, tf-idf)을 다루고 있어 내용의 범위 면에서도 알찹니다. 특히 요즘처럼 소셜 네트워크 분석이나 지식 그래프(Knowledge Graph)가 주목받고 있는 상황에서 지식 표현이나 언어 처리 알고리즘은 관심을 둘 만한 주제입니다.
이 책은 해당 분야에 대한 지식이 전혀 없는 상태에서도 이해할 수 있도록 처음부터 차근차근 설명하며, 이해하기 쉬운 예제와 그림을 사용해 잘 설명하고 있습니다. 특히 알고리즘 설명 뒤에는 C를 사용한 구현 코드가 제시되어 있어 글만으로는 이해하기 어려운 세부적인 내용을 정확히 확인해볼 수 있다는 장점이 있습니다, 인공지능 분야에 관심이 많지만 공부할 기회가 없었던 분들께 추천드릴 만한 책으로, C 언어에 대한 이해만 있다면 분명 재미있게 읽어볼 수 있을 것이라고 생각합니다.

- 구글 코리아 소프트웨어 엔지니어 서민구
[교보문고에서 제공한 정보입니다.]

목차정보

1장 ▶ 인공지능에서 지식 표현과 지식 처리 알고리즘
1.1 대규모 데이터를 활용한 지적 응용 시스템
1.1.1 대규모 데이터와 인터넷
1.1.2 대규모 데이터 활용
1.2 인공지능 기술과 대규모 데이터 처리
1.3 이 책의 프로그래밍 환경

2장 ▶ 탐색
2.1 맹목적 탐색
2.1.1 탐색이란
2.1.2 너비 우선 탐색
2.1.3 너비 우선 탐색 알고리즘
2.1.4 너비 우선 탐색 프로그램
2.1.5 깊이 우선 탐색
2.1.6 깊이 우선 탐색 알고리즘
2.1.7 깊이 우선 탐색 프로그램
2.2 경험적 탐색
2.2.1 최상 우선 탐색과 등산법
2.2.2 최적 경로 탐색
2.2.3 A 알고리즘과 A* 알고리즘
2.3 상대가 있는 탐색

3장 ▶ 지식 표현
3.1 지식 네트워크
3.1.1 의미 네트워크
3.1.2 의미 네트워크의 구현
3.1.3 프레임
3.1.4 프레임의 구현
3.1.5 스크립트
3.2 논리적 표현
3.2.1 프로덕션 룰
3.2.2 프로덕션 시스템 구현

4장 ▶ 진화적 기법·집단 지능
4.1 유전 알고리즘·유전 프로그래밍
4.1.1 생물의 진화 모델
4.1.2 진화 연산 기법의 유전 알고리즘
4.1.3 유전 알고리즘의 실제
4.1.4 유전 알고리즘의 구현
4.1.5 유전 알고리즘 프로그래밍
4.2 집단 지능 알고리즘
4.2.1 집단 지능 알고리즘이란
4.2.2 입자 군집 최적화 구현

5장 ▶ 언어 처리 알고리즘
5.1 텍스트 처리 알고리즘
5.1.1 자연어 처리 기술
5.1.2 n-gram을 이용한 특징 추출
5.1.3 단어 수준에서 특징 추출
5.2 언어 처리와 통계적 기법의 융합
5.2.1 tf-idf란
5.2.2 tf-idf 처리 프로그램 구현
5.2.3 한글 데이터를 이용한 tf-idf

부록
01 예제 프로그램 실행 환경
02 다운로드 파일 구하기
03 일본어 n-gram 작성 프로그램 jp.pl
[교보문고에서 제공한 정보입니다.]