[교양]데이터 과학을 활용한 통계 - R Tidyverse 패키지로 손쉽게 익히는 통계학 입문 (Chester Ismay, Albert Y. Kim 저/양승훈 역 | 자유아카데미)

2023-09-15
조회수 42


통계학 비전공자임에도 불구하고 실무를 위해, 연구 목적으로, 또는 강의에 활용하기 위해 수많은 통계학과 데이터분석 교재를 찾아왔다. 통계학과 데이터분석의 역사를 고찰하면 분명 통계학의 역사가 길다. 그런데 학부 강의를 위해 교재를 찾을 때는 어째서인지 괜찮은 통계학 교재 찾기가 데이터분석 교재 찾기보다 힘들었다.


R 데이터분석 교재는 기초부터 심화까지 잘 구축되어 있는 편이다. 하지만 통계 비전공자인 인문사회계열 학생이 공부하기에 적절한 통계학 교재를 찾는 일은 쉽지 않았다. 시중에 나온 수많은 교재를 살펴보았지만, 항상 어딘가에는 아쉬움이 남았다. 갈증을 풀지 못하고 이런저런 교재를 오가며 갈팡질팡하다 자체 제작 교재와 보조교재를 병행해 사용하던 와중에 Chester Ismay와 Albert Y. Kim의 『Statistical Inference via Data Science: A Moderndive into R and the Tidyverse』(2019)를 접하게 되었다. 한 차례 통독하면서 모든 코드를 작성해 본 후 앞으로 통계학 기초 강의에 활용해도 되겠다는 생각을 굳히게 됐다.


이 책은 세 가지 강점을 가진다. 첫째는 통계교육자로서 저자들의 확고한 철학이다. 수학을 어려워하거나 거부감을 느끼는 학생들에게 처음부터 수식 위주의 계산을 강조하는 것은 기초통계학 수준에서는 큰 의미가 없어 보인다. 이 책은 가능하면 시각화를 통해, 아니면 산술계산 수준의 연산을 통해 주요 내용을 이해하게 한다. 부트스트래핑을 통한 시뮬레이션, 그리고 ‘작살’과 ‘그물’의 비유를 통해 점추정치와 신뢰구간을 쉽게 설명하는 부분은 이 책의 백미다. 둘째는 R tidyverse 패키지를 활용한 프로그래밍의 적극 수용이다. 2016년 9월 해들리 위컴에 의해 출시된 tidyverse 패키지는 R을 활용하는 사람들이 가장 많이 활용하는 ggplot2, dplyr, tidyr, readr 등을 포괄해서 담아냈다. 가장 많이 활용하는 패키지를 일일이 설치하여 탑재할 필요가 없어지고, 역시나 tidyverse에 담긴 magrittr 패키지를 통한 pipe operator(%〉%)를 활용하여 컴퓨터가 이해하기 쉬운 방식이 아닌 사람이 읽고 해석하기 쉬운 방식의 코드 전개를 통해 초심자들의 접근도를 현격히 높였다. 여전히 많은 R을 활용한 통계 교재들은 tidyverse 방식 이전 방식의 함수 활용으로 코드를 읽고 해석하기 어렵게 만들곤 했다. 이 책은 작성된 R 코드의 가독성 면에서도 장점을 가진다. 셋째로 한 학기 분량에 적합한 내용 편성이다. 이 책은 데이터분석을 위해 필요한 최소한의 문법 혹은 코드 작성법과 표집, 기초통계학의 주요 내용을 모두 담았다. 이 책 한 권으로 충분하지는 않겠지만, 꼭 필요한 내용을 특별한 문제 없이 커버할 수 있는 것은 큰 장점이다.


이 책이 나오기까지 많은 분께 도움을 받았다. 우선 초고를 처음부터 끝까지 살펴 주신 연세대학교 사회학과 최성수 교수님께 감사의 말씀을 드리고 싶다. 어떠한 용어를 활용할 것인지에 대한 조언은 물론, 사소한 오류까지 꼼꼼하게 지적해 주셨기에 책의 완성도를 높일 수 있었다. 둘째로 경남대학교 사회학과 데이터분석 동아리에서 2017년부터 5년간 말 그대로 ‘맨땅에 헤딩하며’(from scratch) 통계학과 R, 파이썬을 함께 공부해온 김지성·김재권·정병조·전용한·김동우·황준하·김민수·김찬영·김외정·여인영·유민화·김예령에게도 고마움을 전한다. 함께 연구실과 강의실에 모여 서로 에러 코드를 고쳐가며(handson) 데이터시각화, 텍스트마이닝, 통계학, 머신러닝을 함께 공부한 것이 큰 도움이 되었다.


마지막으로 책을 번역하는 과정에서 통계학회 용어집을 활용했으나, 일상적인 표현에 비추어 난해할 경우 쉬운 말로 풀어 쓰는 부분이 있었다. 그럼에도 부적절한 통계 개념이나 이해되지 않는 표현이 있다면, 오롯이 번역자의 몫이니 이 점은 양해를 바라며 추후 나올 수 있는 수정사항 등은 자유아카데미 홈페이지(www.freeaca.com) 자료실에 제공할 예정이다. 부디 이 책이 교강사와 학생, 통계와 데이터분석을 독학하는 예비 분석가들의 통계와 데이터분석 공부 여정에 도움이 되길 바란다.

https://www.yes24.com/Product/Goods/122342018

#ESC회원책출판




ESC 프로젝트50 (매주 넓어지는 과학 이야기)

숲사이는 ESC에서 운영하는 과학기술인 커뮤니티입니다.
용약관   |   개인정보처리방침   |   공지 
(04779) 서울특별시 성동구 뚝섬로1나길 5, G601 (성수동1가, 헤이그라운드 성수 시작점) 

Copyright ⓒ 사단법인 변화를 꿈꾸는 과학기술인 네트워크(ESC) All rights reserved.    


운영진 게시판 


숲사이는 ESC에서 운영합니다.

이용약관  |  개인정보처리방침  |  공지

(04768) 서울특별시 성동구 왕십리로 115 G410 

Copyright ⓒ 사단법인 변화를 꿈꾸는 과학기술인 네트워크(ESC) All rights reserved.
운영진 게시판