Command Line으로 하는 사용자 패턴 분석

안녕하세요. Data Engineering 팀에서 데이터 분석 업무를 하고 있는 권정민입니다.

8월 27일에 열린 사내 기술 세미나 @tech 에서 [Command Line으로 하는 사용자 패턴 분석] 발표 내용을 공유 드립니다.

일반적으로 데이터 분석에서 사용되는 데이터는  로그 파일, 혹은 정제된 csv 파일 형태인데, 이를 csvkit 이라는 command 기반 툴을 사용해서 간단한 명령어로 데이터 수집, 정제, 기본적인 탐색적 분석까지 할 수 있고, python 이나 R script, 혹은 BigML이나 pandashell 같은 다른 command 기반 툴과 연계하면 굳이 다른 개발 환경으로 이동하지 않고도 쉘 상에서 빠르고 간단하게 데이터 분석 결과를 확인할 수 있습니다.  특히 큰 분석 프로젝트가 아닌 간단하게 분석해서 그 결과를 개발 및 이후 의사 결정에 바로 반영하는 식의 Ad-hoc 데이터 분석에서 이런 도구를 유용하게 사용할 수 있습니다.

발표는 쉘 상에서 바로 프리젠테이션을 할 수 있는 mdp 를 사용하였고, 해당 발표자료의 원본은 https://github.com/cojette/UserPatternwithCommandLine 에서 확인하실 수 있습니다.

편의를 위해 슬라이드 쉐어에 발표자료를 공유하였으니 이를 참고하셔도 됩니다.

동영상 강의도 같이 올립니다~.

감사합니다.

권정민 Data Engineering팀

Data Engineering 팀, Data Analyst.
세상은 데이터로 이루어져 있다고 생각하며 이를 잘 활용해 좀 더 많은 사람을 널리 즐겁게 하자는 목표가 있다. 이런 목표를 기반으로 다양한 데이터 분석 및 활용 방안을 고민하고 연구하는 것을 업으로 하고 있다. 데이터가 화두로 떠오르기 조금 전에 세상이 데이터로 이뤄졌음을 깨달았다는 것에 조그마한 자부심을 느끼며, 데이터에서 가치를 찾아내는 일을 좀 더 즐겁고 지속적으로 할 수 있는 방안을 찾고자 매일 고민하며 연구한다.

공유하기