본문 바로가기

👍 회고 기록/😎 업무 회고

[220831] 데이터 분석이란 얼마나 잘 정의 하느냐에 달린 것은 아닐까??

📌수업 내용

  • 코딩 테스트 문제를 풀었다. 
  • 캐글 e-commerce데이터를 MY SQL을 활용하여 재구매율, 코호트 분석, 고객 세그먼트 분석, LTV, 리텐션 분석을 실습했다. 
  • SQL 조별 과제를 진행했다. 우리 조는 따릉이 데이터를 분석하고 있는데 데이터 셋업을 완료하고 기준을 정하고 있다. 

💡보고 느낀 것

  • 코딩테스트 문제를 혼자 푼 뒤에 맞았다고 끝내는 것이 아니라 꼭 다른 사람의 풀이를 찾아봐야겠다. 내가 푼 문제더라도 강사님이 풀어주신 풀이가 더 쉽고 효율적으로 접근한 것이 있었다. 코딩 테스트는 정답 여부를 보는 곳도 있지만, 어떻게 풀어나가는지 논리성을 보는 곳도 많다. 논리성을 연습하기 위해서는 풀이할 때 어떻게 풀어나가야 할지 논리를 전개하는 훈련을 해야 하고, 타인의 답변과 비교하며 더 좋은 논리는 흡수해야 한다. 
  • e-commerce 캐글 데이터를 다양한 기법으로 분석 실습했다. 분석을 하기전 정의를 하고 시작했다.  1년 주기로 구매가 이뤄졌다면 재구매했다고 판단하자라고 재구매라고 부를 수 있는 유효기간을 설정했다. 조별 프로젝트로 출퇴근 시간, 업무 지역에 따릉이가 부족할 것이다.라는 가설을 수립하고 데이터 셋업을 진행 한 뒤 분석을 앞두고 있는데, 여기서도 부족하다를 어떻게 정의할 것인가?라는 열띤 토론을 하고 있다. 부족을 어떻게 정의할 것이며, 어떤 데이터로 지표화 할 것인가? 의견을 나누면서 데이터 분석이란 얼마나 잘 정의하느냐에 달린 것은 아닐까?라는 생각을 했다. 
  • 특히나 정의라는 것은 도메인 별로 서비스 별로 크게 다를 것이다. 얼마나 잘 정의할 수있느냐?에서 도메인에 대한 전문성을 발휘할 수 있다. 정의를 잘하는 분석가가 되고 싶다. 한 서비스에 대해서 북극성 지표를 정의해보는 연습을 해봐야지! 

정의하다를 생각하다보니 스펀지가 떠오른다. 네모를 잘 채워야지! (요즘 친구들은 스펀지 모르겠지....???)

😄감사한 일

  • 조별 모임을 하면서 정말 많이 배운다. 

적용할 것

 

10 Clustering Algorithms With Python

Clustering or cluster analysis is an unsupervised learning problem. It is often used as a data analysis technique for discovering interesting patterns in data, such as groups of customers based on their behavior. There are many clustering algorithms to cho

machinelearningmastery.com

  • 3.  한 서비스에 대해서 북극성 지표를 정의해보는 연습하기