패스트캠퍼스 학습일지

패스트캠퍼스 BDA과정의 꽃이라고도 할 수 있는 파이널 프로젝트가 종료되었다. 지금까지 배웠던 Python, SQL, Tableau 등의 툴과, 여러 방법론 등을 총동원하여 실제 기업의 데이터를 받아 기업연계 프로젝트를 한 달여간 진행했다. 지금까지 했던 미니 프로젝트들보다 기간도 길었고, 실제 현업의 프로세스와 가장 유사하게 진행이 되었기 때문에 고생도 많았고, 과정을 겪으면서 성장하고 느낀 점도 많았던 것 같다. 해당 글은 스스로 파이널 프로젝트를 마치면서 느꼈던 점들과 진행 프로세스, 보완할 점들에 대해 정리해보려고 작성하는 글이다. 기억은 쉽게 휘발되기 때문에 최대한 기억이 생생하게 남아있을 때 작성해본다! 0. 데이터 & 제공 기업 이번 BDA11기 데이터를 제공해준 기업은 리코맨즈라는 기업으로..
지난주부터 새로운 시각화 툴인 Tableaue를 배우고 있다! 파이썬, SQL보다도 진입장벽이 낮지만, 그만큼 사용자의 경험과 센스의 차이에서 결과물의 차이가 나타나는 것 같다. 개인적으로는 파이썬과는 다르게 완전히 처음 접해보는 툴이기 때문에, 초반에 적응하는 데에 시간이 좀 필요했다 그래도 간만에 새로운 툴을 배우니까 세상이 넓어지는 듯한 느낌이 들어서 공부하는 게 너무 재밌다! 하지만 어디까지나 태블로도 시각화 툴일 뿐, 그 본질은 데이터를 구성하고 왜곡하지 않으면서 논리 flow를 만들어 내는 것이라는걸 잊지 않도록 노력 중이다😎 👨🏻‍👩🏻‍👧🏻‍👦🏻 태블로의 근간 개념, 이 세가지만 알면 된다! 1. 차원과 측정값 측정값(measure) : 우리의 관심을 받는 대상 그 자체 차원(dimensio..
지난 2주 간 SQL 프로젝트를 하느라, 학습한 내용들을 노션에만 담아놓고, 정리하지 못했다. 지금 이 글을 작성하는 현재는 SQL 프로젝트는 마무리하고 새로운 시각화 툴인 Tableau를 배우고 있다! 사실 시각화 툴은 처음이라 좀 걱정했는데, 생각보다 너무 재밌다...! 이번주까지는 SQL을 마저 정리하고, 다음주부터 Tableau 관련 정리와 공부내용들을 올려볼 예정이다. 💵 1. 서비스 이해 기본 💡 Q1. 2020년 7월의 총 Revenue를 구하기 USE fastcampus; SHOW TABLES; SELECT * FROM tbl_customer LIMIT 1; SELECT * FROM tbl_purchase LIMIT 1; SELECT * FROM tbl_visit LIMIT 1; # Q1 ..
전반적인 내용 드디어 2번째 프로젝트가 끝이 났다. 시작할 때는 사실 광범위하게 EDA를 하는 거라 크게 어려움을 느끼지 못했었는데, 가면 갈수록 한가지 주제에 맞는 심도깊은 분석을 진행해야 해서 조금 힘들었다. 우리 조는 이번에 처음으로 과정에서 분석시도를 하는 데이터셋을 골라 분석했다. Cosmetic Site User behavior에 관한 데이터를 분석하는 과제였고 주제는 EDA나 데이터에 대한 도메인 공부 후 스스로 정해서 그에 대한 깊은 분석을 해보는 과정이었다. 우리 팀 주제는 최종적으로 매출 증진을 위한 최적화된 고객 세분화와 마케팅전략이었고. 고객의 최근 방문 일자와 구매 횟수를 가장 큰 중심축으로 두고 고객을 특성에 맞게 segmentation해나갔다. 배운점 및 느낀점 이번 프로젝트 ..
👨🏻‍👩🏻‍👧🏻‍👦🏻 여러 테이블 한번에 다루기 집합연산 참고로 JOIN은 가로로, 집합은 세로로 합치는 거라고 생각하면 편함! UNION, UNION ALL UNION 은 동일한 값은 중복제외하고 보여주며, UNION ALL은 동일한 값도 포함 [쿼리 A] UNION [쿼리 B] [쿼리 A]와 [쿼리 B] 의 컬럼의 개수가 같아야 함 ORDER BY는 쿼리 가장 마지막에 작성 가능하며, [쿼리 A]에서 가져온 컬럼으로만 가능 SELECT [컬럼 이름] FROM [테이블A 이름] : UNION SELECT [컬럼 이름] FROM [테이블B 이름] : ; 교집합, 차집합 다른 DBMS에는 INTERSECT, MINUS 키워드가 있지만, MySQL에는 없어서 JOIN으로 구현 # 교집합 SELECT [컬럼 ..
지난 주까지 python 프로젝트를 마치고, 이번주부터 SQL학습에 들어갔다! python에 비해서 비교적 쉬운 문법구조를 가지지만, 개인적으로 python보다 낯설어서 복습을 자주 해줘야 할 것 같다. 🤠데이터베이스 데이터베이스의 특징 특징 1. 자료를 구조화하여 저장하기 때문에, 효율적인 관리가 가능하다. 특징 2. 여러 업무에 여러 사용자가 동시에 사용 가능하다. 특징 3. 사용자가 데이터베이스의 기능을 사용 하기 위해서는 응용 프로그램을 활용해야 한다 DBMS : 데이터베이스의 기능을 제공하는 프로그램(MySQL도 DBMS의 한 종류!) 단축키 주석처리 : #, —, /**/ 한줄실행 단축키 : Ctrl + Enter 전체실행 단축키 : ctrl + shift + enter 자동정렬 : ctrl ..
이번주는 줌강의로는 파이썬을 공부했고, 온라인 강의로는 데이터 사이언스에 대해 깊게 알아보았다. 파이썬 코드는 차차 추가 정리하도록 하고, 데이터 사이언스에 대해 궁금했던걸 정리해본다 데이터 사이언스 1) 기초용어 선형대수학 벡터 : 숫자의 나열. 숫자들의 묶음. x = (1, 2, 3) x = (1, 2, 3) , y = (4, 3, 1) 벡터의 연산 : x + y = (5, 5, 4) // 3 * x = (3, 6, 9) 벡터의 특징 : 원소값, 방향(상대적인 위치) 벡터의 차원 : 원소의 개수 벡터의 크기(norm) : 벡터의 모든 원소를 제곱하고 다 더한 뒤, 루트를 씌워준 값. → 원점과의 거리.(L2 norm) 벡터 공간(Vector Space) : 벡터가 정의되는 집합. 연산, 차원, 기저(..
지난 주 금요일부터 앞으로 한 3주간은 파이썬을 학습하게 되었다. 작년에 혼자 독학한 정도라, numpy, pandas 같은 DA 라이브러리로 넘어가면 조금 어려울 것 같아서 개인적으로 진도를 미리미리 나가고 있다. 분명 빅분기 딸 때 다 공부했던 것 같은데, 기억의 휘발성이 무섭다,, 이번 학습일지는 날짜별로 정리하기는 애매해서, 소주제별로 정리한다. 0. Python ✨특징 변수에 data를 동적할당한다 들여쓰기(indentation)을 이용해 code block을 구분 문자열을 굉장히 편하게 사용가능.(문자열(str)이라는 data type이 따로 존재한다) line by line으로 실행된다(interpreter언어의 특징) PyPI라는 저장소 덕에 오픈소스 라이브러리를 통한 확장성을 갖추었다 1..
똔똔스
'패스트캠퍼스 학습일지' 카테고리의 글 목록