분류 전체보기

지난 2주 간 SQL 프로젝트를 하느라, 학습한 내용들을 노션에만 담아놓고, 정리하지 못했다. 지금 이 글을 작성하는 현재는 SQL 프로젝트는 마무리하고 새로운 시각화 툴인 Tableau를 배우고 있다! 사실 시각화 툴은 처음이라 좀 걱정했는데, 생각보다 너무 재밌다...! 이번주까지는 SQL을 마저 정리하고, 다음주부터 Tableau 관련 정리와 공부내용들을 올려볼 예정이다. 💵 1. 서비스 이해 기본 💡 Q1. 2020년 7월의 총 Revenue를 구하기 USE fastcampus; SHOW TABLES; SELECT * FROM tbl_customer LIMIT 1; SELECT * FROM tbl_purchase LIMIT 1; SELECT * FROM tbl_visit LIMIT 1; # Q1 ..
전반적인 내용 드디어 2번째 프로젝트가 끝이 났다. 시작할 때는 사실 광범위하게 EDA를 하는 거라 크게 어려움을 느끼지 못했었는데, 가면 갈수록 한가지 주제에 맞는 심도깊은 분석을 진행해야 해서 조금 힘들었다. 우리 조는 이번에 처음으로 과정에서 분석시도를 하는 데이터셋을 골라 분석했다. Cosmetic Site User behavior에 관한 데이터를 분석하는 과제였고 주제는 EDA나 데이터에 대한 도메인 공부 후 스스로 정해서 그에 대한 깊은 분석을 해보는 과정이었다. 우리 팀 주제는 최종적으로 매출 증진을 위한 최적화된 고객 세분화와 마케팅전략이었고. 고객의 최근 방문 일자와 구매 횟수를 가장 큰 중심축으로 두고 고객을 특성에 맞게 segmentation해나갔다. 배운점 및 느낀점 이번 프로젝트 ..
👨🏻‍👩🏻‍👧🏻‍👦🏻 여러 테이블 한번에 다루기 집합연산 참고로 JOIN은 가로로, 집합은 세로로 합치는 거라고 생각하면 편함! UNION, UNION ALL UNION 은 동일한 값은 중복제외하고 보여주며, UNION ALL은 동일한 값도 포함 [쿼리 A] UNION [쿼리 B] [쿼리 A]와 [쿼리 B] 의 컬럼의 개수가 같아야 함 ORDER BY는 쿼리 가장 마지막에 작성 가능하며, [쿼리 A]에서 가져온 컬럼으로만 가능 SELECT [컬럼 이름] FROM [테이블A 이름] : UNION SELECT [컬럼 이름] FROM [테이블B 이름] : ; 교집합, 차집합 다른 DBMS에는 INTERSECT, MINUS 키워드가 있지만, MySQL에는 없어서 JOIN으로 구현 # 교집합 SELECT [컬럼 ..
지난 주까지 python 프로젝트를 마치고, 이번주부터 SQL학습에 들어갔다! python에 비해서 비교적 쉬운 문법구조를 가지지만, 개인적으로 python보다 낯설어서 복습을 자주 해줘야 할 것 같다. 🤠데이터베이스 데이터베이스의 특징 특징 1. 자료를 구조화하여 저장하기 때문에, 효율적인 관리가 가능하다. 특징 2. 여러 업무에 여러 사용자가 동시에 사용 가능하다. 특징 3. 사용자가 데이터베이스의 기능을 사용 하기 위해서는 응용 프로그램을 활용해야 한다 DBMS : 데이터베이스의 기능을 제공하는 프로그램(MySQL도 DBMS의 한 종류!) 단축키 주석처리 : #, —, /**/ 한줄실행 단축키 : Ctrl + Enter 전체실행 단축키 : ctrl + shift + enter 자동정렬 : ctrl ..
이번주는 줌강의로는 파이썬을 공부했고, 온라인 강의로는 데이터 사이언스에 대해 깊게 알아보았다. 파이썬 코드는 차차 추가 정리하도록 하고, 데이터 사이언스에 대해 궁금했던걸 정리해본다 데이터 사이언스 1) 기초용어 선형대수학 벡터 : 숫자의 나열. 숫자들의 묶음. x = (1, 2, 3) x = (1, 2, 3) , y = (4, 3, 1) 벡터의 연산 : x + y = (5, 5, 4) // 3 * x = (3, 6, 9) 벡터의 특징 : 원소값, 방향(상대적인 위치) 벡터의 차원 : 원소의 개수 벡터의 크기(norm) : 벡터의 모든 원소를 제곱하고 다 더한 뒤, 루트를 씌워준 값. → 원점과의 거리.(L2 norm) 벡터 공간(Vector Space) : 벡터가 정의되는 집합. 연산, 차원, 기저(..
지난 주 금요일부터 앞으로 한 3주간은 파이썬을 학습하게 되었다. 작년에 혼자 독학한 정도라, numpy, pandas 같은 DA 라이브러리로 넘어가면 조금 어려울 것 같아서 개인적으로 진도를 미리미리 나가고 있다. 분명 빅분기 딸 때 다 공부했던 것 같은데, 기억의 휘발성이 무섭다,, 이번 학습일지는 날짜별로 정리하기는 애매해서, 소주제별로 정리한다. 0. Python ✨특징 변수에 data를 동적할당한다 들여쓰기(indentation)을 이용해 code block을 구분 문자열을 굉장히 편하게 사용가능.(문자열(str)이라는 data type이 따로 존재한다) line by line으로 실행된다(interpreter언어의 특징) PyPI라는 저장소 덕에 오픈소스 라이브러리를 통한 확장성을 갖추었다 1..
[DAY 6, 8] 실무 엑셀 데이터 분석& 기초 수학/통계 시작하기 - 이동훈 강사님 지난 주 EDA에 이어서.. 2. EDA EDA는 데이터 분석 과정 전체에서 필요할 때마다 수시로 사용되는 과정 데이터 분석 도구 꼭 이름을 같이 잡고 첫째 행 이름표 사용 체크 평균보다 중앙값이 이상치에 강건하다(ROBUST) 데이터에 대해 합계, 평균, 최대, 최소 정도는 그래도 알자! 피벗 테이블 : RAW DATA가 어느 정도 정리된 형태라면, 데이터 내 어딘가에만 클릭을 해 둔 채로 > 삽입 > 제일 첫 번째에 있는 피벗테이블 피벗테이블에서 제일 중요한 것은 행, 열, 값을 결정하는 것이 거의 90% 문자데이터(ex. category)의 경우는 클릭 시 자동으로 행으로, 숫자 데이터(ex. sales)는 자동..
[DAY 2] 빅데이터 이해하기 & 데이터 리터러시 함양하기 - 오수은 강사님 1. Why Data Driven is Important 기존의 업무 프로세스와 Digital Transformation 등의 모든 것을 융합하기 위해서 Big Data가 강력한 enabler로 작용 데이터 드리븐(Data Driven) : 데이터를 기반으로 의사결정 하는 것 데이터로 유의미한 인사이트를 도출하고 이를 필요한 곳에 반영하는 일련의 과정은 일회적이지 않고, 계속 맞물리면서 수정, 보완된다. 데이터 드리븐은 굳이 어려운 머신러닝 전문용어나 기술로서만 얻어지는 건 아니다! tip1 : 평소 관심분야의 관련 뉴스기사를 분석해볼 것(모델관점/비즈니스 관점으로 두 번 보기) 위의 예시에서, 스캔앤다이브 섬유 원사의 굵기,..
똔똔스
'분류 전체보기' 카테고리의 글 목록 (4 Page)