패스트캠퍼스부트캠프

지난주부터 새로운 시각화 툴인 Tableaue를 배우고 있다! 파이썬, SQL보다도 진입장벽이 낮지만, 그만큼 사용자의 경험과 센스의 차이에서 결과물의 차이가 나타나는 것 같다. 개인적으로는 파이썬과는 다르게 완전히 처음 접해보는 툴이기 때문에, 초반에 적응하는 데에 시간이 좀 필요했다 그래도 간만에 새로운 툴을 배우니까 세상이 넓어지는 듯한 느낌이 들어서 공부하는 게 너무 재밌다! 하지만 어디까지나 태블로도 시각화 툴일 뿐, 그 본질은 데이터를 구성하고 왜곡하지 않으면서 논리 flow를 만들어 내는 것이라는걸 잊지 않도록 노력 중이다😎 👨🏻‍👩🏻‍👧🏻‍👦🏻 태블로의 근간 개념, 이 세가지만 알면 된다! 1. 차원과 측정값 측정값(measure) : 우리의 관심을 받는 대상 그 자체 차원(dimensio..
지난 2주 간 SQL 프로젝트를 하느라, 학습한 내용들을 노션에만 담아놓고, 정리하지 못했다. 지금 이 글을 작성하는 현재는 SQL 프로젝트는 마무리하고 새로운 시각화 툴인 Tableau를 배우고 있다! 사실 시각화 툴은 처음이라 좀 걱정했는데, 생각보다 너무 재밌다...! 이번주까지는 SQL을 마저 정리하고, 다음주부터 Tableau 관련 정리와 공부내용들을 올려볼 예정이다. 💵 1. 서비스 이해 기본 💡 Q1. 2020년 7월의 총 Revenue를 구하기 USE fastcampus; SHOW TABLES; SELECT * FROM tbl_customer LIMIT 1; SELECT * FROM tbl_purchase LIMIT 1; SELECT * FROM tbl_visit LIMIT 1; # Q1 ..
👨🏻‍👩🏻‍👧🏻‍👦🏻 여러 테이블 한번에 다루기 집합연산 참고로 JOIN은 가로로, 집합은 세로로 합치는 거라고 생각하면 편함! UNION, UNION ALL UNION 은 동일한 값은 중복제외하고 보여주며, UNION ALL은 동일한 값도 포함 [쿼리 A] UNION [쿼리 B] [쿼리 A]와 [쿼리 B] 의 컬럼의 개수가 같아야 함 ORDER BY는 쿼리 가장 마지막에 작성 가능하며, [쿼리 A]에서 가져온 컬럼으로만 가능 SELECT [컬럼 이름] FROM [테이블A 이름] : UNION SELECT [컬럼 이름] FROM [테이블B 이름] : ; 교집합, 차집합 다른 DBMS에는 INTERSECT, MINUS 키워드가 있지만, MySQL에는 없어서 JOIN으로 구현 # 교집합 SELECT [컬럼 ..
지난 주까지 python 프로젝트를 마치고, 이번주부터 SQL학습에 들어갔다! python에 비해서 비교적 쉬운 문법구조를 가지지만, 개인적으로 python보다 낯설어서 복습을 자주 해줘야 할 것 같다. 🤠데이터베이스 데이터베이스의 특징 특징 1. 자료를 구조화하여 저장하기 때문에, 효율적인 관리가 가능하다. 특징 2. 여러 업무에 여러 사용자가 동시에 사용 가능하다. 특징 3. 사용자가 데이터베이스의 기능을 사용 하기 위해서는 응용 프로그램을 활용해야 한다 DBMS : 데이터베이스의 기능을 제공하는 프로그램(MySQL도 DBMS의 한 종류!) 단축키 주석처리 : #, —, /**/ 한줄실행 단축키 : Ctrl + Enter 전체실행 단축키 : ctrl + shift + enter 자동정렬 : ctrl ..
이번주는 줌강의로는 파이썬을 공부했고, 온라인 강의로는 데이터 사이언스에 대해 깊게 알아보았다. 파이썬 코드는 차차 추가 정리하도록 하고, 데이터 사이언스에 대해 궁금했던걸 정리해본다 데이터 사이언스 1) 기초용어 선형대수학 벡터 : 숫자의 나열. 숫자들의 묶음. x = (1, 2, 3) x = (1, 2, 3) , y = (4, 3, 1) 벡터의 연산 : x + y = (5, 5, 4) // 3 * x = (3, 6, 9) 벡터의 특징 : 원소값, 방향(상대적인 위치) 벡터의 차원 : 원소의 개수 벡터의 크기(norm) : 벡터의 모든 원소를 제곱하고 다 더한 뒤, 루트를 씌워준 값. → 원점과의 거리.(L2 norm) 벡터 공간(Vector Space) : 벡터가 정의되는 집합. 연산, 차원, 기저(..
지난 주 금요일부터 앞으로 한 3주간은 파이썬을 학습하게 되었다. 작년에 혼자 독학한 정도라, numpy, pandas 같은 DA 라이브러리로 넘어가면 조금 어려울 것 같아서 개인적으로 진도를 미리미리 나가고 있다. 분명 빅분기 딸 때 다 공부했던 것 같은데, 기억의 휘발성이 무섭다,, 이번 학습일지는 날짜별로 정리하기는 애매해서, 소주제별로 정리한다. 0. Python ✨특징 변수에 data를 동적할당한다 들여쓰기(indentation)을 이용해 code block을 구분 문자열을 굉장히 편하게 사용가능.(문자열(str)이라는 data type이 따로 존재한다) line by line으로 실행된다(interpreter언어의 특징) PyPI라는 저장소 덕에 오픈소스 라이브러리를 통한 확장성을 갖추었다 1..
[DAY 6, 8] 실무 엑셀 데이터 분석& 기초 수학/통계 시작하기 - 이동훈 강사님 지난 주 EDA에 이어서.. 2. EDA EDA는 데이터 분석 과정 전체에서 필요할 때마다 수시로 사용되는 과정 데이터 분석 도구 꼭 이름을 같이 잡고 첫째 행 이름표 사용 체크 평균보다 중앙값이 이상치에 강건하다(ROBUST) 데이터에 대해 합계, 평균, 최대, 최소 정도는 그래도 알자! 피벗 테이블 : RAW DATA가 어느 정도 정리된 형태라면, 데이터 내 어딘가에만 클릭을 해 둔 채로 > 삽입 > 제일 첫 번째에 있는 피벗테이블 피벗테이블에서 제일 중요한 것은 행, 열, 값을 결정하는 것이 거의 90% 문자데이터(ex. category)의 경우는 클릭 시 자동으로 행으로, 숫자 데이터(ex. sales)는 자동..
[DAY 2] 빅데이터 이해하기 & 데이터 리터러시 함양하기 - 오수은 강사님 1. Why Data Driven is Important 기존의 업무 프로세스와 Digital Transformation 등의 모든 것을 융합하기 위해서 Big Data가 강력한 enabler로 작용 데이터 드리븐(Data Driven) : 데이터를 기반으로 의사결정 하는 것 데이터로 유의미한 인사이트를 도출하고 이를 필요한 곳에 반영하는 일련의 과정은 일회적이지 않고, 계속 맞물리면서 수정, 보완된다. 데이터 드리븐은 굳이 어려운 머신러닝 전문용어나 기술로서만 얻어지는 건 아니다! tip1 : 평소 관심분야의 관련 뉴스기사를 분석해볼 것(모델관점/비즈니스 관점으로 두 번 보기) 위의 예시에서, 스캔앤다이브 섬유 원사의 굵기,..
똔똔스
'패스트캠퍼스부트캠프' 태그의 글 목록