doistory

Notice

« 2025/09 »
일	월	화	수	목	금	토
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30

Tags more

Archives

Today

Total

관리 메뉴

목록전체 글 (38)

doistory

SVM, 의사결정 트리학습

SVM from sklearn.svm import SVC / from sklearn.svm import SVR SVC : 분류 (Support Vector Classification) SVR: 회귀 (Support Vector Regression) SVM - 로지스틱 회귀와 함꼐 분류를 위한 강력한 머신러닝 알고리즘 - 퍼셉트론의 개념을 확장하여 적용한 개념 - 퍼셉트론은 분류 오류를 최소화하는 알고리즘인 반면 SVM은 margin이 최대가 되도록 하는 알고리즘이다. margin - margin 분류를 위한 경계선과 이 경계선에서 가장 가까운 트레이닝 데이터 사이의 거리 - C라는 파라미터를 갖고 마진의 크기를 결정함. 그중 성능 좋은 모델선택 의사결정 트리학습 - 의사 결정 트리 학습은 트레이닝 데이터..

[ Data ]/데이터분석, 머신러닝, 딥러닝 2023. 7. 7. 17:33

[Tableau] 태블로의 계산식: 행과 집계의 차이

화면에 포함된 차원에 따라 측정값 또는 집계를 볼 수 있다. 상단 분석탭 -측정값 집계 옵션이 기본적으로 적용됨. 이걸 해제하여 풀어보면 아래와같이 측정값을 이루고있는 행 하나하나를 볼수 있다. 행수준 계산식과 집계수준 계산식의 차이점 비교 헹수준 계산식: 데이터 원본에 각각 하나하나행에 대해서 각각을 대상하고 그 계산 값이 이후에 집계(따라서 필드명이 그대로 쓰임) 각행에대해 계산되기에 실제로 그 값을 볼 수 있지만 오류: 계산에 오류있음 집계인수 및 집계되지 않은 인수를 이 함수와 혼합할 수 없습니다. 나타나는 이유 그냥 필드값(행수준)과 집계된 필드값(집계 수준 계산식)을 같이 사용하면 위와같은 에러 발생 행수준 계산식은 행수준 계싼식끼리, 집계 수준 계산식은 집계수준 계산식끼리 사용한다. 집계수준..

[ Data ]/Tableau 2023. 7. 6. 22:22

가트너, 2023년 데이터분석 10대 트랜드

지난달 8일 가트너의 애널리스트들은 데이터 및 분석 서밋(Gartner Data & Analytics Summit)에서 비즈니스 및 IT 리더들이 반드시 활용하고 D&A 전략에 적용시켜야 할 10가지 트렌드를 발표했다. ‘비즈니스적 사고, 플랫폼과 에코시스템, 사람‘ 이 핵심 1. 가치 최적화 2. AI 리스크 관리 3. 옵저버빌리티 4. 데이터 공유 필수 5. D&A 지속 가능성 6. 실용적인 데이터 패브릭 7. 떠오르는 AI 8. 통합 및 컴포저블 에코시스템 9. 크리에이터가 된 소비자 10. 여전히 주요 의사결정권자인 ‘사람’ 원문: https://www.gartner.com/en/newsroom/press-releases/2023-05-09-gartner-identifies-the-top-ten-..

[ Data ]/기타 2023. 6. 20. 21:57

태블로 - 집계 (Aggregate)

집계 (Aggregate) 집계는 측정값(숫자값)을 특정 기준(차원)으로 모으는 것을 의미합니다. 이때 반드시 집계 방법(합계, 평균, 최대값 등)이 지정되어야 하는데, 이를 집계 함수라고 합니다. 엑셀을 사용하여 집계가 이루어지는 과정을 개념적으로 설명한 예시를 살펴 보겠습니다. 위쪽의 합계와 아래쪽의 평균이 집계된 예시를 각각 상세하게 보면 다음과 같습니다. 1. 위쪽 예시 월별 합계 수량을 집계하는 과정을 보여줍니다. 각 월별 데이터를 모아서 엑셀의 SUM() 함수를 사용해서 집계한 결과를 볼 수 있습니다. 집계의 기준이 되는 월 이외의 차원은 집계 결과에서 보이지 않습니다. 2. 아래쪽 예시 제품별 평균 수량을 집계하는 과정을 보여줍니다. 각 제품별 데이터를 모아서 엑셀의 AVERAGE() 함수를..

[ Data ]/Tableau 2023. 6. 19. 19:50

[Tableau] 태블로 워크시트 시각화

1. 폴더별 그룹화 : 불러와서 선택한 엑셀 시트(테이블)을 하나의 데이터셋으로 볼 수 있다. 데이터 원본 테이블 별 그룹화: 엑셀 각 시트별로 구분하여 볼 수 있다. 2. 폴더링 필드의 양이 많을 때 일부를 선택하여(shift+클릭) 우클릭 > 폴더링 할 수 있다. 폴더만들기 > 새로운 이름으로 폴더생성 ex) 고객정보들 = '고객'으로 폴더링, 제품 정보들 = '제품'으로 폴더링 (하단 사진 참고) 3. 퀵테이블 계산: 데이터 시각화를 하면서 자주 쓰는 함수 모음 4. 표현방식 차원과 측정값을 선택하면, 태블로가 알아서 그릴 수 있는 표현 방식을 선정해준다. 그 중 가장 권장되는 표현방식은 붉은 테두리로 표시된다.

[ Data ]/Tableau 2023. 6. 19. 19:38

[Tableau] 태블로 데이터 '연결' 옵션

연결 옵션인 라이브와 추출을 toggle 옵션으로 선택 할 수 있다. 1. 라이브 데이터에 바로 연결하며 데이터 원본의 속도가 성능 결정 - 태블로에서 시각화에 필요한 sql문이 데이터베이스에 다이렉트로 질의를 던지고, 데이터베이스에서 질의를 처리하게됨. 처리된 결과물을 태블로에서 받아와 시각화가 이루어짐 - 실시간으로 데이터베이스에 쿼리를 던져 실시간으로 반영되는 데이터를 불러올 수 있음. - 추출과 달리 따로 새로고침 필요없이 live로 반영됨. - 데이터베이스 기반 2. 추출 추출에 모든 데이터가 포함 - 데이터성능이 좋지 않거나 용량이 클 때 사용한다. - 메모리 기반에서 데이터를 분석하고싶을 때 선택 가능한 옵션. - 실시간으로 쿼리를 던져 반영시키는 라이브와 달리 데이터가 새로고침 되는 시점에..

[ Data ]/Tableau 2023. 6. 19. 09:54

[Tableau] 데스크탑 UI 구성 요소 및 명칭

1. 툴바 2. 표현방식 3. 데이터 창과 분석 창 전환 탭 4. 데이터 원본 이름 5. 차원 6. 측정값 7. 집합 8. 매개 변수 9. 페이지 선반 10.필터 선반 11. 마크 선반 (마크 카드) - 색상, 크기, 레이블, 세부 정보, 12. 도구 설명 등의 속성 단추가 포함되어 있음 13. 열과 행 선반 14. 뷰 15. 퀵 필터 16. 범례(색상 범례) 아래는 태블로의 화면과, 태블로에 연결된 실제 엑셀파일간의 관계를 참고할 수 있는 사진입니다. 연결: 불러온 엑셀파일 시트: 엑셀의 각각시트가 나타남 오른쪽에 각각의 두 시트를 드래그하여 한 번에 볼 수 있습니다.

[ Data ]/Tableau 2023. 6. 16. 20:09

[Tableau]의 기본적인 동작원리와 집계(Aggregate)

○ 태블로의 기본적인 동작원리 1. 필드는 정성적인 값과 정량적인 값에 따라 차원과 측정값으로 구분 - 차원: 정성적 데이터(제품명, 날짜, 지리명 등), 분석 기준이 되는 값, 불연속형 데이터로 측정값을 쪼개어 보는 하나의 관점 - 측정값: 정량적 수치, 연속형 데이터로 집계가 되는 데이터 2. 측정값은 차원을 기준으로 집계되어 표현 ! - 집계란 합계, 평균, 중앙값, 카운트, 카운트(고유), 최소값, 최대값, 백분위수, 표준편차, 분산 등을 의미 - 측정값(숫자값)을 특정 기준(차원)으로 모으는 것을 의미합니다. 이때 반드시 집계 방법(합계, 평균, 최대값 등)이 지정되어야 하는데, 이를 집계 함수라고 합니다. - 만약 차원(문자데이터)가 숫자 값으로 인식되어 측정값으로 분류되어있는 경우 차원으로 ..

[ Data ]/Tableau 2023. 6. 16. 19:44

이전 Prev 1 2 3 4 Next 다음

목록전체 글 (38)

doistory

티스토리툴바