분류 전체보기 157

통계 분석

통계의 이해표본 조사일부만 추출하여 모집단 분석표본 추출 방법단순 랜덤 추출법: 무작위 추출계통 추출법: 번호 부여하여 일정 간격으로 추출집락 추출법(군락 추출법)여러 군집으로 나눈 뒤 군집을 선택하여 랜덤 추출군집 내 이질, 군집 간 동질층화 추출법군집 내 동일, 군집간 이질모집단과 같은 비율 추출 시, 비례 층화 추출법척도측정 후 숫자로 나타내도록 일정한 규칙을 정하여 바꾸는 도구종류질적 척도명목 척도: 어느 집단에 속하는지순서 척도: 서열 관계양적 척도구간 척도: 구간 사이의 간격이 의미가 있다(덧셈, 뺄셈 가능)비율 척도: 절대적 기준 0이 존재(사칙연산 가능)기술 통계, 추리통계기술 통계: 표본 자체의 속성, 특징 파악 중점 / 최솟값, 최댓값, 중위수 등의 통계량추리 통계(추론 통계): 수집한..

자격증/ADSP 2025.10.28

R기초와 데이터마트

데이터마트데이터 웨어하우스의 한 분야로 특정 목적을 위해 사용요약 변수와 파생 변수요약 변수: 원래의 데이터로부터 기본적인 통계 자료로 추출한 변수, 재활용성 높음파생 변수: 특정 목적을 만족하는 변수, 논리적 타당성 필요데이터 탐색탐색적 데이터 분석(EDA)데이터 관계를 찾기 위해 통계값과 분포등을 시각화하고 분석하는 것결측값존재하지 않는 데이터, N/A나 null등으로 표시결측값 대치 방법단순 대치법: 그냥 삭제, 손실 많을지도평균 대치법(=비조건부 평균 대치법): 평균값으로 결측값 대치조건부 평균 대치법: 회귀분석 결과로 대치단순 확률 대치법: 확률적 선택K-Nearest Neighbor: 가까운 응답다중 대치법: 여러 번 대치, 대치 → 분석 → 결합이상값극단적으로 크거나 작은 값이상값 항상 제거..

자격증/ADSP 2025.10.27

분석 마스터 플랜

마스터플랜 수립분석 마스터플랜 수립 프레임워크1. 우선순위 정하기기준: 전략적 중요도, 비즈니스 성과 및 ROI, 분서과제의 실행용이성 2. 적용 범위 및 방식 설정업무 내제화 적용 수준분석 데이터 적용 수준기술 적용 수준IT 프로젝트 우선순위 평가전략적 중요도:전략적 필요성, 시급성실행 용이성: 투자 용이성, 기술 용이성빅데이터 특징 고려한 ROI 요소투자비용 측면: 크기, 다양성, 속도 (3V)비즈니스 효과 측면: 가치 ROI를 활용한 우선순위 평가 기준난이도: 3V시급성: 가치포트폴리오 사분면 분석을 활용한 우선순위 평가 기준시급성 기준: 3 → 4 → 2난이도 기준: 3 → 1 → 2 분석 거버넌스 체계 수립분석 거버넌스 체계 구성요소조직, 프로세스, 시스템, 데이터, 분석 관련 교육 및 마인드 ..

자격증/ADSP 2025.10.27

분석 기획과 분석 방법론

분석 기획분석 대상과 그 방법에 따른 4가지 분석 주제목표 시점별 분석 기획과제 중심적 접근 방식: 빠르게 해결, 빠른 수행과 문제 해결이 목적장기적인 데이터플랜 방식: 지속적인 분석 내제화, 정확도와 무엇이 문제인지 정의가 목적분석기획 시 고려사항가용 데이터 고려: 분석의 기본이 되는 데이터 확보 및 파악적절한 활용 방안과 유스케이스 탐색: 기존에 잘 구현되고 있는 유사 시나리오 및 솔류션 활용장애요인에 대한 사전 계획 수립분석 방법론 개요방법론 구성 요소의 이해상세한 절차, 방법, 도구와 기법, 템플릿과 산출물기법의 합리적 의사결정 방해 요소고정 관념, 편향된 생각, 프레이밍 효과프레이밍 효과: 동일 상황인데 개인의 판단, 생각이 달라질 수 있는 상황분석 방법론 모델폭포수 모델프로토타입: 일부분 먼저..

자격증/ADSP 2025.10.27

명령어 사이클

명령어 사이클명령어 인출 사이클t0: MAR ← PCPC안에 있는 명령어 주소를 MAR로 전달t1: MBR ← M[MAR], PC ← PC + 1t2: IR ← MBR 명령어 간접 사이클명령어의 오퍼랜드가 간접 주소 지정방식인 경우에 유효주소를 계산하기 위해간접 주소 지정방식: 유효주소의 주소를 오퍼랜드 필에 명시하는 방식t3: MAR ← IR(addr)t4: MBR ← M[MAR]t5: IR(addr) ← MBR 출처- https://velog.io/@hyunji015/%EC%BB%B4%ED%93%A8%ED%84%B0%EA%B5%AC%EC%A1%B0-%EB%AA%85%EB%A0%B9%EC%96%B4-%EC%82%AC%EC%9D%B4%ED%81%B4%EA%B3%BC-%EC%9D%B8%ED%84%B0%E..

CS/컴퓨터구조 2025.10.24

과적합 해결

1. 데이터 양 늘리기2. 모델 복잡도 줄이기3. 규제(정규화) 하기: L1, L24. 드롭아웃: 학습 과정에서 신경망의 일부를 사용하지 않는 방법5. 교차검증: 데이터 분할을 다양하게 하여 일반화 성능 평가출처- https://wikidocs.net/61374 07-06 과적합(Overfitting)을 막는 방법들학습 데이터에 모델이 과적합되는 현상은 모델의 성능을 떨어트리는 주요 이슈입니다. 모델이 과적합되면 훈련 데이터에 대한 정확도는 높을지라도, 새로운 데이터. 즉, 검증 데이터나 …wikidocs.net

CS 2025.10.23

이중 해싱

해싱(Hashing)키를 고정된 크기의 해시값으로 변환하여 데이터를 저장하는 방법 이중 해싱(Double Hashing) 개방 주소법의 일종, 첫 번째 해시 함수에서 충돌이 발생하면 두 번째 해시 함수를 사용하여 새로운 위치 찾음 문제 풀이이론은 잘 모르겠다;;;첫번째 해시 함수가 테이블의 인덱스를 결정, 그러므로 현재 점유된 인덱스는 0,2,3,5,9h(19) = 2, f(19)=7이제 h_i 함수를 통해서 위치 계산, 만약에 충돌 발생하면 i를 늘려가면서 재해시 시도 횟수를 늘려간다.h_i(19) = (2 + i*7) mod 17h_0 = 2 → 점유된 인덱스h_1 = 9 → 점유된 인덱스h_2 = 16 → 빈칸이므로 여기에 저장! 출처- https://naeunbi698.tistory.com/530

CS/자료구조 2025.10.23

2025 상반기 취준 요약

상반기에 치열하게 프로젝트하고 취준도 하려다보니 아쉬운 점이 정말 많았던 것 같다. 그리고 어쩔때는 프로젝트하고 있는데 면접까지 잡혀있으니까 그냥 지쳐있던 상태로 준비도 많이 못했던 것 같기도 하고.... 상반기에 처음 자기소개서도 노력하면서 써보다보니 열심히 써 본 자소서가 떨어진 날은 내가 문제인걸까 어디가 문제인거지 이러면서 암울한 적도 많았다..ㅎㅎ 지금에서야 계속 노력하다보면 언젠가 어디든 취업하겠지 마인드가 됐지만 그 당시에는 싸피 수료도 이제 얼마남지 않았다는 생각에 급박해서 체험형 인턴이든, 계약직이든 다 넣어보려고 노력했었다. 그래서 결산 보고하자면 서류탈은 너무너무너무너무너무 많았기때문에 면접 갔던 것만 적어놓으려고 한다. 1. 에스원정말 너무 놀랐던 곳이다. 붙을 생각도 없어서 그때 ..

취준 2025.10.23

데이터 가치와 미래

빅데이터의 이해가트너 정의(3V)Volume, Variety, Velocity(+ Value or Velocity)빅데이터의 기능산업혁명의 석탄&철원유: 정보제공으로 생산성 향상렌즈: 현미경 ⇒ 생물학 ↑, 산업 전반에 영향(Ngram Viewer of Google)플랫폼: 공동 활용 목적으로 구축된 구조물, 써드 파티 비즈니스에 활용빅데이터가 만들어내는 변환전 - 후 - 양 - 상표본조사 → 전수조사사전처리 → 사후처리질 → 양인과관계 → 상관관계빅데이터의 가치와 영향빅데이터 가치 선정이 어려운 이유데이터 활용 방식: 언제, 어디서 누가 활용할지 알 수 없음가치 창출 방식: 새로운 가치 창출 → 가치 선정 어려움분석 기술의 발전빅데이터 활용에 필요한 3요소데이터, 인력, 기술7가지 빅데이터 활용 기본 ..

자격증/ADSP 2025.10.22