
몬테카를로 시뮬레이션(Monte Carlo Simulation)은 확률을 계산할 때 사용하는 반복 계산법이다. 주사위를 던졌을 때 1이 나올 확률은 1/6이라고 이미 알고 있지만, 만약 모른다고 했을 때 어떻게 계산할 수 있을까? 주사위를 10,000번 던져서 1이 나온 비율(1이 나온 경우/전체 경우)을 계산하면 근사치를 구해낼 수 있다. 예제 1) 동전을 20번 던져서 앞 면이 4번 이상 나올 확률 구하기 동전의 앞면을 1, 뒷면을 0이라고 설정 20번을 무작위로 추출해서 1을 모두 더함(=앞 면이 나온 횟수, 변수 S에 저장) 위 과정을 10만번 반복 "S가 4이상인 경우/전체 경우"를 계산 runs

다수의 문서의 내용을 분석해서 주요한 단어들을 그룹별로 분류하는 분석방법을 토픽 모델링이라고 한다. 개요 데이터를 엑셀 파일에서 입력받아 tf-idf 적용 후 토픽 모델링 분석을 실시하다. R의 topicmodels 패키지를 사용한다. 입력 Web of science의 검색 결과를 엑셀 포맷으로 다운로드하여 다음과 같이 수정한다. 분석할 데이터 열만 제외하고 모두 삭제(본 예제에서사용할 열은 'Article Title') 열의 이름을 text로 수정(엑셀에서 1번 행의 값에 해당) titles.xlsx 로 저장(첨부된 파일로 실습 가능) 아래의 코드는 엑셀 파일을 읽어온 후 각 행의 번호에 해당하는 ID열을 추가한다. documents head(document_tokens) ID word 1 1 pati..

다수의 문서의 내용을 분석해서 주요한 단어들을 그룹별로 분류하는 분석방법을 토픽 모델링이라고 한다. 개요 데이터를 엑셀 파일에서 입력받아 토픽 모델링 분석을 실시하다. R의 topicmodels 패키지를 사용한다. 입력 Web of science의 검색 결과를 엑셀 포맷으로 다운로드하여 다음과 같이 수정한다. 분석할 데이터 열만 제외하고 모두 삭제(본 예제에서사용할 열은 'Article Title') 열의 이름을 text로 수정(엑셀에서 1번 행의 값에 해당) titles.xlsx 로 저장(첨부된 파일로 실습 가능) 아래의 코드는 엑셀 파일을 읽어온 후 각 행의 번호에 해당하는 ID열을 추가한다. documents % # create a document-term matrix with all feature..

AMOS에서 경로분석을 하기 위해서는 다음과 같은 절차를 따른다 입력 관측변수(Observed variable, indicator): 설문 문항 값에 해당 구조모델(Structural model): 관측변수, 측정오차, 구조오차, 외생변수(Exogenous variable)와 내생변수(Endogenous variable)간의 인과관계로 이루어짐 출력 비표준화 계수(Regression weights) 표준화 계수(Standardized regression weights) 유의확률(p value) 모델 적합도(Model fit) 분석절차 측정모델에서 공분산 삭제 외생변수와 내생변수간에 인과관계 설정 외생변수간에 공분산 설정 내생변수에 구조오차 추가 분석 옵션 설정 분석 버튼 누르기 분석 결과 해석 실습 구조..

AMOS에서 확인적 요인분석을 하기 위해서는 다음과 같은 절차를 따른다 입력 데이터(관측변수 Observed variable, indicator): 설문문항 값에 해당 측정모델(Measurement model): 관측변수, 잠재변수, 측정오차, 잠재변수간 공분산으로 이루어짐 출력 비표준화 계수(Regression weights) 표준화 계수(Standardized regression weights) 오차 계수(Variances) 모델 적합도(Model fit) 분석절차 데이터 읽어오기(엑셀 파일 등) 관측변수(사각형), 잠재변수(원형) 그리기 데이터의 관측변수를 모델의 관측변수에 연결하기 측정오차(원형) 그리기 측정오차(원형) 이름 정하기(*Plugins/Draw unobserved variables 메..

구조방정식은 "측정모델"과 "구조모델"로 구성되어 있으며 "측정모델"은 확인적요인분석(CFA: Confirmatory Factory Analysis)으로 분석하고, "구조모델"은 경로분석(Path Analysis)과 유사한 방식으로 분석한다. *"경로분석"은 "측정변수"를 이용하지만 "구조모델"은 "잠재변수"를 사용한다는 점이 다르다. 그러나, AMOS를 사용할 경우에는 메뉴가 따로 있는 것이 아니라 그냥 '분석' 버튼만 누르면 그려진 모형에 따라서 분석이 이루어진다. 주의할 점은 AMOS를 사용하면 "CFA", "경로분석" 같은 메뉴가 별도로 있는 것이 아니고 모형 그림을 어떻게 그리고 '분석' 버튼을 누르냐에 따라서 CFA가 실행되기도 하고 경로분석이 실행되기도 한다. 즉, 잠재변수(Latent va..

대만통계포털에서 연구관련 통계자료를 찾다가 재미있는 제목을 발견했다. "흥미로운 통계 有趣的統計", "역사상 가장 뛰어난 통계 그림 史上最佳統計圖" 클릭을 해서 들어가 봤더니 다름 아닌 Charles Joseph Minard의 Carte Figurative를 소개한 내용이었다. 설명을 간단히 요약하면 다음과 같다. "프랑스 토목기술자 Charles Joseph Minard(1781~1870)가 그린 나폴레옹 러시아 정벌 군대 손실도는 지금까지 통계그림계의 최고로 인정받고 있다. 아래의 그림은 미국 Graphics Press사에서 컴퓨터로 다시 제작된 것이다." Carte Figurative는 아래와 같은 6개의 데이터를 2차원 평면도 하나에 표현하고 있다. 군대의 수(선의 굵기) 이동방향(갈색:진군, 검..
- Total
- Today
- Yesterday
- 데이터사이언스
- 인포그래픽
- 조절효과
- 데이터마이닝
- 확인적 요인분석
- Carte Figurative
- 통계그림
- Amos
- 총효과
- 직접효과
- 제약모델
- 조절변수
- 몬테카를로
- Charles Joseph Minard
- 매개효과
- 데이터분석
- 경로분석
- 매개변수
- Monte Carlo Simulation
- 구조방정식
- R
- 통계도
- 토픽모델링
- 빅데이터
- 몬테카를로 시뮬레이션
- 멀티그룹
- 간접효과
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |