
몬테카를로 시뮬레이션(Monte Carlo Simulation)은 확률을 계산할 때 사용하는 반복 계산법이다. 주사위를 던졌을 때 1이 나올 확률은 1/6이라고 이미 알고 있지만, 만약 모른다고 했을 때 어떻게 계산할 수 있을까? 주사위를 10,000번 던져서 1이 나온 비율(1이 나온 경우/전체 경우)을 계산하면 근사치를 구해낼 수 있다. 예제 1) 동전을 20번 던져서 앞 면이 4번 이상 나올 확률 구하기 동전의 앞면을 1, 뒷면을 0이라고 설정 20번을 무작위로 추출해서 1을 모두 더함(=앞 면이 나온 횟수, 변수 S에 저장) 위 과정을 10만번 반복 "S가 4이상인 경우/전체 경우"를 계산 runs

다수의 문서의 내용을 분석해서 주요한 단어들을 그룹별로 분류하는 분석방법을 토픽 모델링이라고 한다. 개요 데이터를 엑셀 파일에서 입력받아 tf-idf 적용 후 토픽 모델링 분석을 실시하다. R의 topicmodels 패키지를 사용한다. 입력 Web of science의 검색 결과를 엑셀 포맷으로 다운로드하여 다음과 같이 수정한다. 분석할 데이터 열만 제외하고 모두 삭제(본 예제에서사용할 열은 'Article Title') 열의 이름을 text로 수정(엑셀에서 1번 행의 값에 해당) titles.xlsx 로 저장(첨부된 파일로 실습 가능) 아래의 코드는 엑셀 파일을 읽어온 후 각 행의 번호에 해당하는 ID열을 추가한다. documents head(document_tokens) ID word 1 1 pati..

다수의 문서의 내용을 분석해서 주요한 단어들을 그룹별로 분류하는 분석방법을 토픽 모델링이라고 한다. 개요 데이터를 엑셀 파일에서 입력받아 토픽 모델링 분석을 실시하다. R의 topicmodels 패키지를 사용한다. 입력 Web of science의 검색 결과를 엑셀 포맷으로 다운로드하여 다음과 같이 수정한다. 분석할 데이터 열만 제외하고 모두 삭제(본 예제에서사용할 열은 'Article Title') 열의 이름을 text로 수정(엑셀에서 1번 행의 값에 해당) titles.xlsx 로 저장(첨부된 파일로 실습 가능) 아래의 코드는 엑셀 파일을 읽어온 후 각 행의 번호에 해당하는 ID열을 추가한다. documents % # create a document-term matrix with all feature..
- Total
- Today
- Yesterday
- 통계그림
- 조절변수
- 총효과
- 제약모델
- 토픽모델링
- 몬테카를로
- 매개변수
- 조절효과
- Amos
- 통계도
- Monte Carlo Simulation
- 데이터마이닝
- 데이터사이언스
- 빅데이터
- 간접효과
- 직접효과
- 멀티그룹
- 인포그래픽
- 몬테카를로 시뮬레이션
- Charles Joseph Minard
- 구조방정식
- 매개효과
- 확인적 요인분석
- 데이터분석
- R
- Carte Figurative
- 경로분석
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |