
다수의 문서의 내용을 분석해서 주요한 단어들을 그룹별로 분류하는 분석방법을 토픽 모델링이라고 한다. 개요 데이터를 엑셀 파일에서 입력받아 tf-idf 적용 후 토픽 모델링 분석을 실시하다. R의 topicmodels 패키지를 사용한다. 입력 Web of science의 검색 결과를 엑셀 포맷으로 다운로드하여 다음과 같이 수정한다. 분석할 데이터 열만 제외하고 모두 삭제(본 예제에서사용할 열은 'Article Title') 열의 이름을 text로 수정(엑셀에서 1번 행의 값에 해당) titles.xlsx 로 저장(첨부된 파일로 실습 가능) 아래의 코드는 엑셀 파일을 읽어온 후 각 행의 번호에 해당하는 ID열을 추가한다. documents head(document_tokens) ID word 1 1 pati..
빅데이터분석
2020. 11. 3. 15:10
공지사항
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
링크
TAG
- 총효과
- R
- 통계도
- 제약모델
- 구조방정식
- Monte Carlo Simulation
- Amos
- 조절변수
- 토픽모델링
- 몬테카를로 시뮬레이션
- 통계그림
- 몬테카를로
- 데이터마이닝
- 경로분석
- 인포그래픽
- 빅데이터
- 멀티그룹
- 데이터사이언스
- 매개효과
- 데이터분석
- 조절효과
- 직접효과
- Carte Figurative
- 매개변수
- 확인적 요인분석
- 간접효과
- Charles Joseph Minard
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
글 보관함