
다수의 문서의 내용을 분석해서 주요한 단어들을 그룹별로 분류하는 분석방법을 토픽 모델링이라고 한다. 개요 데이터를 엑셀 파일에서 입력받아 tf-idf 적용 후 토픽 모델링 분석을 실시하다. R의 topicmodels 패키지를 사용한다. 입력 Web of science의 검색 결과를 엑셀 포맷으로 다운로드하여 다음과 같이 수정한다. 분석할 데이터 열만 제외하고 모두 삭제(본 예제에서사용할 열은 'Article Title') 열의 이름을 text로 수정(엑셀에서 1번 행의 값에 해당) titles.xlsx 로 저장(첨부된 파일로 실습 가능) 아래의 코드는 엑셀 파일을 읽어온 후 각 행의 번호에 해당하는 ID열을 추가한다. documents head(document_tokens) ID word 1 1 pati..
빅데이터분석
2020. 11. 3. 15:10
공지사항
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
링크
TAG
- 인포그래픽
- Carte Figurative
- Amos
- 조절변수
- 멀티그룹
- 통계그림
- 통계도
- 매개변수
- Monte Carlo Simulation
- 구조방정식
- 데이터분석
- 빅데이터
- 매개효과
- 몬테카를로
- 데이터마이닝
- 경로분석
- 토픽모델링
- 직접효과
- 확인적 요인분석
- Charles Joseph Minard
- 제약모델
- 몬테카를로 시뮬레이션
- 간접효과
- R
- 총효과
- 데이터사이언스
- 조절효과
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
글 보관함