본문 바로가기 메뉴 바로가기

Better Researcher

프로필사진
  • 글쓰기
  • 관리
  • 태그
  • 방명록
  • RSS

Better Researcher

검색하기 폼
  • 분류 전체보기 (7)
    • Innovation (0)
    • 참고문헌 관리 (0)
    • 연구 가이드 (0)
    • 통계분석 (5)
    • 북리뷰 (0)
    • 경영이론 (0)
    • 연구주제 (0)
    • 빅데이터분석 (2)
  • 방명록

데이터사이언스 (1)
토픽 모델링 tf-idf R

다수의 문서의 내용을 분석해서 주요한 단어들을 그룹별로 분류하는 분석방법을 토픽 모델링이라고 한다. 개요 데이터를 엑셀 파일에서 입력받아 tf-idf 적용 후 토픽 모델링 분석을 실시하다. R의 topicmodels 패키지를 사용한다. 입력 Web of science의 검색 결과를 엑셀 포맷으로 다운로드하여 다음과 같이 수정한다. 분석할 데이터 열만 제외하고 모두 삭제(본 예제에서사용할 열은 'Article Title') 열의 이름을 text로 수정(엑셀에서 1번 행의 값에 해당) titles.xlsx 로 저장(첨부된 파일로 실습 가능) 아래의 코드는 엑셀 파일을 읽어온 후 각 행의 번호에 해당하는 ID열을 추가한다. documents head(document_tokens) ID word 1 1 pati..

빅데이터분석 2020. 11. 3. 15:10
이전 1 다음
이전 다음
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
TAG
  • 몬테카를로
  • 멀티그룹
  • 통계그림
  • Charles Joseph Minard
  • 총효과
  • 제약모델
  • R
  • 통계도
  • 데이터마이닝
  • 간접효과
  • 빅데이터
  • Carte Figurative
  • 몬테카를로 시뮬레이션
  • 구조방정식
  • 인포그래픽
  • 매개변수
  • Monte Carlo Simulation
  • 경로분석
  • 직접효과
  • Amos
  • 조절변수
  • 데이터사이언스
  • 조절효과
  • 확인적 요인분석
  • 데이터분석
  • 토픽모델링
  • 매개효과
more
«   2025/07   »
일 월 화 수 목 금 토
1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31
글 보관함

Blog is powered by Tistory / Designed by Tistory

티스토리툴바