• 제목/요약/키워드: 토픽 모델

검색결과 184건 처리시간 0.043초

공유경제 기반의 고객리뷰를 이용한 토픽모델링 분석: 공유주차를 중심으로 (A Study on Analysis of Topic Modeling using Customer Reviews based on Sharing Economy: Focusing on Sharing Parking)

  • 이태원
    • 한국산업정보학회논문지
    • /
    • 제25권3호
    • /
    • pp.39-51
    • /
    • 2020
  • 본 연구에서는 공유경제의 다양한 비즈니스 모델 중 공유주차로 범위를 제한하고, 이와 관련된 리뷰를 수집한 후 텍스트마이닝 분석을 통해 공유주차가 갖고 있는 사회적 이슈와 소비자 인식에 대해 살펴보고자 한다. 본 실험에서는 TFIDF (Term frequency inverse document frequency) 기법과 LDA (Latent dirichlet allocation) 기법을 이용하여 키워드별 토픽을 추출하여 분석한 결과 소비자들이 필요로 하거나 원하는 정보들을 파악할 수 있었으며, 토픽으로 분류한 결과 지자체 협약, 주차공간협소, 주차문화개선, 시민참여 등 시민들의 불만과 시민의식이 공유주차 서비스를 시행하는데 중요한 역할을 하고 있다는 것을 확인할 수 있었다. 본 연구는 정성적 연구, 기업 및 지역의 사례를 이용하여 기존의 탐색적 연구를 수행한 선행 연구와는 차별화된 연구로 학술적 기여도가 높다고 할 수 있다. LDA 분석을 본 연구에 활용하여 나타난 결과를 바탕으로 지역경제 활성화를 위한 공유경제 정책 수립에 응용하거나 활용할 수 있다는 실무적 기여도가 있다.

토픽맵을 이용한 e-Learning 모델에 관한 연구 (A study on e-Learning Model using TopicMap)

  • 권오상;문석재;엄영현;국윤규;정계동;최영근
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (D)
    • /
    • pp.750-753
    • /
    • 2006
  • e-Learning 분야는 정부, 기업, 학교 등 많은 조직에서 교육을 위한 수단으로 사용되어지고 있다. 이러한 e-Learning은 독립적인 운영플렛폼의 개발부터 웹 기반의 코스웨어(Courseware)까지 발전해왔다. 코스웨어는 컴퓨터 전달 체제를 통하여 교수-학습 과정을 촉진시켜 명시된 교수 목표 하에 학습자의 지식과 기능의 바람직한 변화를 목적으로 설계 및 개발된 교육용 소프트웨어와 데이터라고 할 수 있다. 또한 컴퓨터 언어 및 저작도구(Authoring Tools)를 이용하여 각 과목별 교육내용을 음성, 그림, 애니메이션, 동영상 등의 다양한 형태로 제시될 수 있도록 저작된 프로그램으로 주로 눈으로 보고 귀로 들으면서 학습하는 유형이다. 현재 코스웨어에서 제공되는 정보는 학습에 대한 정보와 교수정보 그리고 Client의 학습 진행 상황 등을 제공한다. 하지만 학습에 연관된 다른 학습이나 학습에 관련된 교수들의 전공정보, 또한 학습에 관련된 어플리케이션 등을 검색하려 할 때는 하나하나 따로 검색을 해야 하는 어려움이 따른다. 본 논문에서는 이러한 문제점을 해결하기 위하여 학습에 대한 목적과 관련학습, 관련교수, 관련연구, 관련 어플리케이션 등의 연관성을 토픽맵(TopicMap)을 이용하여 학습에 대한 더 정확한 정보를 쉽게 검색할 수 있게 한다. Client가 찾으려는 토픽을 중심으로 연관된 토픽과 카테고리를 나열하여 수작업으로 인한 검색시간과 잘못된 키워드 검색을 해결하였다.

  • PDF

도로 위의 군비경쟁: LDA 토픽모델을 활용한 SUV의 인기 요인 탐구 (The Arms Race on the Road: Exploring Factors of SUVs' Popularity by LDA Topic Model)

  • 전승봉;고태경
    • 디지털융복합연구
    • /
    • 제18권10호
    • /
    • pp.239-252
    • /
    • 2020
  • 본 연구자들은 텍스트 마이닝을 활용하여 SUV 선호 증가의 요인을 탐색하고자 한다. 온라인 자동차 커뮤니티인 보배드림에서 2005년부터 2019년까지 작성된 SUV 관련 게시글 32,679개를 수집한 후, LDA 토픽모델링 기법을 적용하였다. 분석 결과, SUV 담화에서 주요한 토픽으로 등장한 '안전'이 범죄로부터 개인의 위험에 주목한 기존 연구와 달리 교통사고 및 고속주행 상황에서의 안전을 의미하는 것으로 드러났다. 한국 사회의 SUV 소비는 개인이 운전하면서 느끼는 불안과 위험에 대한 대비 수단을 의미한다고 볼 수 있다는 것이다. 또한, 이와 같은 위험 인식 저변에는 불평등 증대로 인해 감소하는 타인에 대한 신뢰가 작동한다고 할 수 있다.

인공지능 활용 교육의 토픽모델링 분석을 통한 수학교육 연구 방향의 함의 (An Analysis of the International Trends of Research on Artificial Intelligence in Education Using Topic Modeling)

  • 노지화;고호경;김병수;허난
    • 한국학교수학회논문집
    • /
    • 제26권1호
    • /
    • pp.1-19
    • /
    • 2023
  • 본 연구는 최근 교육 분야에서 인공지능을 활용한 연구 동향을 파악하기 위해 관련 연구 논문을 대상으로 텍스트 마이닝 기법 중 토픽모델링과 시계열 기반 트렌드 분석 기법을 활용하여 분석을 실시하였다. 분석 대상으로는 다양한 학문 영역에서 컴퓨터 활용 교육 연구에 초점을 두는 '교육에서의 인공지능 국제학회(International Society of Artificial Intelligence in Education)'에서 발행하는 SCOPUS 저널에 2003년부터 2020년까지 게재된 총 352편의 논문을 사용하였다. 분석 결과 빈도수가 높은 단어들을 조합하여 8개의 토픽을 추출하였으며, 이를 통해 인공지능을 활용한 교육 연구에서 중요시 여기는 관점을 파악해 나감과 동시에 교과별로 인공지능을 교육에서 활용하는 내용과 목적에 차이점이 있음을 알 수 있었다. 또, 학습 시스템에서 학생 행동 모델을 분석하고 학생 응답 및 반응에 대한 피드백을 개발하는 연구는 점차 증가한 반면, 데이터 처리 방법에 대한 연구는 최근 들어 감소하는 경향이 나타났다. 연구 결과를 토대로 향후 교육에서 인공지능을 활용한 연구에 필요한 주제 및 방향에 대한 시사점을 제공하였다.

텍스트 마이닝을 활용한 웹툰 애플리케이션 사용자 리뷰 분석 (Analysis of User Reviews for Webtoon Applications Using Text Mining)

  • 신효림;최준호
    • 문화기술의 융합
    • /
    • 제8권4호
    • /
    • pp.457-468
    • /
    • 2022
  • 웹툰 산업이 급속도로 성장하며, 이러한 성장세와 함께 새로운 웹툰 애플리케이션 모델이 제시되었다. 웹툰 애플리케이션 1.0과 2.0을 지나 3.0의 시대가 시작된 것이다. 이러한 변화에도 불구하고 아직까지 웹툰 애플리케이션을 대상으로 한 사용자 리뷰 분석 연구는 부족한 실정이다. 이에 이 연구는 웹툰 애플리케이션 3.0 모델을 제시한 '카카오웹툰(다음웹툰)'을 대상으로 사용자 리뷰를 분석하고자 한다. 분석을 위해 애플리케이션 리뷰 20,382개를 수집한 후 전처리 과정을 버전 별로 TF-IDF, 네트워크 분석, 토픽 모델링, 감성 분석을 실시하였다. 이를 통해 웹툰 애플리케이션 변화에 따른 사용자 경험을 탐구하고 리뷰를 통한 사용성 평가를 진행하였다.

Topic signatur e와 n-gram을 이용한 댓글 분류 시스템 (Comments Classification System using Topic Signature and n-gram)

  • 배민영;차정원
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2008년도 제20회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.189-194
    • /
    • 2008
  • 본 논문에서는 토픽 시그너처(Topic Signature)와 n-gram을 이용한 댓글 분류 시스템을 개발한다. 토픽 시그너처는 문서요약이나 문서분류에서 자질 선택을 위한 방법으로 많이 사용되어지며, n-gram은 모든 언어에 적용 가능한 장점이 있다. 악성댓글은 대체로 문장 길이가 짧고 유행어나 변형어의 출현 빈도가 높으며 비정형화된 특징이 있다. 따라서 우리는 댓글을 n-gram으로 나누어 자질로 선택한다. 분류를 위해 베이지안(Bayesian)모델을 사용하였다. 본 논문에서는 한글과 영어 댓글에 대한 판별 실험을 통하여 구현한 시스템이 복잡한 전처리 과정이 필요한 기존에 제안된 방법들보다 더 나은 성능을 보이며, 언어에 관계없이 적용 가능하다는 것을 실험 결과를 통해 확인할 수 있었다.

  • PDF

임베디드 시스템을 위한 경량화된 DDS 미들웨어의 설계 (A Design of Light-weight DDS for Embedded System)

  • 류상현;김인혁;엄영익
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 춘계학술발표대회
    • /
    • pp.230-233
    • /
    • 2010
  • 최근 분산된 노드들 간의 자료를 송수신하는 임베디드 어플리케이션들이 증가함에 따라 이를 지원하기 위한 분산 미들웨어도 함께 발전하고 있다. 분산미들웨어는 원격 객체 관리를 위한 클라이언트-서버 모델, 큐를 이용한 메시지 전송을 목적으로 하는 메시지 패싱 모델, 분산 컴퓨팅 환경에서 자료의 전송을 목적으로 하는 출판-구독 모델이라는 3가지 모델로 분류 된다. 본 논문에서는 3가지 분산 미들웨어 모델들에 대하여 살펴보고 출판-구독 모델의 대표적 분산미들웨어인 Data Distribution Service를 소개한다. 또한 출판-구독 모델이 단말 간 P2P를 지원함에 따라 생기는 문제점인 과다한 트래픽을 해결하기 위해 자료들을 그룹화 시켜 전송하거나 특정 토픽에 관련된 자료들을 미리 예약된 채널을 통해 전송하는 기법들을 제안하고 일반 DDS와 비교를 통해 그 효과를 예측해본다.

스포츠 이미지 분류를 위한 희소 부호화 기법을 이용한 공간 피라미드 매칭 LDA 모델 (A Spatial Pyramid Matching LDA Model using Sparse Coding for Classification of Sports Scene Images)

  • 전진;김문철
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2016년도 하계학술대회
    • /
    • pp.35-36
    • /
    • 2016
  • 본 논문에서는 기존 Bag-of-Visual words (BoW) 접근법에서 반영하지 못한 이미지의 공간 정보를 활용하기 위해서 Spatial Pyramid Matching (SPM) 기법을 Latent Dirichlet Allocation (LDA) 모델에 결합하여 이미지를 분류하는 모델을 제안한다. BoW 접근법은 이미지 패치를 시각적 단어로 변환하여 시각적 단어의 분포로 이미지를 표현하는 기법이며, 기존의 방식이 이미지 패치의 위치정보를 활용하지 못하는 점을 극복하기 위하여 SPM 기법을 도입하는 연구가 진행되어 왔다. 또한 이미지 패치를 정확하게 표현하기 위해서 벡터 양자화 대신 희소 부호화 기법을 이용하여 이미지 패치를 시각적 단어로 변환하였다. 제안하는 모델은 BoW 접근법을 기반으로 위치정보를 활용하는 SPM 을 LDA 모델에 적용하여 시각적 단어의 토픽을 추론함과 동시에 multi-class SVM 분류기를 이용하여 이미지를 분류한다. UIUC 스포츠 데이터를 이용하여 제안하는 모델의 분류 성능을 검증하였다.

  • PDF

희소 부호화 기법과 토픽 모델링을 통한 이미지 분류 모델

  • 전진;김문철
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2015년도 하계학술대회
    • /
    • pp.49-50
    • /
    • 2015
  • 본 논문에서는 이미지를 시각적 단어로 표현하여 분석하는 기법인 bag-of-visual words (BoW) 모델을 기반으로 latent dirichlet allocation (LDA) 모델을 결합하여 시각적 단어의 구조를 파악하여 이미지를 분류할 수 있는 모델을 제안한다. 우선 이미지를 시각적 단어로 기존의 방법보다 정확하게 표현하기 위해서 희소 부호화(sparse coding) 기법을 적용한다. 기존의 BoW 모델은 하나의 이미지 패치를 하나의 단어로 표현하였지만, 희소 부호화 기법을 통해 하나의 이미지 패치를 여러 개의 단어로 표현할 수 있다. 제안하는 모델을 이용하여 이미지를 분류하기 위해서 분류 성능 측정에 많이 쓰이는 multi-class SVM 기법을 이용한다. UIUC 스포츠 데이터를 이용한 성능 측정을 통해 제안한 기법의 클래스 분류 성능을 검증하였다.

  • PDF

LDA 토픽 모델링과 Word2vec을 활용한 유사 특허문서 추천연구 (LDA Topic Modeling and Recommendation of Similar Patent Document Using Word2vec)

  • 이앞길;최근호;김건우
    • 경영정보학연구
    • /
    • 제22권1호
    • /
    • pp.17-31
    • /
    • 2020
  • 4차 산업혁명 시대의 시작과 함께 다양한 분야의 기술들이 서로 융합하며 새로운 형태의 기술과 제품들이 개발되고 있으며, 이와 더불어 그것들에 대한 시장 지배력을 갖기 위한 지식 재산권의 행사나 특허등록의 중요성이 높아지고 있어 국내는 물론 해외에서의 특허출원이 증가하고 있다. 이에 따라, 심사관 1인당 처리해야 할 특허 처리 건수가 해마다 많아지고 있어 선행기술조사에 소비되는 시간과 비용이 점점 증가하고 있는 실정이다. 본 연구는 다수의 해외특허 우선권 주장 시 동일 우선권 주장 특허문서 간 유사도를 계산하여 심사관 및 특허 출원인이 유사문서를 우선 검토 할 수 있도록 함으로써 심사 시간과 비용을 줄이고자 하였다. 이를 위해, 본 연구에서는 비정형 특허 문서의 데이터를 전처리 후 LDA 토픽 모델링과 Word2vec을 활용하여 특허 문서 간 유사도를 구하고, 이 유사도 점수가 높은 순으로 검토 문서를 우선 추천하는 유사 특허 추천 모델을 제안하였다. 3단계의 모델 생성과정을 통해 만들어진 모델을 사용하여 재현율 95%로 높은 결과를 보였다. 본 연구에서 제안한 모델을 통해, 심사관은 효율적으로 선행기술에 대한 조사가 가능해지며, 심사 수행 중 유사하다고 판단된 특허문서에 대한 심사 이력을 신속하게 참고할 수 있어 업무 부담감을 줄이고 심사풀질을 향상시킬 수 있을 것으로 기대된다.