• 제목/요약/키워드: 구조적 토픽모델

검색결과 22건 처리시간 0.024초

토픽 모델링을 이용한 댓글 그래프 기반 소셜 마이닝 기법 (A Reply Graph-based Social Mining Method with Topic Modeling)

  • 이상연;이건명
    • 한국지능시스템학회논문지
    • /
    • 제24권6호
    • /
    • pp.640-645
    • /
    • 2014
  • 인터넷 상에서 많은 사람들은 사용자 간의 의사소통과 정보 공유, 사회적 관계를 생성하기 위한 방법으로 소셜 네트워크 서비스를 이용한다. 그 중 대표적인 트위터는 하루에 수백만 건의 소셜 데이터가 발생하기 때문에 수집되고 있는 데이터의 양이 엄청나다. 이 방대한 양의 데이터로부터 의미 있는 정보를 추출하는 소셜 마이닝이 집중적으로 연구되고 있다. 트위터는 일반적으로 유용한 정보 혹은 공유하고자 하는 내용을 팔로잉-팔로워 관계를 이용해 쉽게 전달하고 리트윗할 수 있다. 소셜 미디어에서 트윗 데이터에 대한 토픽 모델링은 이슈를 추적하기 위한 좋은 도구이다. 짧은 텍스트 기반인 트윗 데이터의 제한점을 극복하기 위해, 사용자를 노드로 사용자간 댓글과 리트윗 메시지의 여부를 간선으로 하는 그래프 구조를 갖는 댓글 그래프의 개념을 소개한다. 토픽 모델링의 대표적인 방법인 LDA 토픽 모델이 짧은 텍스트 데이터에 대해 비효율적인 것을 보완하기 위한 방법으로, 이 논문에서는 짧은 문서의 수를 줄이고 마이닝 결과의 질을 향상시키기 위한 댓글 그래프를 사용하는 토픽 모델링 방법을 소개한다. 제안한 모델은 토픽 모델링 방법으로 LDA 모델을 사용하였으며, 7일간 수집한 트윗 데이터에 대한 실험 결과를 보인다.

Topic Maps를 이용한 MARC데이터의 FRBR모델 구현에 관한 연구 (An Implementation of FRBR Model by Using Topic Maps)

  • 이현실;한성국
    • 정보관리학회지
    • /
    • 제22권3호
    • /
    • pp.289-306
    • /
    • 2005
  • FRBR 모델에서는 서지 요소와 관계를 중심으로 ER 모델링 방식을 제공하고 있지만, 단지 구조적 프레임워크로서 FRBR 모델을 효율적으로 구현할 수 있는 도구가 필요하다. 본 연구에서는 Topic Maps를 이용하여 FRBR 모델을 구현하는 방법을 제시한다. Topic Maps 기반의 FRBR 모델 구현의 유효성을 실증적으로 보이기 위하여, 명성황후라는 주제와 관련된 MARC 데이터를 추출하여 FRBR 모델을 설계하였고, Topic Maps를 이용하여 이를 구현하였다. 연구 결과, FRBR의 entity-relation과 Topic Maps의 topic-association이 개념적으로 동일하기 때문에 FRBR 모델 개발의 적합함을 알 수 있었다. FRBR 구조는 Topic Maps 패러다임과 그대로 일치하기 때문에 FRBR 모델은 Topic Maps로 구현함이 바람직하다.

키워드 네트워크 분석과 토픽모델링을 활용한 정보활용교육 연구 동향 분석 (Analysis of Research Trends in Information Literacy Education Using Keyword Network Analysis and Topic Modeling)

  • 임정훈
    • 정보관리학회지
    • /
    • 제39권4호
    • /
    • pp.23-48
    • /
    • 2022
  • 본 연구는 키워드 네트워크 분석과 토픽모델링을 활용하여 국내 정보활용교육 연구의 흐름을 살펴보고 향후 정보활용교육의 방향성을 모색하는데 목적이 있다. 이를 위하여 국내 문헌정보학 분야의 학술지에 게재된 정보활용교육과 관련된 논문 306편을 선정하고, 논문의 초록을 대상으로 전처리 과정을 거쳐 전체 키워드 출현 빈도, 시기별 키워드 출현 빈도, 키워드 동시출현 빈도분석을 수행하였다. 이어서 키워드 네트워크 분석을 통해 키워드의 연결중심성과 매개중심성, 위세중심성을 분석하였다. 또한 구조적 토픽모델링 분석을 활용하여 15개의 토픽(교육과정, 정보활용교육 효과, 정보활용교육 내용, 학교도서관 교육, 정보매체활용, 정보활용능력 평가 지표, 도서관 불안, 공공도서관 프로그램, 대학도서관 이용자교육, 건강정보 활용능력, 정보격차, 도서관활 용수업 개선, 연구 동향, 정보활용교육 모델, 교사 역할)을 도출하고, 토픽별로 비중의 변화를 확인하기 위해 연도별 토픽 추이를 분석하였다. 이러한 결과를 바탕으로 정보활용교육의 방향성과 후속 연구에 대한 제언을 제시하였다.

플랫폼노동 연구 동향 분석 (Investigating the Trends of Research for the Platform Work)

  • 방미현;이영민
    • 한국콘텐츠학회논문지
    • /
    • 제21권3호
    • /
    • pp.430-440
    • /
    • 2021
  • 본 연구에서는 토픽 모델링과 주제어 네트워크 분석 방법을 활용하여 국내 플랫폼노동에 관한 학술논문 288편을 분석하였다. 다양한 학문 분야의 플랫폼노동에 관한 연구 동향을 양적, 질적 두 가지 방법을 혼합 활용하여 분석 방법의 한계를 보완하고, 연구의 근간이 되는 주요 이론을 도출하여 종합정리함으로 플랫폼노동에 관한 양면성을 고찰하였다. 학문 분야별로는 법학, 경영학, 경제학 순으로 연구가 많이 진행되었고, 플랫폼노동 보호방안, 공유경제의 직·간접적 영향에 관한 주제 연구가 다수 이루어졌다. 핵심 주제어로는 기반이 되는 인프라, 구조적인 변화를 촉진하는 두 가지 측면에서 디지털, 가치, 산업, 노동을 선정하였다. 주요 토픽은 플랫폼 노동자 보호, 공유 서비스 가치, 디지털 패러다임, 공유경제 모델, 플랫폼 규제가 도출되었다. 분석 결과를 토대로, 거시적인 맥락에서의 구조적인 분석 프레임 완성과 플랫폼노동의 다양한 유형을 포함한 사례 분석과 기술 보완의 일반화, 지속성과 공유경제의 본질적인 공생 가치 실현을 위한 개인 수준의 역량 개발 탐구, 맞춤형 직업교육훈련 프로그램 설계를 제언하였다.

희소 부호화 기법과 토픽 모델링을 통한 이미지 분류 모델

  • 전진;김문철
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2015년도 하계학술대회
    • /
    • pp.49-50
    • /
    • 2015
  • 본 논문에서는 이미지를 시각적 단어로 표현하여 분석하는 기법인 bag-of-visual words (BoW) 모델을 기반으로 latent dirichlet allocation (LDA) 모델을 결합하여 시각적 단어의 구조를 파악하여 이미지를 분류할 수 있는 모델을 제안한다. 우선 이미지를 시각적 단어로 기존의 방법보다 정확하게 표현하기 위해서 희소 부호화(sparse coding) 기법을 적용한다. 기존의 BoW 모델은 하나의 이미지 패치를 하나의 단어로 표현하였지만, 희소 부호화 기법을 통해 하나의 이미지 패치를 여러 개의 단어로 표현할 수 있다. 제안하는 모델을 이용하여 이미지를 분류하기 위해서 분류 성능 측정에 많이 쓰이는 multi-class SVM 기법을 이용한다. UIUC 스포츠 데이터를 이용한 성능 측정을 통해 제안한 기법의 클래스 분류 성능을 검증하였다.

  • PDF

문헌정보학 분야 4개 학술지의 연구영역 중첩분석 (Overlap Analysis of Research Areas in Four Library and Information Science Journals)

  • 정유경
    • 정보관리학회지
    • /
    • 제40권4호
    • /
    • pp.259-277
    • /
    • 2023
  • 본 연구는 국내 문헌정보학 분야의 4대 학술지를 대상으로 구조적토픽모델과 문헌 네트워크 분석을 사용하여 연구영역을 분석하고, 각 학술지의 공통 및 특화된 연구영역을 식별하여 문헌정보학 분야의 학술 지형을 파악하는 것을 목적으로 한다. 연구결과, 문헌정보학 분야의 학술지들이 각기 다른 연구영역에 중점을 두고 있는 것으로 나타났는데, 한국문헌정보학회지는 문헌정보학 분야의 전반적인 연구영역을 가장 포괄적으로 다루고 있으며, 한국비블리아학회지 또한 유사한 연구경향을 보였으나 도서관경영 및 도서관프로그램과 관련된 주제 선호도가 높았다. 한국도서관·정보학회지는 문헌정보학 전반의 연구주제 및 타 학술지에 비해 학교도서관이나 독서교육과 관련된 분야에 특화된 주제들을 많이 다루고 있으며, 정보관리학회지는 정보기술 및 정보학 전반에 대한 주제적 비중이 높아 다른 세 학술지와 비교했을 때 주제적 차별성이 있었다. 본 연구는 학술지별 주요 연구영역을 파악함으로써 연구자들의 논문투고와 학술지의 주제 특성화 및 다양화를 위한 기초자료로 활용될 수 있을 것이다.

토픽맵을 이용한 현대문학 콘텐츠 온톨로지의 적용 및 설계 (An Application and Design of Modern Culture's Contents Ontology using Topic Map)

  • 정화영;고인환
    • 디지털융복합연구
    • /
    • 제10권6호
    • /
    • pp.213-218
    • /
    • 2012
  • 현대문학은 사회적 배경에 따라 그 시대적 상황을 표현하여 왔다. 즉 시대가 변하면 문학작품도 변화를 가져왔다. 따라서 우리는 현대문학을 통해 그 시대를 이해할 수 있고, 그 시대의 사회적 요구를 습득할 수 있다. 이러한 문학작품들은 정보통신의 발달에 따라 미디어 매체로 제작됨으로서 사용자들에게 보다 가까이 접근하는 계기를 만들어 주고 있다. 최근, IT 융합, 디지털 융합이라는 새로운 학문의 기류는 서로 다른 학문분야를 접목하여 보다 많은 시너지 효과를 가져 오고 있다. 따라서 본 논문은 현대문학작품들을 디지털화 하는데 필요한 온톨로지를 설계하고자 한다. 이를 위하여 시대별 문학작품의 구조를 분석하고 각 요소들과의 관계를 명세한다. 명세의 방법은 토픽맵을 이용하였다. 또한 각 관계 모델은 토픽벡터를 통해 연결을 명세하였다.

효율적인 DDS 토픽 저장을 위한 메타 모델 변환 방법 (Meta-Model Transformations for Efficient Storing DDS Topics)

  • 이현우;임형준;최훈;김점수;이규철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(C)
    • /
    • pp.123-126
    • /
    • 2011
  • 최근 전투체계는 동시에 다수의 장비들 사이에 실시간으로 데이터를 전달해야 하는데, 이러한 특성을 만족하는 통신 미들웨어로서 OMG (Object Management Group)에서 정의한 데이터 분배 서비스 (DDS ; Data Distribution Service)가 적합하다. 이를 구현한 DDS 시스템에는 RTI의 NDDS, PrismTech의 OpenSplice, 충남대학교의 ReTicom 등이 있다. 이 중 NDDS와 OpenSplice는 데이터의 영속성을 지원하지만 ReTicom에서는 영속성을 아직 지원하지 못한다. 이를 해결함과 동시에 실시간성을 보장하기 위해서 ReTicom은 메인 메모리 기반의 객체 관계형 데이터베이스를 사용하여 구현중이다. 이를 위해서는 DDS의 객체 모델 데이터를 정의하는 IDL과 객체 관계형 데이터베이스의 데이터 타입 및 구조 등이 동일하지 않기 때문에 IDL과 객체 관계형 데이터베이스간의 데이터 타입 및 구조를 변환하는 메타 모델 변환 방법이 제공되어야 한다. 본 논문에서는 이러한 메타 모델 변환 방법을 해결하고자 IDL을 구조파악이 쉬운 XML 스키마로 변환 후 이를 객체 관계형 데이터베이스의 데이터 타입 및 구조 형태로 변환 해주는 방법을 제안한다.

온톨로지 기반의 지식맵 서비스 시스템의 설계 및 구현

  • 김정민;박철만;정준원;이한준;정호영;민경섭;김형주
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (A)
    • /
    • pp.527-529
    • /
    • 2003
  • 지식관리시스템의 지식 분류 체계가 지식맵이며 이 지식맵을 이용하여 지식 서비스가 제공된다. 그러나 현재의 지식맵은 비표준적인 지식 네트웍 구조와 정적인 분류체계라는 문제를 가진다. 문제 해결 방법은 지식맵에 온틀로지를 적용해서 표준성, 의미 기반의 지식 네트웍 구조. 동적인 지식분류, 자동화된 지식서비스를 제공하는 새로운 개념의 지식맵을 구현하는 것이다. 본 논문에서는 토픽맵 모델을 기반으로 온톨로지를 생성, 저장, 검색하는 효율적인 온톨로지 관리 시스템인 K-Box를 구현하였다. K-Box는 온톨로지 관리를 위한 기본적인 기능들을 제공하며, 이질적인 저장소들을 일관된 인터페이스로 접근할 수 있도록 함으로써 저장 장치 독립성을 제공하였다. 또한, 저장 관리되는 모든 온톨로지들의 무결성을 보장하기 위한 새로운 기법과 사용자 관심을 중심으로 한 온톨로지 검색 지원을 위한 방법을 제안하였다. 마지막으로, 우리는 여러 온톨로지들을 적용해 봄으로써 K-Box 시스템이 효율적으로 사용 가능함을 확인하였다.

  • PDF

토픽맵과 카산드라를 이용한 그래프 구조와 트랜잭션 동시 처리 기법 (Technique for Concurrent Processing Graph Structure and Transaction Using Topic Maps and Cassandra)

  • 신재현
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제1권3호
    • /
    • pp.159-168
    • /
    • 2012
  • SNS, 클라우드, Web3.0과 같은 새로운 IT환경은 '관계(relation)'가 중요한 요소가 되고 있다. 그리고 이들 관계(relation)는 거래, 즉, 트랜잭션을 발생시킨다. 그러나 우리가 사용하고 있는 관계형 데이터베이스(RDBMS)나 그래프 데이터베이스는 관계(relation)를 나타내는 그래프 구조와 트랜잭션을 동시에 처리하지 못한다. 본 논문은 확장 가능한 복잡 네트워크 시스템에서 활용할 수 있는 그래프 구조와 트랜잭션을 동시에 처리할 수 있는 방법을 제안한다. 제안 기법은 토픽맵의 데이터 모델을 응용하여 그래프 구조와 트랜잭션을 동시에 저장하고 탐색한다. 토픽맵은 시멘틱 웹(Web3.0)을 구현하는 온톨로지 언어 중 하나로써, 정보자원들 사이의 연관 '관계(relation)'를 통해 정보의 네비게이터로써 활용되고 있다. 또한 본 논문에서는 컬럼형 데이터베이스인 카산드라를 이용하여 제안 기법의 아키텍처를 설계, 구현하였다. 이는 분산처리를 이용하여 빅데이터 레벨의 데이터까지 처리할 수 있도록 하기 위함이다. 마지막으로 대표적인 RDBMS인 오라클과 제안 기법을 동일한 데이터 소스, 동일한 질문에 대해 저장 및 질의를 하는 과정을 실험으로 보였다. 이는 조인(join) 없이 관계(relation)를 표현함으로써 RDBMS의 역할까지 충분히 대체 가능함을 보이고자 한다.