• 제목/요약/키워드: Dirichlet Process

검색결과 72건 처리시간 0.027초

문서 중요도를 고려한 토픽 기반의 논문 교정자 매칭 방법론 (A Proofreader Matching Method Based on Topic Modeling Using the Importance of Documents)

  • 손연빈;안현태;최예림
    • 인터넷정보학회논문지
    • /
    • 제19권4호
    • /
    • pp.27-33
    • /
    • 2018
  • 최근 국내외 연구기관에서는 논문을 저널에 제출하는 과정에서 연구결과를 효과적으로 전달하기 위해 외부 기관을 통해 논문의 문맥, 전문 용어의 쓰임, 스타일 등에 대한 논문 교정을 진행하는 경우가 증가하고 있다. 하지만 대다수의 논문 교정 회사에서는 매니저의 주관적 판단에 따라 수동으로 논문 교정자를 할당하는 시스템이며, 이에 따라 논문의 주제에 대한 전문성이 부족한 교정자를 할당하여 논문 교정 의뢰인의 만족도가 떨어지는 사례가 발생하고 있다. 따라서 본 논문에서는 효과적인 논문 교정자 할당을 위해 논문의 토픽을 고려한 논문 교정자 매칭 방법론을 제안한다. Latent Dirichlet Allocation을 이용하여 문서의 토픽 모델링을 진행하고, 그 결과를 이용하여 코사인 유사도 기반으로 사용자간 유사도를 계산하였다. 특히, 논문 교정자의 토픽 모델링 과정에서, 대표 문서로 간주되는 문서의 중요도에 따라 가중치를 부여하여 빈도수에 차별을 둬 정밀한 토픽 추정을 가능하게 한다. 실제 서비스의 데이터를 이용한 실험에서 제안 방법론의 성능이 비교 방법론보다 우수함을 확인하였으며, 정성적 평가를 통해 논문 교정자 매칭 결과의 유효성을 검증하였다.

국방 기사 자동 분석 시스템 구축 방안 연구 (A Study on Automatic Analysis System of National Defense Articles)

  • 김현중;김우주
    • 한국군사과학기술학회지
    • /
    • 제21권1호
    • /
    • pp.86-93
    • /
    • 2018
  • Since media articles, which have a great influence on public opinion, are transmitted to the public through various media, it is very difficult to analyze them manually. There are many discussions on methods that can collect, process, and analyze documents in the academia, but this is mostly done in the areas related to politics and stocks, and national-defense articles are poorly researched. In this study, we will explain how to build an automatic analysis system of national defense articles that can collect information on defense articles automatically, and can process information quickly by using topic modeling with LDA, emotional analysis, and extraction-based text summarization.

일상생활 계획을 위한 스마트폰-사용자 상호작용 기반 지속 발전 가능한 사용자 맞춤 위치-시간-행동 추론 방법 (Smartphone-User Interactive based Self Developing Place-Time-Activity Coupled Prediction Method for Daily Routine Planning System)

  • 이범진;김지섭;류제환;허민오;김주석;장병탁
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제21권2호
    • /
    • pp.154-159
    • /
    • 2015
  • 과거 어플리케이션 다양성만 지향하던 사용자의 수요가 최근 스마트폰의 고도화된 센서와 기계학습이 결합된 지능형 어플리케이션으로의 선호로 전향되고 있다. 이러한 경향을 반영하여 본 논문에서는 스마트폰에 축적된 사용자의 라이프로깅 데이터에서 의미있는 정보를 추출하고, 추출한 정보를 통해 사용자의 인지적 행동을 대신 가능한 인지 에이전트(Cognitive Agent)개념의 스마트폰-사용자 상호작용 사용자 맞춤 위치-시간-행동 추론 기법을 제안한다. 제안 방법은 사용자의 라이프로깅데이터를 DPGMM (Dirichlet Process Gaussian Mixture Model) 클러스터링 기법으로 사용자 주요 관심지역 POI(Point of Interest)를 자동으로 추출하고, 평생학습이 가능한 강화학습의 한 종류인 POMDP(Partially Observable Markov Decision Process)를 사용하여 사용자의 위치-시간-행동을 추론 한다. 제안 방법으로 구현한 사용자 맞춤 일과 계획 시스템의 시간별 사용자 일과 추론 결과는 70%이상의 성능을 보였으며, 하루 일과 계획 지능형 서비스의 새로운 방향을 제시하고 있다.

텍스트마이닝을 활용한 도로분야 ITS 정책이슈 탐색기법 정립 (Establishment of ITS Policy Issues Investigation Method in the Road Section applied Textmining)

  • 오창석;이용택;고민수
    • 한국ITS학회 논문지
    • /
    • 제15권6호
    • /
    • pp.10-23
    • /
    • 2016
  • 본 연구는 빅데이터를 활용하여 감사 시 유의해서 살펴보아야 할 ITS 관련 정책이슈 탐색방법 개발 및 적용을 목적으로 한다. 이를 위해 본 연구에서는 William Dunn이 제안한 경계분석을 이론적 토대로 하여, 여기에 감사원 감사실무 프로세스를 접목한 감사이슈 분석 틀을 제안했다. 그리고 이 분석 틀을 전산으로 구현하기 위해 메타문제를 추정하는 개념이 경계분석과 유사한 텍스트마이닝 기법을 응용했다. 텍스트마이닝의 구체적 모형은 David Blei가 제안한 Latent Dirichlet Allocation(LDA) 모형을 기반으로 하는 비대칭-대칭 혼합 어휘소 기반 LDA를 응용했다. 사례분석 결과, 경찰청에서 운영하는 도시교통정보시스템의 교통정보 수집률 저조와 국토교통부의 첨단교통관리시스템과의 중복 문제, 디지털 운행기록계의 주행거리 조작 등이 주요 이슈로 도출됐다.

영상감시시스템에서 움직임의 비교사학습을 통한 비정상행동탐지 (Unsupervised Motion Learning for Abnormal Behavior Detection in Visual Surveillance)

  • 정하욱;장형진;최진영
    • 전자공학회논문지SC
    • /
    • 제48권5호
    • /
    • pp.45-51
    • /
    • 2011
  • 본 논문에서는 비교사학습법을 통해 영상의 방대한 정보를 효율적으로 모델링 하는 방법을 제안하고자 한다. 여기서 이동궤적들은 자연어 처리에 사용되는 알고리즘인 잠재 디리클레 할당 모형(Latent Dirichlet Allocation)에 의해 직진, 좌회전, 우회전등 각 상황 별로 주제에 따라 그 영역을 효과적으로 분류할 수 있다. LDA를 이용해 주제별로 의미 있는 영역을 분류한 후, 각 주제별로 분류된 궤적을 관측열로 보고 은닉 마르코프 모델(Hidden Markov Model)의 바움-웰치 알고리즘을 사용하여 학습한다. 전향 알고리즘을 사용하여 입력된 행동과 학습된 행동을 비교함으로써 영상내의 행동이 정상인지 비정상인지를 효과적으로 판단할 수 있다. 실험결과 다양한 영상에 대해 의미있는 주제별로 영역이 잘 분류되며 추적에러로 인한 궤적의 노이즈에도 강인하게 물체의 무단횡단, 신호위반과 같은 상황을 효과적으로 탐지하는 것을 확인할 수 있다.

감시 영상에서의 장면 분석을 통한 이상행위 검출 (Detection of Abnormal Behavior by Scene Analysis in Surveillance Video)

  • 배건태;어영정;곽수영;변혜란
    • 한국통신학회논문지
    • /
    • 제36권12C호
    • /
    • pp.744-752
    • /
    • 2011
  • 지능형 감시 분야에서 이상행위를 검출하는 것은 오랫동안 연구되어온 주제로 다양한 방법들이 제안되어 왔다. 그러나 많은 연구가 움직이는 객체의 개별적인 추적이 가능하다는 것을 전제로 하여 찾은 가려짐이 발생하는 실생활에 적용하는데 한계가 있다. 본 논문에서는 객체 추적이 어려운 복잡한 환경에서 장면의 주된 움직임을 분석하여 비정상적인 행위를 검출하는 방법을 제안한다. 먼저, 입력영상에서 움직임 정보를 추출하여 Visual Word와 Visual Document를 생성하고, 문서 분석 기법 중 하나인 LDA(Latent Dirichlet Allocation 알고리즘을 이용하여 장면의 주요한 움직임 정보j위치, 크기, 방향, 분포)를 추출한다. 이렇게 분석된 장면의 주요한 움직임과 입력영상에서 발생한 움직임과의 유사도를 분석하여 주요한 움직임에서 벗어나는 움직임을 비정상적인 움직임으로 간주하고 이를 이상행위로 검출하는 방법을 제안한다.

효율적인 수체의 기본단수계 생성 알고리즘과 H/W 구현에 관한 연구 (On Efficient Algorithms for Generating Fundamental Units and their H/W Implementations over Number Fields)

  • 김용태
    • 한국전자통신학회논문지
    • /
    • 제12권6호
    • /
    • pp.1181-1188
    • /
    • 2017
  • 수체의 단수와 기본단수계는 RSA 암호계에서는 400자리 이상의 큰 수가 소수인지를 판별하는 소수판정법과 그 수를 소인수분해하는 데에 사용되는 다양한 수체선별법에 사용되며, 복소이차체를 기반으로 하는 암호계에서는 이데알의 곱셈과정과 류수(class number)를 계산하는 과정 등 다양한 암호계에서 사용되고 있다. 본 논문에서는 기본단수계를 이용하는 암호계의 구현시간과 공간을 줄이기 위하여, 수체의 기본단수계의 존재성을 증명한 Dirichlet의 정리와 몇 가지 기본단수계의 성질을 중심으로 우리가 제안하는 기본단수계의 생성 과정을 소개한다. 그리고 그에 따른 기본단수계의 H/W 구현의 시간과 공간을 최소화할 수 있는 효율적인 기본단수계의 생성알고리즘과 그 알고리즘을 H/W 상에서 구현한 결과를 제시한다.

fMRI 데이터에 적용한 인디언 뷔페 프로세스 닮은 성분 분석법 (Indian Buffet Process Inspired Component Analysis for fMRI Data)

  • 김준식;김은솔;임병권;이충연;장병탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(C)
    • /
    • pp.191-194
    • /
    • 2011
  • 문서를 이루는 단어들의 빈도수가 지수법칙(power law)를 따른다는 지프의 법칩(Zipf's law)이 있다. 이러한 단어분포를 고려하여 문서의 토픽을 찾아내는 기계학습법이 디리쉴레 프로세스(Dirichlet process) 이다. 이를 발전시켜서 데이터의 잠재 요인(latent factor)들을 베이즈 확률모델에 기반한 샘플링 바탕으로 찾는 방법이 인디언 뷔페 과정(Indian buffet process) 이다. 우리는 25가지의 특징(feature)들에 대한 점수(rating)들이 볼드(blood oxygen dependent level) 신호와 함께 주어지는 PBAIC 2007 데이터에 주성분 분석법(principal component analysis)를 적용했다. PBAIC 2007 데이터는 비디오 게임을 수행하며 기능적뇌영상(functional magnetic resonance imaging, fMRI) 촬영을 하여 얻어진 공개데이터이다. 우리의 연구에서는 주성분 분석법을 이용하여 10개의 독립 성분(independent component)들을 찾았다. 그리고 1.75초 마다 촬영된 BOLD 신호와 10개의 고유벡터(eigenvector)들간의 내적을 취하여 가중치(weight)를 구하였다. 성분들의 가중치를 낮은 순서로 정렬함으로써 각 시간마다 주도적으로 영향을 미치는 성분들을 알아낼 수 있었다.

FEYNMAN-KAC SEMIGROUPS, MARTINGALES AND WAVE OPERATORS

  • Van Casteren, Jan A.
    • 대한수학회지
    • /
    • 제38권2호
    • /
    • pp.227-274
    • /
    • 2001
  • In this paper we intended to discuss the following topics: (1) Notation, generalities, Markov processes. The close relationship between (generators of) Markov processes and the martingale problem is exhibited. A link between the Korovkin property and generators of Feller semigroups is established. (2) Feynman-Kac semigroups: 0-order regular perturbations, pinned Markov measures. A basic representation via distributions of Markov processes is depicted. (3) Dirichlet semigroups: 0-order singular perturbations, harmonic functions, multiplicative functionals. Here a representation theorem of solutions to the heat equation is depicted in terms of the distributions of the underlying Markov process and a suitable stopping time. (4) Sets of finite capacity, wave operators, and related results. In this section a number of results are presented concerning the completeness of scattering systems (and its spectral consequences). (5) Some (abstract) problems related to Neumann semigroups: 1st order perturbations. In this section some rather abstract problems are presented, which lie on the borderline between first order perturbations together with their boundary limits (Neumann type boundary conditions and) and reflected Markov processes.

  • PDF

Exploring the Trends and Challenges of Artificial Intelligence Education through the Analysis of Newspapers in Korea, 1991-2020: A topic-modeling approach

  • Kim, Sung-ae
    • Journal of information and communication convergence engineering
    • /
    • 제18권4호
    • /
    • pp.216-221
    • /
    • 2020
  • Artificial intelligence (AI), an essential skill of the Fourth Industrial Revolution, is being actively taught in higher education; however, AI education is only in the preparatory stage in elementary, middle, and high schools. Investigating various newspaper articles related to AI education to date can aid in basic data collection, which is an important process in the preparatory stage. Accordingly, 13,378 newspaper articles were collected from a total of 21 newspapers, and five topics were extracted using the latent Dirichlet allocation (LDA)-based topic model along with frequency analysis. Newspaper articles from the early 2000s expanded to technologies related to the Fourth Industrial Revolution. Accordingly, education in AI fields should be linked with education in AI-based technology. In addition, efforts should be made to secure the continuity and sequence of AI education in cooperation with related higher institutions and companies.