• 제목/요약/키워드: LDA기법

검색결과 210건 처리시간 0.024초

위성·지상정보 융합 재난 대응 기술 분야 유망기술 도출을 위한 연관 키워드 및 빅데이터 분석 기법 (A New Scheme Exploiting the Related Keyword and Big Data Analysis for Predicting Promise Technology in the Field of Satellite·Terrestrial Information Convergence Disaster Response)

  • 이항원;김영억
    • 한국재난정보학회 논문집
    • /
    • 제18권2호
    • /
    • pp.418-431
    • /
    • 2022
  • 연구목적: 기존의 유망기술 도출 연구에서 대상 특허를 선별하는 과정에서 검색식이 충실하게 구성되지 않아 중요 특허가 분석 대상에서 누락되는 문제와 출원 미공개 기간에 변화하는 최신 기술 트랜드를 반영하지 못하는 문제들을 개선하기 위한 새로운 기법들을 제시한다. 연구방법: 본 논문에서는 R 프로그래밍을 통한 TF와 TF-IDF 등의 연관 키워드 기반 검색식 구성 기법 및 LDA 토픽 모델링 기법을 제안하고, 위성·지상 정보 융합 재난 대응 기술을 중심으로 기존 방법과 비교 분석하여 제안된 기법의 유효성을 확인한다. 연구결과: 상용 특허 DB 시스템을 활용한 제안된 방식 적용을 통해 대상 기술과 관련도가 가장 높은 주요(핵심)특허가 기존 방식(19건) 대비 17건 추가로 도출(36건, 89.5% 증가)되어 중요 특허 누락이 상당히 개선됨을 보였으며 Science ON에 등록된 최근 5년간 발표 논문을 대상으로 LDA 토픽 모델링을 수행하여 최신 기술 트랜드를 반영한 유망 기술 도출이 가능함을 보였다. 결론: 본 논문을 통해 제시한 유망기술 도출 기법을 통해 위성·지상정보 융합 재난 대응 기술분야에서의 유망기술 도출을 통한 신규 연구개발에 유용하게 사용될 수 있는 방향성을 제공하였다.

LDA 토픽모델링 기법을 활용한 부산시 민원 빅데이터 분석 (Big Data Analysis of Busan Civil Affairs Using the LDA Topic Modeling Technique)

  • 박주섭;이새미
    • 정보화정책
    • /
    • 제27권2호
    • /
    • pp.66-83
    • /
    • 2020
  • 시민들은 도시 내 발생되고 있는 지역문제에 대해 큰 관심을 가지고 있다. 지방정부는 이러한 지역문제들을 해결하기 위해 노력하고 있지만 시민들의 생활 불편을 줄여주기는 쉽지 않고 이로 인한 시민들의 불만은 민원으로 이어지고 있다. 이를 해소할 수 있는 대안으로 빅데이터 활용을 통해 민원의 특성을 파악하고, 시민들에게 선제적 편의성을 제공하기 위한 노력이 절실하다. 본 논문에서는 LDA 토픽모델링 기법을 활용하여 전자민원의 동향 분석에 관한 연구를 실시한다. 이를 위해 2015~2017년 9,625건의 부산시 전자민원을 대상으로 20개의 민원토픽을 추출하였다. 도출된 민원토픽을 통해 핵심민원을 파악하고, 분기별 비중 추이 분석을 통하여 4개의 Hot 민원(버스정차, 택시기사, 칭찬, 민원처리)과 4개의 Cold 민원(cctv설치, 버스노선, 공원주차장, 축제 불만)을 도출하였다. 본 연구는 민원동향을 파악하기 위해 빅데이터 분석 방법을 제시하였고, 후속 연구를 유발하였다는 학문적 기여도가 있다. 또한 민원분석을 위해 사용한 텍스트마이닝 기법은 빅데이터 처리가 필요한 다른 행정업무에도 활용될 수 있다.

Fuzzy-EBGM을 이용한 얼굴인식과 Fuzzy-LDA를 이용한 홍채인식의 다중생체인식 기법 연구 (Multi-Modal Biometrics Recognition Method of Face Recognition using Fuzzy-EBGM and Iris Recognition using Fuzzy LDA)

  • 고현주;권만준;전명근
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2005년도 추계학술대회 학술발표 논문집 제15권 제2호
    • /
    • pp.299-301
    • /
    • 2005
  • 본 연구는 생체정보를 이용하여 개인을 인증하고 확인하기 위한 방법으로 기존 단일 생체인식 기법의 단점을 보완하기 위해 홍채와 얼굴을 이용한 다중생체인식(Multi-Modal Biometrics Recognition)기법을 연구하였다. 중국 홍채 데이터베이스 CASIA(Chinese Academy of Science)에 Gabor Wavelet과 FLDA(Fuzzy Linear Discriminant Analysis)를 사용하여 특징벡터를 획득하였으며, FERET(FERET(Face Recognition Technology) 얼굴영상데이터를 사용하여 FERET 연구에서 매우 우수한 성능을 보인 EBGM알고리듬으로 특징벡터를 획득하였다. 이로부터 얻어진 두 score 값에 대하여 다양한 균등화 과정을 시도해 보았으며, 등록자와 침입자를 구분하기 위한 Fusion Algorithm으로 Bayesian Classifier, Support vector machine, Fisher's linear discriminant를 사용하였다. 또한, 널리 사용되는 방법 중 Weighted Summation을 이용하여 다중생체인식의 성능을 비교해 보았다.

  • PDF

키워드 기반 주제중심 분석을 이용한 비정형데이터 처리 (Unstructured Data Processing Using Keyword-Based Topic-Oriented Analysis)

  • 고명숙
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제6권11호
    • /
    • pp.521-526
    • /
    • 2017
  • 데이터는 데이터 형식이 다양하고 방대할 뿐만 아니라 그 생성 속도가 매우 빨라 기존의 데이터 처리 방식이 아닌 새로운 관리 및 분석 방법이 요구된다. 소셜 네트워크 상의 온라인 문서에서 인간의 언어로 쓰여진 비정형 텍스트에서 Text Mining기법을 사용하여 유용한 정보를 추출할 수 있다. 소셜미디어에 남긴 정치, 경제, 문화에 대한 메시지에 대한 경향을 파악하는 것이 어떤 주제에 관심을 가지고 있는지를 파악할 수 있는 요소가 된다. 본 연구에서는 주제 중심 분석 기법을 이용하여 주어진 키워드에 관한 온라인 뉴스를 대상으로 텍스트 마이닝을 수행하였다. LDA(Latent Dirichiet Allocation)를 이용하여 웹문서로부터 정보를 추출하고 이로부터 사람들이 실제로 주어진 키워드에 대하여 어떤 주제에 관심이 있고 관련된 핵심 가치 중 어떤 주제를 중심으로 전파되고 있는지를 분석하였다.

LDA 토픽모델링을 통한 ICT분야 국가연구개발사업의 주요 연구토픽 및 동향 탐색 (Investigation of Research Topic and Trends of National ICT Research-Development Using the LDA Model)

  • 우창우;이종연
    • 한국융합학회논문지
    • /
    • 제11권7호
    • /
    • pp.9-18
    • /
    • 2020
  • 본 논문의 연구목표는 LDA(Latent Dirichlet Allocation) 모델을 적용하여 국가연구개발사업을 통해 수행되고 있는 ICT(Information and Communication Technology) 분야의 연구과제에 대한 주요 연구 토픽과 동향을 탐색하는데 있다. 연구방법에는 NTIS(National Science and Technology Information Service)로부터 최근 5년간 국가연구개발사업의 전체 연구과제 정보를 다운로드받고 이를 정보통신기획평가원(IITP)의 EZone 시스템과 매칭하여 ICT 분야 연구과제 5,200건을 확보하고, 토픽모델링 기법중 하나인 LDA 모델을 적용하여 연구토픽과 연구동향을 조사하였다. 실험결과로, ICT분야 연구과제에 대한 연구토픽은 인공지능, 빅데이터, 사물인터넷(Internet of Things)과 같은 지능정보기술로 확인되었고 연구동향에는 초실감미디어에 관한 연구가 활발히 진행되고 있음을 확인하였다. 끝으로 본 논문에서 진행된 국가연구개발사업에 대한 토픽모델링 결과는 향후 ICT분야 연구개발 계획 및 전략수립, 정책, 과제기획 등 중요한 정보로 활용될 수 있을 것이다.

도로 위의 군비경쟁: LDA 토픽모델을 활용한 SUV의 인기 요인 탐구 (The Arms Race on the Road: Exploring Factors of SUVs' Popularity by LDA Topic Model)

  • 전승봉;고태경
    • 디지털융복합연구
    • /
    • 제18권10호
    • /
    • pp.239-252
    • /
    • 2020
  • 본 연구자들은 텍스트 마이닝을 활용하여 SUV 선호 증가의 요인을 탐색하고자 한다. 온라인 자동차 커뮤니티인 보배드림에서 2005년부터 2019년까지 작성된 SUV 관련 게시글 32,679개를 수집한 후, LDA 토픽모델링 기법을 적용하였다. 분석 결과, SUV 담화에서 주요한 토픽으로 등장한 '안전'이 범죄로부터 개인의 위험에 주목한 기존 연구와 달리 교통사고 및 고속주행 상황에서의 안전을 의미하는 것으로 드러났다. 한국 사회의 SUV 소비는 개인이 운전하면서 느끼는 불안과 위험에 대한 대비 수단을 의미한다고 볼 수 있다는 것이다. 또한, 이와 같은 위험 인식 저변에는 불평등 증대로 인해 감소하는 타인에 대한 신뢰가 작동한다고 할 수 있다.

우울과 스트레스에 관한 국내 연구 분석 : 치료와 대상자를 중심으로 (Analysis of Domestic Research on Depression and Stress : Focused on the Treatment and Subjects)

  • 조남희;나은영
    • 융합정보논문지
    • /
    • 제7권6호
    • /
    • pp.53-59
    • /
    • 2017
  • 본 연구는 우울 및 스트레스와 관련된 국내 연구를 파악하기 위해 시도되었다. 분석대상은 2016년 11월 30일을 기준으로 우울, 스트레스 키워드로 검색된 1,875편의 국회도서관 등재 학위논문으로 하였다. 분석방법은 텍스트마이닝 기법의 하나인 워드 클라우드로 비정형 자료를 시각화하였다. 또한, 치료와 대상자를 분류하기 위해서는 잠재디리클레 할당(LDA), R의 LDA패키지를 사용하였다. 분석 결과, 치료 관련 키워드를 가지고 있는 논문은 전체 논문 중 233건(12.4%)이었다. 치료방법의 적용은 미술치료, 음악치료, 원예치료, 인지행동치료, 임상미술치료, 인지치료, 심리치료, 우울증치료, 집단치료, 웃음치료 순으로 나타났다. 연구 대상자는 청소년, 노인, 환자, 어머니, 아동, 여성, 부모, 대학생 순으로 나타났다. 청소년을 대상으로 한 LDA 토픽분석 결과 자아지지, 치료프로그램, 관계효과, 변인연구의 4개의 토픽으로 분류되었다. 본 연구 결과는 우울과 스트레스 관련 향후 연구에서 연구 대상자와 주제의 다양화 및 새로운 치료방법의 적용과 개발을 탐색하는 기초자료로 활용될 수 있을 것으로 기대된다.

웨이블릿 기반 LDA와 ICA의 선택적 융합에 의한 얼굴인식 (Wavelet Based Face Recognition using Selective LDA and ICA Fusion)

  • 민준오;고현주;전명근
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 춘계학술발표논문집 (하)
    • /
    • pp.2065-2068
    • /
    • 2003
  • 본 논문은 복합적인 상황을 고려한 데이터를 이용하여 얼굴인식을 하는 연구로서, 이산 웨이블렛을 기반으로 하는 다 해상도 분석 방법을 사용하고, 각 해상도에서 얻어진 계수를 이용하여 LDA와 ICA기법을 융합하는 방법을 제안한다. 기존의 얼굴인식방법은 정면에서 바라본 임의의 얼굴영상을 이용하므로, 예상하지 못한 얼굴 로션 변화에 대한 고려와 빛의 변화에 대해 고려하지 못했었다. 그러나, 본 연구에서는 다양한 상황을 고려한 데이터를 취득하여 해상도 별로 분리된 대역에 FLD와 ICA를 선택적으로 융합한 알고리즘을 적용하므로서 인식율을 높일 수 있었다

  • PDF

Labeled LDA를 이용한 저자 주제어 추천 (Applying Labeled LDA to Author Keywords Recommendation)

  • 봉성용;황규백
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2010년도 한국컴퓨터종합학술대회논문집 Vol.37 No.1(C)
    • /
    • pp.385-389
    • /
    • 2010
  • 논문에 부여되는 저자 주제어(author keyword)는 논문을 분류 및 검색하는데 활용될 수 있다. 이렇게 주제어를 부여할 때 자동으로 저자 주제어를 추천한다면 사용자에게 편리성을 제공하고 저자가 직접 부여한 저자 주제어 이외에 추가적으로 주제어가 있는지도 확인할 수 있어 유용하다. 본 연구에서는 논문에 달려있는 다수의 주제어 중 하나의 주제어를 선별하여 Labeled LDA를 이용해 주제어와 초록(abstract)의 관계를 학습했다. 이후 초록이 주어지면 자동으로 저자 주제어를 부여할 수 있도록 추천하는 기법을 제안하고 그에 따른 실험을 진행했다. 본 논문에서는 실험을 통하여 기계학습을 이용한 저자 주제어의 추천이 어느 정도의 성능을 보이는지 평가하고 향후 연구의 방향을 제시한다.

  • PDF

토픽모델링 기법을 활용한 산업별 직무만족요인 비교 조사 : 잡플래닛 리뷰를 중심으로 (Comparative Analysis of Job Satisfaction Factors, Using LDA Topic Modeling by Industries : The Case Study of Job Planet Reviews)

  • 김동욱;강주영;임재익
    • 한국IT서비스학회지
    • /
    • 제15권3호
    • /
    • pp.157-171
    • /
    • 2016
  • As unemployment rates and concerns about turnover keep growing, the need for information is also increasing. In these situations, the job reviews which share information about the company catch people's attention because they are usually created by people who worked at the company. The development of SNS and mobile environments has led to an increase in the web services that provide job reviews. For example, Jobplanet is a job review service in Korea, and Glassdoor.com offers a similar service in the US. Despite this attention, however, research utilizing job reviews is insufficient. This paper asks whether there are differences in ratios of job satisfaction factors by industry, using LDA topic modeling and co-occurrence analysis to explore the differences. Through the results of LDA, we find that the ratios of job satisfaction factors are similar by industry. At the same time, the results of co-occurrence analysis show that the co-occurrence frequency of some job satisfaction factors appears high: pay and welfare, balance of work and life, company culture. We expect that the result of this research will be helpful in comparative analysis of job satisfaction factors by industry. Furthermore, in this paper we suggest how to use the job review data in organizational behavior research.