• 제목/요약/키워드: Context Vector

검색결과 141건 처리시간 0.034초

한국어-영어/일본어-영어 교차언어정보검색에서 클러스터 분석을 통한 성능 향상 (Performance Improvement by Cluster Analysis in Korean-English and Japanese-English Cross-Language Information Retrieval)

  • 이경순
    • 정보처리학회논문지B
    • /
    • 제11B권2호
    • /
    • pp.233-240
    • /
    • 2004
  • 본 논문에서는 교차언어정보검색에서 점진적 클러스터링을 통해서 모호성을 묵시적으로 해소하는 방법을 제안한다. 연구 목적은 질의 번역에서 모호성이 크게 증가된 상태에서 문서 클러스터가 문서 문맥 역할과 모호성 해소 역할을 하는지를 보고자 하는 것이다. 제안하는 방법은 한국어/일본어 질의를 사전을 이용하여 영어로 번역을 하고, 번역된 영어 질의에 대해서 벡터공간검색모델이나 확률검색모델에 의해서 문서를 검색한다 검색된 문서의 순위대로 점진적 클러스터를 동적으로 생성하고, 이 클러스터 정보를 질의에 반영해서 문서의 순위를 다시 결정하는 것이다. TREC 테스트컬렉션을 이용한 실험에서 모호성 해소를 하지 않은 질의에 대해서, 제안한 방법은 한국어-영어 교차언어정보검색에서는 벡터공간검색모델에서 39.41%의 성능향상, 확률검색모델에서 36.79%의 성능향상을 보였다. 일-영 교차언어정보검색에서는 각각 17.59%와 30.46%의 성능향상을 보였다. 적합성 피드백 방법과의 비교에서는 모호성 해소를 하지 않은 경우 확률검색모델에서 12.30%의 성능향상을 보였다. 이를 통해, 클러스터 분석은 질의 모호성 해소에 도움을 주어서 검색성능 향상에 기여하였음을 알 수 있다.

LLM 애플리케이션 아키텍처를 활용한 생성형 AI 서비스 구현: RAG모델과 LangChain 프레임워크 기반 (Generative AI service implementation using LLM application architecture: based on RAG model and LangChain framework)

  • 정천수
    • 지능정보연구
    • /
    • 제29권4호
    • /
    • pp.129-164
    • /
    • 2023
  • 최근 생성형 AI 기술의 발전으로 인해 대형 언어 모델(Large Language Model, LLM)의 활용 및 도입이 확대되고 있는 상황에서 기존 연구들은 기업내부 데이터의 활용에 대한 실제 적용사례나 구현방법을 찾아보기 힘들다. 이에 따라 본 연구에서는 가장 많이 이용되고 있는 LangChain 프레임워크를 이용한 LLM 애플리케이션 아키텍처를 활용하여 생성형 AI 서비스를 구현하는 방법을 제시한다. 이를 위해 LLM의 활용을 중심으로, 정보 부족 문제를 극복하는 다양한 방법을 검토하고 구체적인 해결책을 제시하였다. 이를 위해 파인튜닝이나 직접 문서 정보를 활용하는 방법을 분석하며, 이러한 문제를 해결하기 위한 RAG 모델을 활용한 정보 저장 및 검색 방법에 대해 주요단계에 대해 자세하게 살펴본다. 특히, RAG 모델을 활용하여 정보를 벡터저장소에 저장하고 검색하기 위한 방법으로 유사문맥 추천 및 QA시스템을 활용하였다. 또한 구체적인 작동 방식과 주요한 구현 단계 및 사례를 구현소스 및 사용자 인터페이스까지 제시하여 생성형 AI 기술에 대한 이해를 높였다. 이를 통해 LLM을 활용한 기업내 서비스 구현에 적극적으로 활용할 수 있도록 하는데 의미와 가치가 있다.

증권신고서의 TF-IDF 텍스트 분석과 기계학습을 이용한 공모주의 상장 이후 주가 등락 예측 (The prediction of the stock price movement after IPO using machine learning and text analysis based on TF-IDF)

  • 양수연;이채록;원종관;홍태호
    • 지능정보연구
    • /
    • 제28권2호
    • /
    • pp.237-262
    • /
    • 2022
  • 본 연구는 개인투자자들의 투자의사결정에 도움을 주고자, 증권신고서의 TF-IDF 텍스트 분석과 기계학습을 이용해 공모주의 상장 5거래일 이후 주식 가격 등락을 예측하는 모델을 제시한다. 연구 표본은 2009년 6월부터 2020년 12월 사이에 신규 상장된 691개의 국내 IPO 종목이다. 기업, 공모, 시장과 관련된 다양한 재무적 및 비재무적 IPO 관련 변수와 증권신고서의 어조를 분석하여 예측했고, 증권신고서의 어조 분석을 위해서 TF-IDF (Term Frequency - Inverse Document Frequency)에 기반한 텍스트 분석을 이용해 신고서의 투자위험요소란의 텍스트를 긍정적 어조, 중립적 어조, 부정적 어조로 분류하였다. 가격 등락 예측에는 로지스틱 회귀분석(Logistic Regression), 랜덤 포레스트(Random Forest), 서포트벡터머신(Support Vector Machine), 인공신경망(Artificial Neural Network) 기법을 사용하였고, 예측 결과 IPO 관련 변수와 증권신고서 어조 변수를 함께 사용한 모델이 IPO 관련 변수만을 사용한 모델보다 높은 예측 정확도를 보였다. 랜덤 포레스트 모형은 1.45%p 높아진 예측 정확도를 보였으며, 인공신공망 모형과 서포트벡터머신 모형은 각각 4.34%p, 5.07%p 향상을 보였다. 추가적으로 모형간 차이를 맥니마 검정을 통해 통계적으로 검증한 결과, 어조 변수의 유무에 따른 예측 모형의 성과 차이가 유의확률 1% 수준에서 유의했다. 이를 통해, 증권신고서에 표현된 어조가 공모주의 가격 등락 예측에 영향을 미치는 요인이라는 것을 확인할 수 있었다.

파지 형태 인식을 통한 휴대 단말용 사용자 인터페이스 설계 (Designing Mobile User Interface with Grip-Pattern Recognition)

  • 장욱;김기응;이현정;조준기;소병석;심정현;양경혜;조성정;박준아
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2006년도 학술대회 1부
    • /
    • pp.678-683
    • /
    • 2006
  • 본 논문에서는 휴대 단말을 위한 새롭고 직관적인 응용 프로그램 구동 방식을 제안한다. 핵심 아이디어는 사용자가 휴대 단말을 사용할 때 자연스럽게 발생하는 파지 형태를 응용프로그램 구동의 근거로 활용하는 것이다. 이를 위해 정전 용량 방식 터치 센서 시스템을 제작하고 이를 휴대 단말의 케이스 하부에 장착을 해 사용자의 파지 형태를 취득한다. 획득된 파지 형태의 인식을 위해 제안한 시스템에 특화된 인식기 및 전처리와 후처리 알고리즘을 개발하였다. 제안된 사용자 인터페이스 시스템의 효용성을 검증하기 위해 인식률 테스트를 수행한다.

  • PDF

Delivery of Chicken Egg Ovalbumin to Dendritic Cells by Listeriolysin O-Secreting Vegetative Bacillus subtilis

  • Roeske, Katarzyna;Stachowiak, Radoslaw;Jagielski, Tomasz;Kaminski, Michal;Bielecki, Jacek
    • Journal of Microbiology and Biotechnology
    • /
    • 제28권1호
    • /
    • pp.122-135
    • /
    • 2018
  • Listeriolysin O (LLO), one of the most immunogenic proteins of Listeria monocytogenes and its main virulence factor, mediates bacterial escape from the phagosome of the infected cell. Thus, its expression in a nonpathogenic bacterial host may enable effective delivery of heterologous antigens to the host cell cytosol and lead to their processing predominantly through the cytosolic MHC class I presentation pathway. The aim of this project was to characterize the delivery of a model antigen, chicken egg ovalbumin (OVA), to the cytosol of dendritic cells by recombinant Bacillus subtilis vegetative cells expressing LLO. Our work indicated that LLO produced by non-sporulating vegetative bacteria was able to support OVA epitope presentation by MHC I molecules on the surface of antigen presenting cells and consequently influence OVA-specific cytotoxic T cell activation. Additionally, it was proven that the genetic context of the epitope sequence is of great importance, as only the native full-sequence OVA fused to the N-terminal fragment of LLO was sufficient for effective epitope delivery and activation of $CD8^+$ lymphocytes. These results demonstrate the necessity for further verification of the fusion antigen potency of enhancing the MHC I presentation, and they prove that LLO-producing B. subtilis may represent a novel and attractive candidate for a vaccine vector.

토지피복 변화: 1983~1994 아시아 지역의 특징 (Land Cover Change: A Regional Context, Asia, 1983~1994)

  • 성정창
    • 한국지리정보학회지
    • /
    • 제3권2호
    • /
    • pp.73-86
    • /
    • 2000
  • 이 연구에서는 월별 AVHRR-NDVI 합성자료와 벡터 자료와 통계 자료를 이용하여 아시아 지역의 각 국가별 토지피복 변화패턴을 분석하였다. 특히, 지표 식물에 대한 인간의 영향에 중점을 두고 NDVI의 변화를 분석하였다. 각 국가별 연평균 변화를 고찰한 결과, 고위도 지역과 중국 동부의 일부 지역과 북서 인도지역에서 NDVI의 증가 경향이 나타났다. NDVI의 감소 경향은 일본과 한국과 중국 동남부의 일부지역과 베트남과 라오스와 캄보디아와 태국과 미얀마와 인도 남서 및 동부의 일부 지역에서 나타났다. 이러한 토지피복 변화 패턴은 인간의 활동을 반영하는 사회경제적 지표들과 크게 일치하였으며, NDVI의 변화 추세는 삼림지역 변화추세와 매우 높은 상관관계를 보였다. 또한, 다중회귀분석 결과 NDVI 변화는 삼림지역의 변화와 인구변화에 민감함을 보였다.

  • PDF

사용자 프로파일을 이용한 개인화된 토픽맵 랭킹 알고리즘 (Personalized Topic map Ranking Algorithm using the User Profile)

  • 박정우;이상훈
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제35권8호
    • /
    • pp.522-528
    • /
    • 2008
  • 토픽맵에서 사용자의 토픽 선택에 따라 제공되는 정보는 개별 사용자의 관심과 배경지식이 고려되지 않고 최초 도메인 전문가에 의해 구축된 토픽맵 상의 토픽(Topic)과 연관되는 관계(Association), 자원(Occurrence)만을 이용하여 사용자에게 토픽맵 정보를 제공하고 있다. 이에 토픽맵은 개인화된 정보제공 측면의 단점을 보완하고자 개별 사용자를 위한 개인화 기능으로 개인 선호항목 설정, 필터링(Filtering), 범위제한(Scope) 등 사용자가 직접 관심정보를 사전에 설정하는 기능을 제공하고 있으나 토픽맵 사용자를 위한 개인화 측면에서 만족스럽지 못하다. 따라서 본 논문에서는 특정 도메인 토픽맵에서 사용자가 원하는 개인화된 정보를 제공하기 위해 사용자 클릭정보 수집을 통한 프로파일 정보와 이를 이용한 토픽 선호도 백터(Topic Preference Vector), 토픽맵 지식층의 기본요소인 토픽(Topic)과 관계(Association)를 이용한 개인화된 토픽맵 랭킹 알고리즘(PTR)을 제안한다. 사용자는 PTR 알고리즘을 이용하여 개인 선호도가 고려되어 랭킹된 토픽맵 정보를 제공받을 수 있게 됨으로써 개인화된 정보 제공 측면에서의 성능 향상을 가져올 수 있는 장점을 가진다.

Toward Research Collaboration Between Korea and Russia: KSGPC's Research Activities and Corporational Issues in Geomatics

  • KIM, Kam-Lea;LEE, Ho-Nam;KIM, Uk-Nam
    • Korean Journal of Geomatics
    • /
    • 제3권2호
    • /
    • pp.81-86
    • /
    • 2004
  • In recent years, the importance of geospatial data have been emphasized not only for the national GIS programs and but also in the value added commercial and industry markets. There is no doubt that GIS, GPS, aerial and satellite imagery data were provided powerful tools to support national information infrastructure for geospatial database. While great emphasis has been laid on the geospatial data, there has been little analysis or evaluation of how to maximize the benefits of using these information sources. Also, with the proliferation of geographic data and information sources such as satellite imagery, digital aerial photograph, digital topographic and vector data, there is a great need to inform professionals from all disciplines as to the benefits of these information sources and how to best put them to use within any given application. From the first publication of KSGPC(Korean Society of Geodesy, Photogrammetry and Cartography) papers in 1981, our objective was, and is, to help develop the wider spectrum of GIS in the academy and industry by exposing new users to the benefits of GIS, remote sensing, mapping, GPS and photogrammetry. In this presentation, we will introduce KSGPC works and will evaluate GIS-related governmental policies and programs in Korea for the past and the future to present different status between Korea and Russia. It is now important to investigate lessons learnt from two countries' experiences and developed an empirical framework to combine outcome from GIS-related researches in Korea and Russia. This may enable GIS professionals to gain a wider range of experiences in the international context, and consequently, help them to develop new markets for GIS. Therefore, we arranged the possible action items and interesting points to corporate and to promote the academic growth in the practice of GIS.

  • PDF

Structural failure classification for reinforced concrete buildings using trained neural network based multi-objective genetic algorithm

  • Chatterjee, Sankhadeep;Sarkar, Sarbartha;Hore, Sirshendu;Dey, Nilanjan;Ashour, Amira S.;Shi, Fuqian;Le, Dac-Nhuong
    • Structural Engineering and Mechanics
    • /
    • 제63권4호
    • /
    • pp.429-438
    • /
    • 2017
  • Structural design has an imperative role in deciding the failure possibility of a Reinforced Concrete (RC) structure. Recent research works achieved the goal of predicting the structural failure of the RC structure with the assistance of machine learning techniques. Previously, the Artificial Neural Network (ANN) has been trained supported by Particle Swarm Optimization (PSO) to classify RC structures with reasonable accuracy. Though, keeping in mind the sensitivity in predicting the structural failure, more accurate models are still absent in the context of Machine Learning. Since the efficiency of multi-objective optimization over single objective optimization techniques is well established. Thus, the motivation of the current work is to employ a Multi-objective Genetic Algorithm (MOGA) to train the Neural Network (NN) based model. In the present work, the NN has been trained with MOGA to minimize the Root Mean Squared Error (RMSE) and Maximum Error (ME) toward optimizing the weight vector of the NN. The model has been tested by using a dataset consisting of 150 RC structure buildings. The proposed NN-MOGA based model has been compared with Multi-layer perceptron-feed-forward network (MLP-FFN) and NN-PSO based models in terms of several performance metrics. Experimental results suggested that the NN-MOGA has outperformed other existing well known classifiers with a reasonable improvement over them. Meanwhile, the proposed NN-MOGA achieved the superior accuracy of 93.33% and F-measure of 94.44%, which is superior to the other classifiers in the present study.

신호 패턴 매칭 방법을 이용한 이동체 위치 인식 (Object Location Sensing using Signal Pattern Matching Methods)

  • 변영철;박상열
    • 한국멀티미디어학회논문지
    • /
    • 제10권4호
    • /
    • pp.548-558
    • /
    • 2007
  • 본 논문에서는 RF 단말의 신호를 분석하여 이동체 위치를 인식하기 위한 방법에 대하여 제안한다. 고정되어 있는 여러 개의 RF 단말과 이동 RF 단말 간의 신호를 분석함으로써 이동 RF 단말의 위치를 실시간으로 인식한다. 이를 위하여 고정되어 있는 n 개의 RF 단말과 특정 위치에 있는 이동 RF 단말 간의 신호 세기 데이터를 획득하여 특징 벡터를 구한 후 모형으로 저장한다. 인식하고자 하는 모든 위치에 대하여 이러한 특징 벡터를 구함으로써 학습이 완료된다. 임의의 위치에 이동 단말이 있을 경우 고정되어 있는 단말 간의 신호 정보를 구하고 이를 사전에 등록한 모형과 비교함으로써 위치를 인식할 수 있다. 실제 주차장에서 위치인식 실험을 한 결과 고정 노드의 수가 10개 이상일 경우 100%의 인식률을 얻을 수 있었다. 본 연구에서 제안하는 방법은 네트워크 인프라가 필요하지 않음은 물론 RF 단말의 가격이 저렴하기 때문에 비용 및 성능측면에서 효과적으로 시스템을 구축할 수 있다.

  • PDF