• Title/Summary/Keyword: 정보 모델

Search Result 23,596, Processing Time 0.047 seconds

Neural Question Difficulty Estimator with Bi-directional Attention in VideoQA (비디오 질의 응답 환경에서 양방향 어텐션을 이용한 질의 난이도 분석 모델)

  • Yoon, Su-Hwan;Park, Seong-Bae
    • Annual Conference on Human and Language Technology
    • /
    • 2020.10a
    • /
    • pp.501-506
    • /
    • 2020
  • 질의 난이도 분석 문제는 자연어 질의문을 답변할 때 어려움의 정도를 측정하는 문제이다. 질의 난이도 분석 문제는 문서 독해, 의학 시험, 비디오 질의 등과 같은 다양한 데이터셋에서 연구되어 왔다. 본 논문에서는 질의문과 질의문에 응답하기 위한 정보들 간의 관계를 파악하는 것으로 질의 난이도 분석 문제를 접근하여 이를 BERT와 Dual Multi-head Attention을 사용하여 모델링 하였다. 본 논문에서 제안하는 모델의 우수성을 증명하기 위하여 최근 자연언어이해 부분에서 높은 성능을 보여주는 기 학습 언어 모델과 이전 연구의 질의 난이도 분석 모델과의 성능을 비교하였고, 제안 모델은 대표적인 비디오 질의 응답 데이터셋인 DramaQA의 Memory Complexity에서 99.76%, Logical Complexity에서는 89.47%의 정확도로 가장 높은 질의 난이도 분석 성능을 보여주었다.

  • PDF

Deep Learning-based Stock Price Prediction Using Limit Order Books and News Headlines (호가창(Limit Order Book)과 뉴스 헤드라인을 이용한 딥러닝 기반 주가 변동 예측)

  • Ryoo, Euirim;Kim, Chaehyeon;Lee, Ki Yong
    • Annual Conference of KIPS
    • /
    • 2021.11a
    • /
    • pp.541-544
    • /
    • 2021
  • 본 논문은 어떤 기업의 주식 주문 정보를 담고 있는 호가창(limit order book)과 해당 기업과 관련된 뉴스 헤드라인을 사용하여 해당 기업의 주가 등락을 예측하는 딥러닝 기반 모델을 제안한다. 제안 모델은 호가창의 중기 변화와 단기 변화를 모두 고려하는 한편, 동기간 발생한 뉴스 헤드라인까지 예측에 고려함으로써 주가 등락 예측 정확도를 높인다. 제안 모델은 호가창의 변화의 특징을 CNN(convolutional neural network)으로 추출하고 뉴스 헤드라인을 Word2vec으로 생성된 단어 임베딩 벡터를 사용하여 나타낸 뒤, 이들 정보를 결합하여 특정 기업 주식의 다음 날 등락여부를 예측한다. NASDAQ 실데이터를 사용한 실험을 통해 제안 모델로 5개 종목(Amazon, Apple, Facebook, Google, Tesla)의 일일 주가 등락을 예측한 결과, 제안 모델은 기존 방법에 비해 정확도를 최대 17.14%, 평균 10.7% 향상시켰다.

Learning Unified and Robust Representations across Various Tasks within a Federated Learning Environment (연합 학습 환경에서 통합되고 강인한 다중 작업 학습 기법)

  • Ankit Kumar Singh;Subeen Choi;Bong Jun Choi
    • Annual Conference of KIPS
    • /
    • 2024.05a
    • /
    • pp.798-800
    • /
    • 2024
  • 현대의 머신러닝 환경에서는 특히 모바일 컴퓨팅 및 사물 인터넷(IoT)의 애플리케이션 영역에서 개인 정보를 보호하고 효율적이며 확장 가능한 모델에 대한 관심이 높아지고 있다. 본 연구는 연합 학습(FL)과 자기지도 학습(self-supervised learning)을 결합하여 이질적(heterogeneous)인 분산 자원에서 레이블이 없는 데이터를 활용하면서 사용자의 개인 정보를 보호하는 새로운 프레임워크를 소개한다. 이 프레임워크의 핵심은 SimCLR 과 같은 자기지도 학습 기법으로 학습된 공유 인코더로, 입력 데이터에서 고수준 특성을 추출하도록 설계되었다. 또한 이 구조를 통해 주석(annotation)이 없는 방대한 데이터셋을 활용하여 모델 성능을 향상시키고, 여러 개의 격리된 모델이 필요하지 않아 리소스를 크게 최적화할 수 있는 가능성을 확인했다. 본 연구를 통해 생성된 모델은 중앙 집중 방식(CL)이면서 자기지도학습으로 학습되지 않은 기존 모델과 비교하여 전체 평균 정확도가 14.488% 향상됐다.

Developing an Information Validation System for Integrated AEC/FM Systems using Building Information Modeling Standards (건축 정보 모델 표준을 적용한 정보시스템 통합을 위한 검증 도구 개발)

  • Han, Shocky
    • Proceedings of the Computational Structural Engineering Institute Conference
    • /
    • 2009.04a
    • /
    • pp.344-347
    • /
    • 2009
  • 건축, 토목 분야의 정보 교환을 위한 표준으로 주목받고 있는 BIM 모델의 국제 표준인 IFC 표준을 위해, 소프트웨어가 IFC 표준에 맞게 유효한 정보를 입출력 하도록 도와주고, IFC 파일이 표준에 맞는지 검증할 수 있는 모듈을 개발했다. 특히, 지역별 및 국가별 상황에 맞게 BIM 모델을 수정하거나 확장해 사용하도록 권고하고 있는 상황에서 다양한 확장 IFC 표준을 효과적으로 지원할 수 있도록 IFC 표준을 정의하는 EXPRESS 언어로부터, 객체 지향 언어를 위한 소프트웨어 개발 라이브러리를 자동으로 생성하고, 해당 SDK를 활용해 IFC 모델을 검증하는 라이브러리를 자동으로 생성하며, IFC 파일을 검증할 수 있는 독립적인 실행 파일도 자동으로 생성할 수 있도록 했다. 또한 객체 지향 라이브러리를 사용함으로써 주어진 IFC 모델을 효과적으로 문서화 할 수 있도록 HTML 생성 도구를 개발하거나 3차원 형상 확인이 가능하도록 VRML 생성 도구를 개발하는 등의 작업이 쉽게 이뤄짐을 확인했다. 이렇게 자동화된 BIM 소프트웨어 개발 도구는 IFC 모델의 수정이나 확장을 고려하는 BIM 소프트웨어 개발 프로젝트의 생산성을 향상시키고, 해당 시스템의 운영에 신뢰도를 높이는 것은 물론이며, 향후 국내 실정에 맞게 운영될 BIM 인증 제도에도 활용하면 기존의 수작업 방식 인증제도에 비해 인증에 걸리는 시간과 비용을 줄이는 것은 물론 인증 자체의 객관성과 정확성, 투명성과 신뢰성을 높일 수 있을 것으로 기대된다.

  • PDF

Informatics Network Representation Using Probabilistic Graphical Models of Network Genetics (유전자 네트워크에서 확률적 그래프 모델을 이용한 정보 네트워크 추론)

  • Ra Sang-Dong;Park Dong-Suk;Youn Young-Ji
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.10 no.8
    • /
    • pp.1386-1392
    • /
    • 2006
  • This study is a numerical representative modelling analysis for applying the process that unravels networks between cells in genetics to WWW of informatics. Using the probabilistic graphical model, the insight from the data describing biological networks is used for making a probabilistic function. Rather than a complex network of cells, we reconstruct a simple lower-stage model and show a genetic representation level from the genetic based network logic. We made probabilistic graphical models from genetic data and extends them to genetic representation data in the method of network modelling in informatics.

Statistical Generation of Korean Chatting Sentences Using Multiple Feature Information (복합 자질 정보를 이용한 통계적 한국어 채팅 문장 생성)

  • Kim, Jong-Hwan;Chang, Du-Seong;Kim, Hark-Soo
    • Korean Journal of Cognitive Science
    • /
    • v.20 no.4
    • /
    • pp.421-437
    • /
    • 2009
  • A chatting system is a computer program that simulates conversations between a human and a computer using natural language. In this paper, we propose a statistical model to generate natural chatting sentences when keywords and speech acts are input. The proposed model first finds Eojeols (Korean spacing units) including input keywords from a corpus, and generate sentence candidates by using appearance information and syntactic information of Eojeols surrounding the found Eojeols. Then, the proposed model selects one among the sentence candidates by using a language model based on speech act information, co-occurrence information between Eojeols, and syntactic information of each Eojeol. In the experiment, the proposed model showed the better correct sentence generation rate of 86.2% than a previous conventional model based on a simple language model.

  • PDF

A Study on Document Retrieval of Web Using Relevance Feedback (적합성 피드백을 이용한 웹 문서검색에 관한 연구)

  • 김영천;이성주
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.5 no.3
    • /
    • pp.597-604
    • /
    • 2001
  • In conventional boolean retrieval systems, document ranking is not supported and similarity coefficients cannot be computed between queries and documents. The MMM, Paice and P-norm models have been proposed in the past to support the ranking facility for boolean retrieval systems. They have common properties of interpreting boolean operators softly. In this paper we propose a new soft evaluation method for Information retrieval using query splitting relevance feedback model. We also show through performance comparison that query splitting relevance feedback(QSRF) is more efficient and effective than MMM, Paice and P-norm.

  • PDF

Development of Interface for the Agricultural Non-point Source Model Geo-Spatial Information System (지형공간 정보체계를 이용한 농업비점오염원모델의 인터페이스 개발)

  • 양인태;최연재;김동문;권혁원
    • Journal of the Korean Society of Surveying, Geodesy, Photogrammetry and Cartography
    • /
    • v.17 no.4
    • /
    • pp.393-401
    • /
    • 1999
  • Non-point source pollution poses a serious threat to river. therefore non-point pollution model was developed. This non-point pollution model requires detailed spatial data for accurate predictions Geo-spatial Information System(GSIS) is well suited to those needs. The parameters for these models provided by the GSIS were slope, slope shape, field slope length and SCS run off curve number. Hence, this study presents an application of GSIS processing tools for AGNPS model developed by the ARS(Agricultural Research Service) in cooperation with the MPCA(Minnesota Pollution Control Agency) and has developed interface that construct the input data of ASCII type in the AGNPS model using GSIS.

  • PDF

A Study on the Stereo Image Matching using MRF model and segmented image (MRF 모델과 분할 영상을 이용한 영상정합에 관한 연구)

  • 변영기;한동엽;김용일
    • Proceedings of the Korean Association of Geographic Inforamtion Studies Conference
    • /
    • 2004.03a
    • /
    • pp.511-516
    • /
    • 2004
  • 수치표고모델, 정사영상과 같은 공간영상정보를 구축하기 위해서는 입체영상을 이동한 영상정합(image matching)의 과정이 필수적이며, 단영상 또는 스테레오 영상을 이용하여 대상물의 3차원 정보를 재구성하고 복원하는 기술은 사진측량 및 컴퓨터 비전 분야의 주요 연구 중의 하나이다. 본 연구에서는 화소값의 유사성과 상호관계성을 고려하는 MRF 모델을 이용하여 영상정합을 수행하였다. MRF 모델은 공간분석이나 물리적 현상의 전후관계(contextural dependencies)의 분석을 위한 확률이론의 한 분야로 다양한 공간정보를 통합할 수 있는 방법을 제공한다. 본 연구에서는 기준영상의 화소에 시차를 할당하는 접근 방법으로 확률모델의 일종인 마르코프 랜덤필드(MRF)모델에 기반한 영상정합기법을 제안하였고, 공간내 화소의 상호관계를 고려해주므로 대상물의 경계부분에서의 매칭 정확도를 향상시켰다. 영상정합문제에서의 MRF 기본가정은 영상 내 특정화소의 시차는 그 주위화소의 시차에 의한 부분정보에 따라 결정이 가능하다는 것이다. 깁스분포(gibbs distribution)를 사용하여 사후(posteriori) 확률값을 유도해내고, 이를 최대사후확률(MAP: Maximum a Posteriori)추정법을 이용하여 에너지함수를 생성하였다. 생성된 에너지함수의 최적화(Optimization)를 위하여 본 연구에서는 전역최적화기법인 multiway cut 기법을 사용하여 영상정합에 있어 에너지함수를 최소로 하는 이미지화소에 대한 시차레이블을 구하여 영상정합을 수행하였다.

  • PDF

Intensity Information and Curve Evolution Based Active Contour Model (밝기 정보와 곡선전개 기반의 활성 모델)

  • Kim, Seong-Kon
    • The KIPS Transactions:PartB
    • /
    • v.10B no.5
    • /
    • pp.521-526
    • /
    • 2003
  • In this paper, we propose a geometric active contour model based on intensity information and curve evolution for detecting region boundaries. We put boundary extraction problem as the minimization of the difference between the average intensity of the region and the intensity of the expanding closed curves. We used level set theory to implement the curve evolution for optimal solution. It offered much more freedom in the initial curve position than a general active contour model. Our methods could detect regions whose boundaries are not necessarily defiened by gradient compared to general edge based methods and detect multiple boundaries at the same time. We could improve the result by using anisotropic diffusion filter in image preprocessing. The performance of our model was demonstrated on several data sets like CT and MRI medical images.