• 제목/요약/키워드: Retrieval Model

검색결과 815건 처리시간 0.025초

정보검색 기법과 동적 보간 계수를 이용한 N-gram 언어모델의 적응 (N- gram Adaptation Using Information Retrieval and Dynamic Interpolation Coefficient)

  • 최준기;오영환
    • 대한음성학회지:말소리
    • /
    • 제56호
    • /
    • pp.207-223
    • /
    • 2005
  • The goal of language model adaptation is to improve the background language model with a relatively small adaptation corpus. This study presents a language model adaptation technique where additional text data for the adaptation do not exist. We propose the information retrieval (IR) technique with N-gram language modeling to collect the adaptation corpus from baseline text data. We also propose to use a dynamic language model interpolation coefficient to combine the background language model and the adapted language model. The interpolation coefficient is estimated from the word hypotheses obtained by segmenting the input speech data reserved for held-out validation data. This allows the final adapted model to improve the performance of the background model consistently The proposed approach reduces the word error rate by $13.6\%$ relative to baseline 4-gram for two-hour broadcast news speech recognition.

  • PDF

A Sketch-based 3D Object Retrieval Approach for Augmented Reality Models Using Deep Learning

  • 지명근;전준철
    • 인터넷정보학회논문지
    • /
    • 제21권1호
    • /
    • pp.33-43
    • /
    • 2020
  • Retrieving a 3D model from a 3D database and augmenting the retrieved model in the Augmented Reality system simultaneously became an issue in developing the plausible AR environments in a convenient fashion. It is considered that the sketch-based 3D object retrieval is an intuitive way for searching 3D objects based on human-drawn sketches as query. In this paper, we propose a novel deep learning based approach of retrieving a sketch-based 3D object as for an Augmented Reality Model. For this work, we introduce a new method which uses Sketch CNN, Wasserstein CNN and Wasserstein center loss for retrieving a sketch-based 3D object. Especially, Wasserstein center loss is used for learning the center of each object category and reducing the Wasserstein distance between center and features of the same category. The proposed 3D object retrieval and augmentation consist of three major steps as follows. Firstly, Wasserstein CNN extracts 2D images taken from various directions of 3D object using CNN, and extracts features of 3D data by computing the Wasserstein barycenters of features of each image. Secondly, the features of the sketch are extracted using a separate Sketch CNN. Finally, we adopt sketch-based object matching method to localize the natural marker of the images to register a 3D virtual object in AR system. Using the detected marker, the retrieved 3D virtual object is augmented in AR system automatically. By the experiments, we prove that the proposed method is efficiency for retrieving and augmenting objects.

독립적인 질의 경로들을 사용하여 이질적인 문서들을 검색하는 XML 문서 검색 모델 (XML Document Retrieval Models for Heterogeneous Data Set using Independent Regular paths)

  • 유신재;민경섭;김형주
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권1_2호
    • /
    • pp.140-152
    • /
    • 2003
  • XML 문서는 태그를 가지고 있고 이 태그가 중첩됨에 따라 구조를 나타낼 수 있다. XML 문서가 DTD를 가지지 않거나 여러 곳에서 XML 문서를 모았을 때 그 구조는 비정규적 일 수 있다. 사용자는 이러한 비정규적인 구조에 대해 잘 알기 어려우며 설사 잘 알고 있다고 하더라도 실수하기 쉽다. 특히 비정규적인 구조를 가지는 문서들에 대해 정확한 구조질의를 작성하는 것은 더욱 어렵다. 따라서 사용자는 구조가 없거나 있다 하더라도 적은 양의 구조정보 만을 기술하는 일반적인 질의를 작성하게 된다. 이런 환경에서 구조 정보를 이용하여 문서의 순위결정에 이용하고 사용자 구조 질의와 문서 구조간의 차이에 대해 보상해 주는 검색 모델을 제안한다. 질의 처리를 단순화하기 위하여 질의 경로간의 독립을 가정하였다 이 가정은 질의 언어의 표현능력의 저하를 가져올 수 있는데 이를 해결하는 질의 모델도 제시한다. 지금까지 어떤 문서를 위한 테스트 컬랙션이 없었기 때문에 TIPSTER 컬랙션에서 일부 문서를 추출하여 작은 테스트 컬랙션을 만들고 여기에 구조가 없는 질의를 수행하여 제시한 검색 모델의 유용성을 보였다. 실험 결과 벡터 모델에 비하여 평균 67%의 정확률 개선효과를 얻을 수 있었다.

재사용 시스템 개발을 위한 객체지향 검식 프레임워크 (Object-Oriented Retrieval Framework to Construct the Reuse-Supporting Systems)

  • 김정아;문충렬;김승태
    • 한국정보처리학회논문지
    • /
    • 제2권5호
    • /
    • pp.711-720
    • /
    • 1995
  • 본 논문에서는 라이브러리의 하부 표현 구조에 관계 없이 재사용 라이브러리로 부 터 소프트웨어 부품을 일관성 있게 저장하고 검색할 수 있도록 지원해주는 검책 프레 임워크를 객체지향 기법을 도입하게 제안하였다. 제안한 검색 프레임워크는 일관된 사 용자 인터페이스를 가능하도록 하기 위하여 시각적 영역에서 미리 정의한 간단한 시각 적 오퍼레이션을 통해 라이브러리에 저장한 부품에 대한 정보 객체를 검색할 수 있도 록 하였다. 이는 제안한 4I모델에 의해 가능하다. 또한 새로운 검색 메카니즘이나 분 류기법을 쉽게 추가할 수 있다. 본 논문에서는 객체지향 프레임워크 개발을 위한 4I 모델을 제안하고 이를 구성하는 각각의 구성 요소를 객체로 모델링하고 구현하였다.

  • PDF

제한적 문맥 인식과 다중 스트림을 기반으로 한 숫자 정정 OCR 모델의 설계 및 구현 (Design and Implementation of OCR Correction Model for Numeric Digits based on a Context Sensitive and Multiple Streams)

  • 신현경
    • 정보처리학회논문지D
    • /
    • 제18D권1호
    • /
    • pp.67-80
    • /
    • 2011
  • 재무 데이터 관리를 위한 자동화된 비지니스 서류 영상 처리 시스템에서 숫자 정보 검색 중 발생한 오류는 심각하여 그 시스템의 가용성 및 성능을 결정한다. 그 동안 자동 맞춤법 교정에 관한 방법론들이 개발되어 정보 검색 시스템 개발에 중요한 역할을 해왔으나 이러한 맞춤법 교정은 알파벳 등 기계학습이 가능하고 사전 형태로 보관이 가능한 기호에 한정되어왔다. 반면에 순수한 마코프 수열에 불과한 숫자들의 순열들은 맞춤법 교정을 위하여 사전적 형태로 보관하여 활용하는 것이 불가능 하다. 본 논문에서는 확률론적 정보 검색 알고리즘의 토대위에 제한적 문맥 인식과 복수의 스트림을 적용한 새로운 형태의 숫자 정정 OCR 모델을 제안하였다. 본 논문에서 제안된 숫자 정정 모델은 기존의 송장 문서 처리 시스템에 구현하였으며 제안된 숫자 정정 모델의 효과를 확인하기 위해 비교 테스트를 실행하였고 테스트 결과 상당한 성능이 개선되었음을 보여 주었다.

이중 셔틀 자동창고 시스템의 주행시간 모델에 관한 연구 (A Study on Travel Time Model of double shuttle AS/RS)

  • Chae-Soo Kim;Seong-Whan Shinn
    • 대한안전경영과학회지
    • /
    • 제3권3호
    • /
    • pp.97-106
    • /
    • 2001
  • This paper considers automated storage and retrieval systems with double shuttle. We developed the expected travel time model based on the first come first served rule. An heuristic procedure by retrieval order sequencing was presented which aimed to improve the operation efficiency laking advantage of "No cost zone". Through sensitivity study, we evaluated the performance of the double shuttle system working on the four command cycle.

  • PDF

노이즈에 강인한 음악 시작점 검출 알고리즘 (The Noise Robust Algorithm to Detect the Starting Point of Music for Content Based Music Retrieval System)

  • 김정수;성보경;구광효;고일주
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권9호
    • /
    • pp.95-104
    • /
    • 2009
  • 본 논문에서는 노이즈에 강인한 음악 시작점 검출 알고리즘을 제안한다. 음악의 시작점 검출은 음악을 이용한 신호처리 시스템에 있어서 일관되지 않은 입력데이터를 통한 계산낭비, 비교검색 등의 문제 해결을 위해 필요한 것이다. 특히 신호처리를 이용한 내용기반 음악검색 시스템에서 시간의 순서로 데이터를 비교하는 시간순차적 검색방법에서는 더욱 필요시 된다. 시간순차적 검색 방법은 시간의 순서로 단순 비교를 수행하기 때문에 검색의 속도가 빠르다는 장점이 있는 반면 비교하는 데이터의 시작 시간이 동일해야 하는 단점이 있다. 하지만 디지털화된 음악은 비트레이트 변환에 의한 시작 시간의 동일함을 보장할 수 없다. 따라서 본 논문에서는 검색의 전처리 단계에서 음악의 시작점을 검출함으로써 시간순차적 검색 방법을 적용하여 고속의 검색을 수행하면서도 인식률이 낮아지지 않게 하였다. 시작점 검출은 소리를 검출할 수 있는 최소 파형모형을 이용하였으며 노이즈에 강인하기 위하여 묵음에 존재하는 노이즈는 스킵핑을 하였다. 제안한 알고리즘은 실험을 통해 시작점 검출을 미적용한 결과보다 약 38% 성능이 향상됨을 확인하였으며 노이즈에 강인함을 검증하였다.

인용문헌에 의한 정보검색 효과에 관한 고찰 (A Study on Information Retrieval Effectiveness by Cited References)

  • 이란주
    • 한국문헌정보학회지
    • /
    • 제27권
    • /
    • pp.265-289
    • /
    • 1994
  • Databases publicly available for online searching permit both citation and subject searching, however, subject searching has dominated the online search environment. Despite the power of citation searching, it may be underutilized This study explored the relationship between the number of cited references used in a citation search and information retrieval effectiveness, a relatively unstudied phenomenon. Three articles in the library and information science literature were chosen to represent sample questions. Cited reference searches were conducted for each article and each of its references. All searches were conducted in Social Scisearch and Scisearch on DIALOG. Relevance judgments on the retrieved citations were obtained from the authors of the original articles. This research focused on analyzing, in terms of information retrieval effectiveness, the overlap among postings sets retrieved by various combinations of cited references. The findings from the three case studies clearly showed that the more cited references used for the citation search, the better the performance, in terms of retrieving more relevant documents, up to a point of diminishing retums. In addition, generally the overall level of overlap among relevant documents sets was found to be low. Therefore, if only some of the cited references among many candidates are used for a citation search, a significant proportion of relevant documents may be missed. The analysis of the characteristics of cited references provided the ways to predict which cited refereces would be useful to improve information retrieval. The findings of this comprehensive exploratory study are of interest for both theoretical and practical reasons. They contribute to the development of a theoretical model for the effective use of the citation search. This model might also be implemented in operational online systems. In addition, the findings potentially will help online searchers improve their search strategies using the citation search so that they can better achieve their information retrieval goals: the retrieval of items relevant to a given question and the suppression of nonrelevant items.

  • PDF

M/G/l 대기모델을 이용한 자동창고 시스템의 성능 평가 (Performance Estimation of AS/RS using M/G/1 Queueing Model with Two Queues)

  • 이문환;임시영;허선;이영해
    • 한국경영과학회:학술대회논문집
    • /
    • 한국경영과학회 2000년도 추계학술대회 및 정기총회
    • /
    • pp.59-62
    • /
    • 2000
  • Many of the previous researchers have been studied for the performance estimation of an AS/RS with a static model or computer simulation. Especially, they assumes that the storage/retrieval (S/R) machine performs either only single command (SC) or dual command (DC) and their requests are known in advance. However, the S/R machine performs a SC or a DC. or both or becomes idle according to the operating policy and the status of system at an arbitrary point of time. In this paper, we propose a stochastic model for the performance estimation of a unit-load AS/RS by using a M/G/1 queueing model with a single-server and two queues. Expected numbers of waiting storage and retrieval commands, and the waiting time in queues for the storage and retrieval commands are found

  • PDF

Automated Essay Grading: An Application For Historical Malay Text

  • Syed Mustapha, S.M.F.D;Idris, N.
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2001년도 The Pacific Aisan Confrence On Intelligent Systems 2001
    • /
    • pp.237-245
    • /
    • 2001
  • Automated essay grading has been proposed for over thirty years. Only recently have practical implementations been constructed and tested. This paper investigated the role of the nearest-neighbour algorithm within the information retrieval as a way of grading the essay automatically called Automated Essay Grading System. It intended to offer teachers an individualized assistance in grading the student\`s essay. The system involved several processes, which are the indexing, the structuring of the model answer and the grade processing. The indexing process comprised the document indexing and query processing which are mainly used for representing the documents and the query. Structuring the model answer is actually preparing the marking scheme and the grade processing is the process of assessing the essay. To test the effectiveness of the developed algorithms, the algorithms are tested against the History text in Malay. The result showed that th information retrieval and the nearest-neighbour algorithm are practical combination that offer acceptable performance for grading the essay.

  • PDF