• 제목/요약/키워드: truncation search

검색결과 9건 처리시간 0.021초

절단검색을 지원하는 전자사전 구조 (An Electronic Dictionary Structure supporting Truncation Search)

  • 김철수
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제9권1호
    • /
    • pp.60-69
    • /
    • 2003
  • 역화일을 파일구조로 이용하는 정보 검색 시스템에서는 검색자가 검색할 분야의 완전 단어를 알고 있어야 검색이 가능하다. 그러나 검색자가 완전 단어가 아닌 단어의 부분 문자열을 알고 있는 경우가 많다. 이럴 경우 부분 문자열을 포함하는 색인어들을 검색할 수 있다면 관련 문서들을 검색할 수 있다. 또한 검색된 문헌 수가 너무 적을 경우 부분 문자열을 포함하는 단어를 색인어로 가지는 모든 문서들을 검색하기 위한 방법이 필요하다. 이런 요건들을 충족시키기 위해서는 사용자는 용어 절단 방법을 이용하여 질의어를 구성할 수 있어야 하고, 검색 시스템은 절단 검색을 지원할 수 있는 전자 사전이 필요하다. 본 논문에서는 절단검색을 효율적으로 지원할 수 있는 전자 사전 구조를 설계하고 구현한다. 이 전자 사전은 저장된 단어 수에 관계없이 주어진 한 개의 단어 검색 시간 및 역 문자열로 구성된 단어 검색 시간이 빠르고 일정하다. 절단검색을 효율적으로 지원하기 위하여 트라이 구조를 이용하였으며, 빠른 검색 시간을 지원하기 위해 배열을 이용한 방법을 사용하였다. 절단된 용어의 검색 과정에서 확장할 문자열의 길이를 최소화하여 검색 시간을 줄였다.

온라인 목록 검색 행태에 관한 연구-LINNET 시스템의 Transaction log 분석을 중심으로-

  • 윤구호;심병규
    • 한국도서관정보학회지
    • /
    • 제21권
    • /
    • pp.253-289
    • /
    • 1994
  • The purpose of this study is about the search pattern of LINNET (Library Information Network System) OPAC users by transaction log, maintained by POSTECH(Pohang University of Science and Technology) Central Library, to provide feedback information of OPAC system design. The results of this study are as follows. First, for the period of this analysis, there were totally 11, 218 log-ins, 40, 627 transaction logs and 3.62 retrievals per a log-in. Title keyword was the most frequently used, but accession number, bibliographic control number or call number was very infrequently used. Second, 47.02% of OPAC, searches resulted in zero retrievals. Bibliographic control number was the least successful search. User displayed 2.01% full information and 64.27% local information per full information. Third, special or advanced retrieval features are very infrequently used. Only 22.67% of the searches used right truncation and 0.71% used the qualifier. Only 1 boolean operator was used in every 22 retrievals. The most frequently used operator is 'and (&)' with title keywords. But 'bibliographical control number (N) and accessionnumber (R) are not used at all with any operators. The causes of search failure are as follows. 1. The item was not used in the database. (15, 764 times : 79.42%). 2. The wrong search key was used. (3, 761 times : 18.95%) 3. The senseless string (garbage) was entered. (324 times : 1.63%) On the basis of these results, some recommendations are suggested to improve the search success rate as follows. First, a n.0, ppropriate user education and online help function let users retrieve LINNET OPAC more efficiently. Second, several corrections of retrieval software will decrease the search failure rate. Third, system offers right truncation by default to every search term. This methods will increase success rate but should considered carefully. By a n.0, pplying this method, the number of hit can be overnumbered, and system overhead can be occurred. Fourth, system offers special boolean operator by default to every keyword retrieval when user enters more than two words at a time. Fifth, system assists searchers to overcome the wrong typing of selecting key by automatic korean/english mode change.

  • PDF

Adaptive Truncation technique for Constrained Multi-Objective Optimization

  • Zhang, Lei;Bi, Xiaojun;Wang, Yanjiao
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제13권11호
    • /
    • pp.5489-5511
    • /
    • 2019
  • The performance of evolutionary algorithms can be seriously weakened when constraints limit the feasible region of the search space. In this paper we present a constrained multi-objective optimization algorithm based on adaptive ε-truncation (ε-T-CMOA) to further improve distribution and convergence of the obtained solutions. First of all, as a novel constraint handling technique, ε-truncation technique keeps an effective balance between feasible solutions and infeasible solutions by permitting some excellent infeasible solutions with good objective value and low constraint violation to take part in the evolution, so diversity is improved, and convergence is also coordinated. Next, an exponential variation is introduced after differential mutation and crossover to boost the local exploitation ability. At last, the improved crowding density method only selects some Pareto solutions and near solutions to join in calculation, thus it can evaluate the distribution more accurately. The comparative results with other state-of-the-art algorithms show that ε-T-CMOA is more diverse than the other algorithms and it gains better in terms of convergence in some extent.

A Study of the Relationship Between Cognitive Ability and Information Searching Performance

  • Kim, Chang-Suk
    • 한국도서관정보학회지
    • /
    • 제35권1호
    • /
    • pp.303-317
    • /
    • 2004
  • The purpose of this study was to develop a framework for predicting searching performance through an understanding of how cognitive ability relates to searching process and outcome. Specifically, this study examined the relationship between spatial visualization, logical reasoning, integrative reasoning, and information searching process and outcome. Information searching process was assessed by seven search process indicators: (1) search command selection: (2) combination of search commands; (3) application of Boolean logic: (4) application of truncation; (5) use of limit search function; (6) number of search statements; and (7) number of search errors made. Searching outcome was assessed by the number of correct answers to search questions. Subjects first took three standardized cognitive tests that measured cognitive abilities, and performed online catalog searching in response to seven information search questions. The searches were logged using Lotus ScreenCam, and reviewed for the analysis. Factor analysis was used to find underlying structures of the seven search process variables. Multiple regression analysis was applied to examine the predictive power of three cognitive variables on three extracted factors, and search outcome. Results of the data analysis showed that individual differences in logical reasoning could predict information searching process and outcome.

  • PDF

OPAC에 있어서 키워드/불연산자 탐색에 대한 이용자 지식수준 연구 (Knowledge Level of Users of Keyword/Boolean Searching on an Online Public Access Catalog : SELIS)

  • 구본영
    • 한국문헌정보학회지
    • /
    • 제32권4호
    • /
    • pp.249-274
    • /
    • 1998
  • SELIS(SEoul Women's University Library and Information System) OPAC에 대한 이용자의 키워드/불연산자 탐색의 지식수준을 알아보기 위하여 4가지 사항에 따라 질문지의 결과를 분석하였다. 분석한 결과를 보면 SELIS OPAC 이용시 키워드 탐색에서 불연산자의 사용이 쉽다고 생각하고 불연산자의 사용으로 검색결과를 만족하는 이용자는 그렇지 않다고 응답한 이용자 보다 키워드/불연산 탐색의 지식수준이 높은 것으로 요약할 수 있다. 설문문항에서 제시한 지식은 키워드 탐색의 특성(단일 키워드 사용, 2개 이상의 키워드 사용), 키워드 탐색 시 불연산자의 사용, 색인에 대한 지식, 불용어 리스트에 대한 지식(비통제 용어) 키워드 탐색기법(전방일치, 우측절단). 불연산자의 올바른 사용, 키워드의 브라우징으로 주제어 선정에 관한 것이다. 앞에서 제시한 이러한 지식들은 OPAC의 키워드/불연산자 탐색에서 중요한 요소로 볼 수 있다. 성공적인 탐색을 위해서는 정보검색과정에 대한 개념적인 지식 즉, 정보요구를 탐색 가능한 질의어로 바꾸는 것과 주어진 시스템에서 질문의 결과를 얻는 방법에 대한 어의적인 지식(시스템의 특징을 어떻게 언제 이용할 것인가 하는 지식) 그리고 이용자의 질문에 대한 과학적인 기술 즉, 기본적인 컴퓨터 기술과 상세한 탐색문을 작성하는 구문론적인 지식이 요구된다. 그러나 지금까지 이용자에 대한 온라인목록 탐색의 중요한 지식으로 간주해온 것은 과학적인 기술방법에 관한 지식에만 치중하고 어의적인 지식, 개념적인 지식을 강조하는 것은 부족하였다. 따라서 온라인목록 이용에 관한 교육을 너무 과학적인 기법에만 치중할 것이 아니라 어의적 지식, 구문에 관한 기술과 개념적인 지식 교육에 초점을 맞추어야 할 것이다.

  • PDF

직업교육 데이터베이스 VOCED의 검색기법 연구 (A Study on Information Retrieval Techniques of VOCED Database)

  • 김순원
    • 정보관리연구
    • /
    • 제27권1호
    • /
    • pp.40-65
    • /
    • 1996
  • 본고에서는 VOCED 데이터베이스의 정보검색기법을 살펴보았다. VOCED 데이터베이스를 직업 교육 및 훈련, 그러고 성인교육분야와 관련된 국제적인 정보를 수록하고 있다. VOCED는 CDS/ISIS 소프트웨어를 통해 구축되었으며, 레코드는 APSDEP 시소러스를 사용하여 색인되었다. VOCED 데이터베이스의 정보검색시에는 여러가지 검색기법들을 사용할 수 있다. 다수용어, 구문, 불리안 논리, 용어절단, 제한탐색 및 인접탐색기법 등을 통해 원하는 정보에 신속히 접근할 수 있다.

  • PDF

내용기반 음악검색 시스템의 비교 분석 (A Comparative Analysis of Content-based Music Retrieval Systems)

  • 노정순
    • 정보관리학회지
    • /
    • 제30권3호
    • /
    • pp.23-48
    • /
    • 2013
  • 본 연구는 웹에서 접근 가능한 내용기반 음악검색(CBMR) 시스템들을 조사하여, 탐색질의의 종류, 접근점, 입출력, 탐색기능, 데이터베이스 성격과 크기 등의 관점에서 특성을 비교 분석하고자 하였다. 비교 분석에 사용된 특성을 추출하기 위해 내용기반 음악정보의 특성과 시스템 구축에 필요한 파일의 변환, 멜로디 추출 및 분할, 색인자질 추출과 색인, 매칭에 사용되는 기술들을 선행연구로 리뷰하였다. 15개의 시스템을 분석한 결과 다음과 같은 특성과 문제점이 분석되었다. 첫째, 도치색인, N-gram 색인, 불리언 탐색, 용어절단검색, 키워드 및 어구 탐색, 음길이 정규화, 필터링, 브라우징, 편집거리, 정렬과 같은 텍스트 정보 검색 기법이 CBMR에서도 검색성능을 향상시키는 도구로 사용되고 있었다. 둘째, 시스템들은 웹에서 크롤링하거나 탐색질의를 DB에 추가하는 등으로 DB의 성장과 실용성을 위한 노력을 하고 있었다. 셋째, 개선되어야 할 문제점으로 선율이나 주선율을 추출하는데 부정확성, 색인자질을 추출할 때 사용되는 불용음(stop notes)을 탐색질의에서도 자동 제거할 필요성, 옥타브를 무시한 solfege 검색의 문제점 등이 분석되었다.

A reversible data hiding scheme in JPEG bitstreams using DCT coefficients truncation

  • Zhang, Mingming;Zhou, Quan;Hu, Yanlang
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제14권1호
    • /
    • pp.404-421
    • /
    • 2020
  • A reversible data hiding scheme in JPEG compressed bitstreams is proposed, which could avoid decoding failure and file expansion by means of removing of bitstreams corresponding to high frequency coefficients and embedding of secret data in file header as comment part. We decode original JPEG images to quantified 8×8 DCT blocks, and search for a high frequency as an optimal termination point, beyond which the coefficients are set to zero. These blocks are separated into two parts so that termination point in the latter part is slightly smaller to make the whole blocks available in substitution. Then spare space is reserved to insert secret data after comment marker so that data extraction is independent of recovery in receiver. Marked images can be displayed normally such that it is difficult to distinguish deviation by human eyes. Termination point is adaptive for variation in secret size. A secret size below 500 bits produces a negligible distortion and a PSNR of approximately 50 dB, while PSNR is also mostly larger than 30 dB for a secret size up to 25000 bits. The experimental results show that the proposed technique exhibits significant advantages in computational complexity and preservation of file size for small hiding capacity, compared to previous methods.

사람의 O-linked N-acetyl-$\beta$-D-glucosaminidase 유전자의 분석과 재조합 발현 (Analysis of Human O-GlcNAcase Gene and the Expression of the Recombinant Gene.)

  • 강대욱;서현효
    • 미생물학회지
    • /
    • 제40권2호
    • /
    • pp.87-93
    • /
    • 2004
  • 세포질과 핵단백질의 serine과 threonine 잔기에 O-linked N-acetyl-$\beta$-glucosamine (O-GlcNAc)의 첨가는고등 진핵 세포에서 흔히 일어나는 번역 후 단백질의 변형 중 하나로서 단백질의 인산화와 유사한 세포 내 신호전달에 관여하는 것으로 보인다. O-GlcNAc의 첨가와 제거는 O-GlcNAc transferase (OGT)와 O-linked N-acetyl-$\beta$-D-glucos-aminidase (O-GlcNAcase) 효소에 의해 각각 촉매된다. 두가지 종류의 사람 유래 O-GlcNAcase 유전자(O-GlcNAcase, v-O-GlcNAcase)를cloning하고 세 가지의 융합단백질로 대장균에서 생산을 시도하였다. O-GlcNAcase의 기질 유사체 인 ${\rho}$-nitrophenyl-N-acetyl-$\beta$-D-g1ucosaminide (${\rho}$NP-$\beta$-D-GlcNAc)를 기질로 사용하여 효소활성을 측정 한 결과 v-O-GlcNAcase는 활성을 나타내지 않았다. 여러 종류의 amino sugar 기질 유사체를 사용하여 O-GlcNAcase의 활성을 측정하였으나 오직 ${\rho}$NP-$\beta$-D-GlcNAc만이 활성을 보였다. Blast검색으로 분석한 결과 아미노 말단의 hyaluronidase-like domain (hyaluronidase-유사 영역)과 카르복시 말단의 N-acetyltransferase 영역 두 곳의 conserved domains 존재하였다. 효소촉매에 중요한 영역을 밝히기 위해 여러 deletion mutants(결손 변이체)를 제작한 후 효소활성을 측정하고 Western blot으로 분석하였다. Hyaluronidas-유사 영역, 유전자 내부와 N-acetyltransferase 영역을 제거할 경우 효소활성이 사라졌으나 아미노 말단의 55개 아미노산과 카르복시 말단의 truncation은 활성을 일부분 유지하였다. 위의 사실에 기초하여 hyaluronidas-유사 영역은 효소활성에 중요하고 카르복시 말단의 N-acetyltransferase 영역은 조절기능으로 작용하는 것으로 추정된다.