• 제목/요약/키워드: 문자 검색

검색결과 287건 처리시간 0.023초

의학용어의 구조 검색을 지원하는 SNOMED CT 브라우저 시스템 (A SNOMED CT Browser System Supporting Structural Search of Clinical Terminology)

  • 류우석
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2015년도 추계학술대회
    • /
    • pp.353-355
    • /
    • 2015
  • SNOMED CT 브라우저는 SNOMED CT 의학 용어 체계에 포함된 용어들을 검색하는 검색 브라우저이다. 이 용어들은 서로 다양한 관계를 통해 구조화되어 있는 특징이 있는데 기존의 브라우저들은 그 구조를 이용하지 않고 단지 문자열 매칭에 의한 결과 목록만을 제시하는 문제가 있다. 본 논문에서는 검색 결과를 서브그래프 형태로 표시함으로써 용어의 구조 검색을 가능하게 하는 브라우저 시스템을 제안하고 이를 구현하였다. 구현된 시스템은 문자열 기반 검색, 트리 기반 검색 결과 구조화, 컨셉 조회 히스토리 등의 기능을 포함하는 특징이 있다.

  • PDF

뉴스 비디오의 내용기반 검색을 위한 자동 인덱싱 (Automatic Indexing for the Content-based Retrieval of News Video)

  • 양명섭;유철중;장옥배
    • 한국정보처리학회논문지
    • /
    • 제5권5호
    • /
    • pp.1130-1139
    • /
    • 1998
  • 본 논문은 내용에 기반한 뉴스 비디오의 인덱싱과 검색을 위한 통합된 해결책을 제안한다. 핸재 일반적인 비디오의 자동 인덱싱은 불가능하지만 뉴스 비디오와 같은 구조가 명확한 경우는 가능하다. 이러한 뉴스의 구조화된 지식을 이용하여 키 프레임들을 자동 추출하기 위해서 제안된 우리의 모델은 뉴스사건 분할, 자막 인식, 검색 브라우저 모듈로 구성되어 있다. 첫 번째로 뉴스사건의 분할 모듈은 얼굴인식에 기반하여 사건의 중심인 앵커 장면을 인식하고 앵커 장면의 공간적 정보를 이용하여 뉴스사건을 분할한다. 다음으로 뉴스아이콘을 추출한다. 자막인식 모듈은 먼저 자막의 특성을 이용하여 자막 프레임을 검출하고 분리병합 방법을 이용하여 문자열을 추출한다. 다음으로 문자인식기(OCR)를 이용하여 문자인식을 한다. 마지막으로 검색 브라우저 모듈은 다양한 검색 방법이 가능하도록 하였다.

  • PDF

데이터베이스의 사용문자(使用文字) 및 용어(用語) 표기법(表記法) (The Description Rule of Terms and Characters in Databases)

  • 김태중;이창한
    • 정보관리연구
    • /
    • 제19권1호
    • /
    • pp.95-122
    • /
    • 1988
  • 지금까지 데이터베이스를 만들 때에 일정한 표기기준(表記基準)이 없어서 정보교환(情報交換)이 불가능하였으며, 검색(檢索)에 있어서도 어려움이 있었다. 이 자료(資料)에서는 검색(檢索)을 위한 데이터베이스를 제작(製作)할 때에 사용하는 기호(記號)와 용어(用語)의 표기법(表記法)을 제시하고 있다. 학술논문(學術論文)을 기술(記述)할 때에 사용되고 있는 기호(記號)와 문자(文字) 가운데 컴퓨터 단말기(端末機)를 통하여 입력(入力) 및 검색(檢索)이 곤란한 경우가 있으므로 이러한 기호(記號)와 문자(文字)를 입력(入力) 검색(檢索)이 가능한 형태(形態)로 표현하는 방법(方法)을 고안했으며, 문교부(文敎部)가 고시한 "한글 맞춤법"과 "외래어 표기법"을 검토하여 2가지 이상으로 표기(表記)가 가능한 부분에 대해 검색효율(檢索效率)이 높아지는 쪽을 택해 일정하게 용어(用語)를 표기(表記)하도록 규정(規定)했다.

  • PDF

모바일정보검색 서비스를 위한 문자 인식 (Image Processing for Mobile Information Retrieval Service)

  • 임명재;현성경;박지은;이기영
    • 한국인터넷방송통신학회논문지
    • /
    • 제11권1호
    • /
    • pp.103-108
    • /
    • 2011
  • 현대 사회는 정보화에 대한 인식이 크게 보편화되면서 정보 통신 기술에 대한 개발이 급속화 되고 있는 추세이다. 특히 모바일 기기에 대한 기술 또한 빠르게 진행됨에 따라 자신이 원하는 정보를 언제 어디서나 제공받기를 기대한다. 이에 따라 편리한 정보검색을 위한 이미지 검색이 보편화 되고 있다. 하지만 일반적인 이미지 검색은 이미지에서의 문자영역 추출의 부정확성과 추출된 문자로 상세한 정보를 얻는데 어려움이 따른다. 따라서 본 논문에서는 촬영한 영상에서 문자인식을 통해 관광지를 포함한 여러 상점들의 간판을 인식하여 사용자에게 편리한 정보제공을 목적으로 하고 있으며, Top-Hat이라는 문자추출 방법과 서버를 함께 연동시키므로 시킴으로써 보다 정확하고 상세한 정보를 얻을 수 있다.

집합 기반 POI 검색 알고리즘을 활용한 스팸 메시지 판별 모바일 앱 구현 (Implementation of A Mobile Application for Spam SMS Filtering Using Set-Based POI Search Algorithm)

  • 안혜영;조완지;이종우
    • 디지털콘텐츠학회 논문지
    • /
    • 제16권5호
    • /
    • pp.815-822
    • /
    • 2015
  • 최근 스미싱 피해가 늘어남에 따라 스팸 메시지 처리를 위한 애플리케이션이 잇달아 출시되고 있다. 그러나 자음과 모음을 분리하는 등 교묘하게 내용이 조작된 스팸 메시지는 필터링하지 못 하는 경우가 대부분이다. 이를 해결하기 위해 본 논문에서는 문자 메시지 내 스팸 문자열을 검사하는 애플리케이션인 안티스팸을 구현하였다. 안티스팸은 집합 기반 POI 검색 알고리즘을 활용하여, 전송된 문자 메시지내에 스팸 문자열이 있는지 검색한 후, 검색 결과에 따라 스팸 여부를 추정한다. 또한 스팸 필터링을 피하기 위해 교묘히 위장된 스팸 메시지도 걸러준다. 사용자는 메시지를 받으면 스팸 판단 결과와 메시지 내용을 확인하고 메시지 처리방식을 선택할 수 있다.

정규식 구문과 상관분석 기법을 통합한 정보 검색 모듈 개발 (Development of Information Search Module by Integrating Regular Expression and Correlation Analysis Method)

  • 김봉현
    • 한국정보통신학회논문지
    • /
    • 제17권3호
    • /
    • pp.634-640
    • /
    • 2013
  • 기존의 패턴 및 데이터베이스 검색, 페이지 단위 문자열 검색 기법은 단순 검색 방식으로 오탐율이 많아 검색 결과에 대한 신뢰성이 떨어진다. 또한, 동일 조건을 다른 검색 기법에 추가로 시행함으로 인해 자원 낭비 및 시간 낭비를 초래하고 있다. 따라서 본 논문에서는 정규식 구문과 상관분석 기법의 통합적 연계 방식을 적용시킨 정보 검색 모듈을 개발하였다. 이를 통해 기존의 문자열 검색기법의 문제로 지적되어 온 오탐율을 줄임으로써 경제적인 효과 및 신뢰성을 확보하는 보안형 정보 검색 기술을 연구하였다.

제한된 한글 입력환경을 위한 음소기반 근사 문자열 검색 시스템 (A Phoneme-based Approximate String Searching System for Restricted Korean Character Input Environments)

  • 윤태진;조환규;정우근
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권10호
    • /
    • pp.788-801
    • /
    • 2010
  • 모바일 기기가 발전함에 따라 입력 수단에 대한 연구는 중요한 이슈이다 키패드, 쿼티키패드, 터치, 음성인식 등 다양한 입력장치가 사용되고 있으나 아직 데스크톱 입력장치에 비해 편의성이 떨어져서 입력 시의 오타나 탈자 등의 오류가 포함되는 경우가 많다. 이러한 입력 오류는 문자 메시지 등 사람과의 의사소통에는 문제를 일으키지 않으나 사전, 주소록 등의 데이터베이스 검색에는 치명적인 오류로서 원하는 검색 결과를 얻지 못하게 된다. 특히 한글의 경우 자음과 모음의 조합을 통해 글자를 생성하는 특성상 1만자가 넘는 글자의 조합이 가능하여 영문에 비하여 오류의 빈도가 높다. 기존의 검색 시스템은 Suffix Tree등을 이용하여 입력 오류를 처리하지만 다양한 오류에 대응하기에는 한계가 있다. 본 논문에서는 오자, 탈자 등의 입력 오류를 허용하면서 빠른 검색이 가능한 근사 한글 단어 검색 시스템을 제안하고자 한다. 이 시스템은 기존의 알파벳에 적용된 근사 문자열 검색(Approximate String Searching)을 한글에 효과적으로 적용할 수 있는 여러 가지 알고리즘과 기법이 포함되어 있다. 그리고 제안된 시스템을 이용한 변형 욕설 필터링 시스템의 개발에 대해 이야기하고자 한다. 이 시스템은 유저의 각종 변형 욕설 입력에 대해 90% 이상의 필터링 성능을 보였다.

자연영상에서 한글문자 영역 검출에 관한 연구 (Study on Hangul Character Region Detection in Natural Images)

  • 박종천;권교현;전병민
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2010년도 추계학술발표논문집 1부
    • /
    • pp.430-433
    • /
    • 2010
  • 최근 모바일 기기로 획득된 영상을 이용한 다양한 분야의 연구가 활발히 진행되고 있으며, 스마트폰의 보급이 확대되면서 증강현실을 지원하고자 자연영상으로부터 문자정보를 추출 및 인식하여 이미지 검색을 가능하도록 하는 많은 연구도 진행되고 있다. 자연영상에서 한글문자 영역 검출은 한글문자 인식을 위한 전단계로서 다양한 환경에 노출된 문자영역을 정확히 검출하는 것이 인식 성능을 결정함으로 중요한 전처리 단계이다. 본 연구는 한글문자 영역의 에지 및 지역적 연결요소 성분 특징을 이용하여 한글문자 영역을 검출하는 방법을 제안한다. 에지 및 연결요소 성분의 특징을 검출하고, 그 결과를 레이블화하고 이를 분석함으로서 한글문자 후보 영역을 검출한다. 검출된 후보영역은 검증과정을 수행하여 최종적인 한글문자 영역을 추출한다. 제안한 방법은 다양한 환경에서 얻어진 자연영상을 대상으로 실험한 결과, 에지 및 연결요소 성분의 두 가지 특징을 결합함으로서 한글 문자영역 검출의 정확도를 향상하였다.

  • PDF

정보 시스템의 유니코드 기반 한자 검색 지원 (Support on Ideograph Characters Search of Unicode Based Information System)

  • 윤소영
    • 정보관리학회지
    • /
    • 제24권4호
    • /
    • pp.375-391
    • /
    • 2007
  • 현재 유니코드 CJK 한자코드는 부수 기준 배열방식을 따르고 있어 한자의 한글음가를 기준으로 하는 우리의 문자생활 방식과 차이가 있으며, 우리나라 고유한자나 동형이음어, 이두문자, 그리고 이체자 관계 등을 모두 수록하고 있지 않아 정보시스템에 그대로 적용하기에는 무리가 있다. 따라서 유니코드 기반 정보시스템의 정확한 한자표현 및 한자검색을 위해서는 한자를 포함하는 자료에 대한 정확한 이해를 바탕으로 여러 가지 지원방안을 마련해야 한다. 이러한 측면에서 역사분야 정보검색시스템에서는 한글음가 및 한국에서만 사용되는 동형이음어 처리를 위한 한자-한글음가 사전, 본래 한자의 음가와 다르게 읽히는 한자를 위한 특수용어사전, 이형자와이체자를 위한 이체자사전, 그리고 유니코드 CJK 통합한자에 등록되어 있지 않은 한자를 위한 신출 한자목록을 지원하고 있다.

효과적인 도서목록 검색을 위한 개선된 OCR알고리즘에 관한 연구 (Improvement OCR Algorithm for Efficient Book Catalog RetrievalTechnology)

  • 하문;백영현;문성룡
    • 전자공학회논문지CI
    • /
    • 제47권1호
    • /
    • pp.152-159
    • /
    • 2010
  • 본 논문에서는 기울어진 문자, 다양한 크기, 글씨체, 흐린 문자를 포함한 입력영상의 문자 복원과 인식, 효율적인 도서 검색을 위한 광학문자인식 알고리즘을 제안한다. 본 논문에서 제안한 광학문자 인식알고리즘은 검출부와 인식부로 구성되며, 검출부에서는 복잡한 배경에서 정확한 도서 영역 검출을 위하여 로버츠 에지 연산자와 허도로프 거리 알고리즘을 적용하여 필요한 영역을 검출하였다. 또한 인식부에서는 문자의 크기와 경사도, 부분 손실 등의 영상에 강인성을 갖는 바이큐빅 보간법을 적용하여 데이터 손실 복원과, 반자동 기울기를 갖는 입력 영상의 보정을 하였다. 모의실험 결과 기존 알고리즘 보다 인식률에서는 6%, 검색시간에서는 1.077초 더 우수함을 확인하였다.