• 제목/요약/키워드: 외래어 질의

검색결과 8건 처리시간 0.022초

메타 검색에서 외래어 질의 정제 효과 (The Refinement Effect of Foreign Word Transliteration Query on Meta Search)

  • 이재성
    • 정보처리학회논문지B
    • /
    • 제15B권2호
    • /
    • pp.171-178
    • /
    • 2008
  • 문서에서 외래어가 일관되게 사용되지 않고 여러 이형태로 사용되고 있기 때문에, 정확한 질의어 일치를 지원하는 검색 시스템에서 외래어 질의로 문서를 검색하는데 어려움이 많다. 본 논문에서는 하나의 외래어로 질의할 경우, 원 질의어와 같은 뜻의 다양한 이형태 외래어 질의로 자동 확장하고 정제하여 더 많은 관련 문서를 손쉽게 검색할 수 있는 메타 검색 방법을 제안한다. 이 방법은 1차로 원 질의어에서 다양한 외래어 이형태를 통계적 방법으로 확장하고, 2차로 그 결과를 각 검색 엔진에게 질의하여 일정 개수 이상의 질의어가 문서에 나타났는지, 원 질의어의 문맥과 유사한 문맥에서 그 질의어가 쓰였는지를 비교하여, 같은 뜻의 유효한 외래어를 판별해 내고 이를 이용하여 검색할 수 있도록 한다. 실험 결과, 기준점으로 쓰인 1차로 만든 이형태로 검색했을 때 F값은 평균 38%이었으나, 제안된 방법인 2차로 정제된 질의어로 검색했을 때의 F값은 평균 81%로 매우 향상된 결과를 보였다.

영어외래어의 음역어 자동변환을 이용한 검색 시스템 (A Retrieval System Using the Automatic Transition of the English-Adopted Words into Transliterations)

  • 이미란;김양택;전홍태;윤성대
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 춘계학술발표논문집 (하)
    • /
    • pp.1073-1076
    • /
    • 2002
  • 정보 검색시 질의어가 외래어일 경우에 검색의 재현율은 급격하게 감소된다. 이는 외래어에서 나오는 음역어의 불일치와 영어외래어, 한글음역어는 같은 색인으로 처리가 되지 않기 때문이다. 따라서 본 논문에서는 영어외래어를 한글음역어로 자동 변환시키고, 자동 변환시에는 영어음소에 해당하는 발음값을 한글음소로 모두 변환시킨 다음 조합하였다. 조합된 음역어들은 다시 동치부류 DB에 저장되어, 질의어 검색시 검색어가 동치부류 색인어로 확장되어 검색된다. 제안한 검색시스템의 성능을 평가하기 위해서 재현율을 측정하였다.

  • PDF

효과적인 외래어 이형태 생성을 위한 확률 문맥 의존 치환 방법 (A Probabilistic Context Sensitive Rewriting Method for Effective Transliteration Variants Generation)

  • 이재성
    • 한국콘텐츠학회논문지
    • /
    • 제7권2호
    • /
    • pp.73-83
    • /
    • 2007
  • 완전 일치 방법을 주로 사용하는 정보 검색 시스템에서 외래어 이형태를 검색할 수 있도록 위해서는 외래어 이형태를 자동 생성하는 전처리나 질의어 확장이 필요하다. 본 연구에서는 하나의 외래어가 입력되면, 이를 근거로 실제 사용될 만한 외래어 이형태들을 효과적으로 생성하기 위한 방법을 제안한다. 혼동 자소를 단순하게 치환하는 방법은 불필요한 이형태를 과도하게 생성하므로, 본 연구에서는 실제 문서에 사용된 외래어 이형태들로부터 혼동 패턴을 학습하고, 이를 확률로 계산하여 생성 순서를 조절하였다. 특히, 혼동 패턴에서 좌우문맥을 고려하고 지역 치환 확률과 전역 치환 확률을 계산하여 조기에 많이 사용하는 이형태를 생성하도록 하였다. KT SET 2.0에서 추출한 이형태 데이터에 대해 실험한 결과, 상위 20개의 생성으로도 평균 80% 이상 찾아내어 이 방법이 매우 효과적임을 보였다.

한국어 자모 Viable Prefix를 이용한 외래어 표기 교정 기법 (Transliteration Correction Method using Korean Alphabet Viable Prefix)

  • 권순호;권혁철
    • 정보처리학회논문지B
    • /
    • 제18B권2호
    • /
    • pp.87-92
    • /
    • 2011
  • 한국어 문서에서 외래어 표기는 한 단어에 대해 한 개만 존재하는 것이 아니라 여러 개의 다른 표기로 사용되고 있다. 이러한 표기상 불일치는 하나의 단어가 다른 개념으로 인식되어 정보 검색 시스템의 성능 저하의 원인이 된다. 따라서 정보 검색 시스템에서는 다양한 외래어 표기에 대해 같은 개념으로 인식하여 검색할 수 있도록 외래어 표기법에 맞는 외래어 표기로 교정하는 전처리가 필요하다. 본 논문에서는 질의어로 외래어가 입력되면, 이를 근거로 외래어 표기법에 맞는 외래어 표기로 교정해주는 방법을 제안한다. 제안하는 기법은 한국어 자모의 viable prefix를 이용하여 후보 외래어 표기를 생성하는 가상 트리를 작성하고 불필요한 외래어를 가지치기함으로써 검색 정확도를 높이고 속도를 개선한다.

모국어와 외국어의 단어산출 및 언어 간 전환에 따른 뇌 활성화 과정 (Neural bases underlying Native or Foreign word production, and Language switching)

  • 김충명
    • 한국산학기술학회논문지
    • /
    • 제16권3호
    • /
    • pp.1707-1714
    • /
    • 2015
  • 본 연구는 사건관련 fMRI를 이용하여 언어 내 및 언어 간 그림명명 과제를 수행하는 동안 모국어와 외래어 명사관련 피질 활성화 영역을 비교해 보고, 특히 외래어의 활성화 패턴이 모국어에 동조되는지를 알아보았다. 아울러 과제수행 언어가 정해지지 않은 임의적 언어전환 조건에 관여하는 활성화 영역도 연구대상이었다. 실험결과, 한 가지 수행언어만으로 제한되는 과제에서는 모국어 및 외래어 모두 좌측 하전두회(LIFG) 활성화가 일어났으나 모국어의 활성화 정도가 더 컸으며, 특히 외래어 명명 시 모국어와의 활성화 강도는 약화된 반면 영역분포는 유사한 결과를 얻었다. 이는 외래어가, 외국어가 아닌 모국어에 동조되었음을 시사한다 하겠다. 마지막으로 언어전환 조건에서의 실험에서는 좌측 하전두피질 외에 우측 중전두피 질이 관여함을 발견함으로써 실험수준이 아닌 일상수준의 다언어 사용에 있어, 의식이전의 언어 간 부호전환에 관여하는 우반구의 상대적인 기여와 역할을 시사하는 결과를 얻었다.

문맥을 고려한 유사 외래어 검출 알고리즘의 성능 향상 (An Enhanced Context Sensitive Algorithm for Equivalent Foreign Word Transliteration Detection)

  • 고숙현;이재성
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2007년도 제19회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.114-121
    • /
    • 2007
  • 한국어에 대한 음성적 유사도 비교 알고리즘은 다양한 음차표기로 사용되는 외래어에 대하여 유사도 비교에 따른 등가부류를 형성해줌으로써 정보검색의 성능을 향상시킬 수 있다. 영어 환경에서의 음성적 유사도 비교 알고리즘인 SOUNDEX 알고리즘을 기반으로 하여 개발된 KODEX는 최소한의 제약사항으로 최대한의 재현율을 보였으나, 정확도 면에서 현저한 성능 감소를 보였다. 이를 보완하여 제안된 EKODEX 알고리즘은 Metaphone 알고리즘의 개념을 도입, 부분적인 모음 정보의 사용과 'ㅇ' 음가의 정보 보존 등의 제약사항을 통해 KODEX의 정확도를 끌어올렸다. 본 연구에서 제안하는 CKODEX 알고리즘은 KODEX와 EKODEX 알고리즘을 기반으로 한 것으로, 예외사항이 많은 한국어 발음 특성에 기반하여 세부적인 규칙을 정하고, 기존 알고리즘의 조건을 수정하는 방법으로 정확률과 재현율을 보다 향상시킴으로써 사용자의 질의어에 대한 클러스터링에 보다 효과적임을 밝혔다.

  • PDF

한국어 정보검색을 위한 색인어 추출방법에 관한 연구 (A Study on Extraction for Korean Information Retrieval System)

  • 최순우;김상범;임해창
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2003년도 제15회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.73-80
    • /
    • 2003
  • 본 논문에서는 색인 방법에 따른 한국어 정보검색시스템의 성능차이를 살펴보고 이를 분석하여 보다 검색성능을 높이기 위한 색인어 추출방법을 제안한다. 이를 위해 기존의 대표적인 색인법이라 할 수 있는 명사단위 색인법, 형태소 단위 색인법, 바이그램 단위 색인법, 어절단위 색인법에 대하여 실험을 통한 비교분석을 하였고, 질의별 분석을 통해 검색성능에 영향을 주는 요소들을 찾아내었다. 그 결과 빈칸, 면사분해, 명사, 동사, 형용사, 숫자등을 포함한 실질 형태소, 형식형태소의 제거, 외래어 등 추정명사의 분해 및 발음확장, 후방 단음절 명사로 구성된 복합명사의 분해, 의미를 변절시키는 바이그램 제거, 분해된 명사 수에 따른 복합명사 첨가 및 제거 등이 그 요소임을 확인할 수 있었다. 이를 토대로 각 색인법의 장점을 살려 색인 및 검색을 수행하여 보았다. 제안하는 방법은 동일한 실험집합에서 일관성 있은 성능향상을 가져다 줌을 알 수 있었다.

  • PDF

응급의료센터 내원환자 진료시 소요시간과 관련된 요인 (Factors Related to Waiting and Staying Time for Patient Care in Emergency Care Center)

  • 한남숙;박재용;이삼범;도병수;김석범
    • 한국의료질향상학회지
    • /
    • 제7권2호
    • /
    • pp.138-155
    • /
    • 2000
  • 3차 의료기관 응급의료센터의 총 진료소요시간을 단축하여 업무의 효율성을 높이고 환자적체를 해소하는 방안을 마련하기 위하여 l997년 4월 1개월 동안 대구광역시 소재 영남대학교병원 응급의료센터 내원환자 1,742명을 대상으로 환자의 특성, 응급진료와 관련된 내용 및 응급진료시간, 그리고 상호관련성을 분석하였다. 평균 초진소요시간은 83.3분이었고, 남자 83.1분, 여자 84.9분여였으며, 평균 총 진료소요시간은 전체 698분이었고, 남자 718.0분 여자 670.5분이었다. 총 진료소요시간은 고령일수록 증가하였으며 의료보호환자에서 초진 및 퇴실시간이 가장 많이 소요되었고 산재환자는 가장 적게 소요되었다. 전원시 소견서를 구비하지 않은 경우에 초진소요시간어이 많았으며, 총 진료소요시간은 외래어에서 전과된 경우, 타병원으로부터 전원된 경우, 전원시 소견서를 구비한 경우와 OCS를 부분적으로 사용한 경우에 많았다. 약물중독환자, 심폐소생술을 시행한 환자, 내과환자 수혈을 받은 환자 및 복합진료 여부가 3개과 이상이었던 환자에서 총 진료소요시간이 많았으며 당직인턴수가 4명이었던 경우가 총 진료소요 시간이 5명이었던 경우에 비해 더 많이 걸렸다. 입원한 경우, 입원명령후 공실이 없었던 경우에서 역시 총 진료소요시간이 증가하였으며 총 진료소요시간과 유의한 상관관계를 갖는 연속변수로는 환자의 연령, 방사선검사수 및 일반검사수였다. 초진소요시간에 대한 중회귀분석결과, 응급의학과 환자, 응급환자, 내원시 심폐소생술 시행환자유무, 내원시 기관내삽관 여부 등이 유의한 독립변수였다. 총 진료소요시간에 대한 중회귀분석결과, 공실유무, 일반검사수, 최종진료과, 타병원 전원유무, 방사선검사수, 퇴원약 유무, 입원실 종류, 입원유무, 담당전공의 연차, 내원원인, 내원시 심폐소생술 시행환자 유무, 수술여부, 병원직원 지인유무 및 특수검사수가 유의한 독립변수였다. 이상의 결과로 보아 응급의료센터내의 환자적체현상을 해결하기 위한 방안으로는 응급환자와 비응급환자를 분류하는 제도적 장치가 필요하며, 필수적인 경우에 한해 일반검사 및 방사선검사를 실시하도록 하며, 병동내의 과별 지정병상을 유동적으로 운영하여 응급의료센터 환자가 우선적으로 입원될 수 있도록 각과의 협조가 필요할 것으로 사료된다.

  • PDF