• Title/Summary/Keyword: 어인

Search Result 7,509, Processing Time 0.032 seconds

A Synonym Dictionary Construction for Information Retrieval (정보 검색을 위한 동의어/유의어 사전 구축)

  • Lee, Tae-Woo;Seo, Young-Hoon
    • Annual Conference on Human and Language Technology
    • /
    • 2003.10d
    • /
    • pp.208-213
    • /
    • 2003
  • 본 논문에서는 많은 정보로부터 의미 있는 정보를 추출하기 위해 사용되는 정보 검색 시스템에서 이용이 가능한 동의어/유의어 사전을 구축하고 구축된 정보의 평가를 수행하였다. 사용한 자원으로는 미리 구축된 한-영 사전과 영-한사전을 이용하였다. 이들의 사용으로 다른 동의어사전과 달리 보다 많은 유의어 정보를 포함하는 이익을 얻었다. 본 논문의 시스템은 사전을 구축하기 위해 기본 자원을 이용하여 동의어/유의어 후보 목록들을 획득하고, 획득된 정보를 바탕으로 후보 목록의 빈도수와 사전의 위치 정보, 마지막으로 입력 명사 정보를 이용하여 동의어/유의어를 확정한다. 작성된 동의어/유의어사전은 한-영사전에 수록된 한국어 명사 64,630개를 대상으로 하였다. 작성된 사전을 문서 필터링 시스템에 추가하여 적용 전보다 성능이 향상됨을 확인하였다. 또한 질의 색인어 확장에 이용하여 보다 정답을 추출하는데 추가적으로 확장된 유의어 정보가 정답을 추출하는데 유용하게 사용됨을 확인하였다.

  • PDF

Restoring an Elided title for Encyclopedia QA System (백과사전 질의응답을 위한 생략된 표제어 복원에 관한 연구)

  • Lim Soojong;Lee Changi;Jang Myoung-Gil
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.11b
    • /
    • pp.541-543
    • /
    • 2005
  • 백과사전에서 정답을 찾기 위해 문장의 구조를 분석하는데 한국어 백과사전은 표제어에 대한 정보를 문장에서 생략한다. 그러나 표제어는 문장에서 주어나 목적어 역할을 하기 때문에 생략된 정보를 복원하지 못 하면 질의에 대한 정답을 제시할 수 없다. 생략된 표제어에 대한 정보를 복원하기 위해서 본 연구에서는 표제어의 의미범주 정보, 격틀, Maximum Entropy 모델을 이용하여 표제어 주어, 표제어 목적어 복원, 미복원 3가지로 인식한다. 표제어 의미범주는 의미 범주에 대해 일정 수준의 복원 성향을 보일 경우 Maximum Entropy 정보를 창조하였고 격틀을 이용하여 복원 여부를 결정한다. 만약 표제어의 의미범주 정보, 격틀을 이용하여도 복원 여부를 결정하지 못할 경우에는 Maximum Entropy 모델에 기반한 통계 기법을 적용하여 복원 여부를 결정한다. 그리고 각각 방법의 단점을 보완하기 위해서 규칙에 해당하는 표제어 의미범주 정보와 격틀 정보에는 통계 모델인 ME 모델을 보완하여 사용한다.

  • PDF

Korean-to-English Query Translation based on Multilingual Ontology in Cross-Language Text Retrieval (교차언어 문서검색에서 다국어 온톨로지에 기반한 한영 질의어 변환)

  • Chun, Jung-Hoon;Choi, Key-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 1999.10e
    • /
    • pp.43-49
    • /
    • 1999
  • 본 논문에서는 교차언어 문서검색(CLTR: Cross-Language Text Retrieval)에서의 한-영 질의어 변환을 다룬다. 질의어 변환시 영어 대역어 획득과정에서는 다음 두 가지를 고려한다. 첫째, 한국어 질의어를 구성하는 단어가 한가지 개념을 기호화하지만 이에 대응되는 영어 대역어들이 하나 이상인 경우이다. 둘째, 질의어 구성 단어가 둘 이상의 개념들을 기호화하는 다의성을 지닌 경우이다. 전자의 경우는 영어 대역어들이 모두 동일한 개념, 또는 유사한 개념을 나타내므로 그대로 검색에 이용한다 해도 검색 성능을 크게 좌우하지 않지만, 후자의 경우는 모든 개념을 다 검색에 이용하게 되면 정확률(precision)이 크게 떨어지게 된다. 이에 본 연구에서는 개념 선택단계와 선택된 개념의 영어 대역어들에 가중치를 주는 가중치 부가단계로 나누어 질의어 변환을 수행한다. 본 논문의 질의어 변환에서 영어 대역어는 대역사전 대신 다국어 온톨로지인 KAIST 분류어휘표와 한영 음차복원 모듈을 통해 얻어진다.

  • PDF

한국어 부사어의 분류와 분포 제약

  • 채희락
    • Proceedings of the Korean Society for Language and Information Conference
    • /
    • 2001.06a
    • /
    • pp.95-96
    • /
    • 2001
  • 문장에서 술어를 수식하는 대표적인 표현은 부사어이다. 부사어는 일반적으로 문장 구성에서 핵심적 역할을 하지 않는 첨가어(adjuncts)이기 때문에 핵심적인 역할을 하는 보충어(complements)에 비해 상대적으로 연구가 덜 이루어진 분야이다. 그렇지만 부사어는 피수식어의 의미를 구체화/한정하는 기능을 하기 때문에 정확한 의사소통을 위해서는 반드시 필요한 요소이며 어순, 호응(concord)등의 통사적 현상과도 밀접한 관련이 있다. 이 연구의 일차적 목적은 이러한 부사어를 통사적, 의미적 기준에 의해 정확하게 분류하고 그들의 분포제약을 밝히는 것이다. 그 다음으로, 부사어와 관련된 통사 현상으로, 부사어와 피수식어의 공 기(co-occurrence)관계 및 부사어와 술어 어미의 호응 관계에 대한 분석을 제공하려고 한다. 부사어는 통사적인 기준과 의미적인 기준으로 분류할 수 있다 (손남익 1995, 김경훈 1996, 임유종 1998). 통사적 기준으로는 단어나 구를 수식하는 성분부사와 문장을 수식하는 문장 부사로 나누는 방법과 위치에 대한 제약이 있느냐 없느냐에 따라 제약부사와 자유부사로 나 누는 방법이 있다. 이 두 통사론적 기준에 의해 분류되는 부사들은 서로 어떤 상관관계를 보이고 있는지 살펴 볼 것이다. 일반적으로 문장부사는 문두에 놓여야 한다는 위치적 제 약 이 있기 때문에 제약부사로 분류된다. 의미적 기준으로 부사어를 분류할 수도 있는데, 시간/ 공간 부사어, 양태/정도 부사어 등으로 나눌 수 있다. 의미적 기준에 의해 분류된 부사어는 통사적 기준에 의해 분류된 것들과는 어떤 상호 관련성을 맺고 있는지 살펴 볼 것이다. 일 반적으로 시간부사와 장소부사는 자유부사에 속하며 양태부사와 정도부사는 제약부사에 속 한다. 부사어와 피수식 요소와의 통사적 공기 관계 및 의미적 관계 그리고 그와 관련된 문 법 현상도 연구의 대상이 된다. 예를 들어, 자유로운 어순을 가진 부사들이지만 “*순이는 빨리 과연 달린다”에서 볼 수 있는 종류의 분포적 특성을 알아 볼것이다 (심재기 1982, 송 철의 1989). 또한 “길이/*길게 빛나다”와 “*길이/길게 드리워졌다”와 같은 대조에서 나타나는 통사, 의미적 기능의 상관 관계 및 제약들의 상호 작용도 살펴 볼 것이다.

  • PDF

Topic Keyword Common Representation Model Based on Ontology for Semantic Web Services (시맨틱 웹 서비스를 위한 온톨로지 기반 주제어 공통 표현 모델)

  • Jung, Hanmin;Kim, Pyung;Lee, MI-Kyoung;Sung, Won-Kyung
    • Annual Conference on Human and Language Technology
    • /
    • 2008.10a
    • /
    • pp.103-108
    • /
    • 2008
  • 주제어는 정보 서비스를 비롯한 여러 응용 분야들에서 유용하게 사용되는 지식이지만, 주제어 간 관계가 다양할 뿐만 아니라 목적에 맞도록 개별적으로 설계됨으로써 주제어 관계 속성 유형과 무관하게 공유가 가능한 주제어 공통 표현 모델이 제시되지 못하였다. 본 연구는 응용 분야, 온톨로지 종류와 무관하게 적용될 수 있으며 시맨틱 웹 서비스 간 공유가 가능한 주제어 공통 표현 모델을 제시하고자 한다. 이를 위해, 주제어 관계를 범용 클래스로 정의하고, 주제어 관계 속성 유형을 데이터타입 속성 (Datatype Property)으로 선언하였다. 또한, 주제어 역시 그 속성 유형을 데이터타입 속성으로 선언하였는데, 결국 다양한 유형의 관계들을 용이하게 표현할 수 있도록 하기 위한 것이다. 실험을 위해 주제어 간 관계수가 70,804,233개이며 주제어 관계 속성 유형이 4가지인 과학 기술 기반 정보 온톨로지와 주제어 간 관계수가 44,147개이며 주제어 관계 속성 유형이 13가지인 표준 정보 온톨로지를 대상으로 본 연구에서 제안한 주제어 공통 표현 모델을 적용하였으며 총 284,744,802개의 RDF(Resource Description Framework) Triple을 생성하였다.

  • PDF

A Japanese Input Method for Platform-Free System Environment (플랫폼독립 시스템환경에서 일본어 입력 방법)

  • Song, Soo-Bum;Lee, Hyong-Jick;Byun, Jeong-Yong
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.11a
    • /
    • pp.589-592
    • /
    • 2002
  • 현행 일본어 입력방법은 운영 체제 의존적 문자입력 방법을 채택하고 있다. 즉 운영 체제가 채택하는 문자입력방법과 문자 코드체계에 의존적이다. 특히 인터넷의 발전으로 세계 어느 곳에서나 인터넷을 이용하여 정보 검색이나 진자상거래와 같은 일을 할 수 있게 되었다. 또한 문자코드체계의 발전으로 일본어지원 운영체제가 아니더라도 일본어 폰트만 있으면 일본어로 된 웹사이트를 볼 수 있다. 그러나 일본어 입력은 운영체제의 문자입력기(IME : Input Method Editor)에 의존하기 때문에 일본어지원 운영 체제가 아니면 일본어를 입력 할 수가 없다. 이러한 이유로 웹에서 플랫폼에 상관없이 일본어를 입력 할 수 있는 기능이 절실히 필요하다. 본 논문은 플랫폼 독립적인 환경에서 인터넷을 통한 일본어 입력방법의 필요성과 그것이 가지는 한계점을 검토하고 응용프로그램과 연동하는 일본어 입력방법을 제안하고 구현하였다.

  • PDF

Applying Labeled LDA to Author Keywords Recommendation (Labeled LDA를 이용한 저자 주제어 추천)

  • Bong, Seong-Yong;Hwang, Kyu-Baek
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2010.06c
    • /
    • pp.385-389
    • /
    • 2010
  • 논문에 부여되는 저자 주제어(author keyword)는 논문을 분류 및 검색하는데 활용될 수 있다. 이렇게 주제어를 부여할 때 자동으로 저자 주제어를 추천한다면 사용자에게 편리성을 제공하고 저자가 직접 부여한 저자 주제어 이외에 추가적으로 주제어가 있는지도 확인할 수 있어 유용하다. 본 연구에서는 논문에 달려있는 다수의 주제어 중 하나의 주제어를 선별하여 Labeled LDA를 이용해 주제어와 초록(abstract)의 관계를 학습했다. 이후 초록이 주어지면 자동으로 저자 주제어를 부여할 수 있도록 추천하는 기법을 제안하고 그에 따른 실험을 진행했다. 본 논문에서는 실험을 통하여 기계학습을 이용한 저자 주제어의 추천이 어느 정도의 성능을 보이는지 평가하고 향후 연구의 방향을 제시한다.

  • PDF

Semantic Analysis of Color Terms in Chinese Neologisms: Focusing on Black, White, and Gray (중국어 신조어에 나타난 색채어 의미 분석 - 검은색, 흰색, 회색을 중심으로 -)

  • Lee, Myung-Ah;Han, Yong-su
    • Cross-Cultural Studies
    • /
    • v.47
    • /
    • pp.241-260
    • /
    • 2017
  • A multitude of neologisms has entered the lexicon of modern Chinese society as a reflection of the changes modern Chinese society has undergone, and amid this trend, a variety of color terms has emerged. However, these neologisms of color terms in modern Chinese society are used somewhat differently from their roots. First, the achromatic color terms used in Chinese neologisms include black, white, and gray. The significance criteria generally used in these neologisms of color terms only partially express their meaning in the modern Chinese language. Second, the frequency usage of significant criteria of color terms that have emerged in Chinese neologisms reveals a relative distribution between color terms referring to black and white. The color term "black" is the most active neologism to connote its expanded meaning, followed by its basic meaning. However, the color term "white" is most actively used to connote its basic meaning, followed by its expanded meaning. Third, among the achromatic color terms used in Chinese neologisms, black and gray exhibit expansion of meaning. For example, in the context of neologisms, the color term "black" is used to symbolize "in disaster areas" and "socially discriminated against," while "gray" is used to symbolize the "social aspect."

Flow Analysis in the Baffled Fishway using FLOW-3D (FLOW-3D를 이용한 도류벽식 어도내의 흐름해석)

  • Choi, Soo-Hyoung;Kim, Seo-Jun;Lim, Yoon-Sung;Yoon, Byung-Man
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2009.05a
    • /
    • pp.1837-1840
    • /
    • 2009
  • 최근 자연형하천 조성사업과 하천복원 등을 목적으로 하천의 치수, 이수적인 기능뿐만 아니라 생태적인 기능을 고려한 하천설계를 위하여 많은 노력들을 하고 있다. 이와 같은 목적으로 하천의 생태적 통로가 단절되는 것을 막기 위해 하천 횡단 구조물인 보와 낙차공에 어도를 설치하고 있다. 하지만 현재 어도 설계는 어도 내의 흐름특성을 정확히 고려하지 못하고 설계되어 어도 본래의 기능을 수행하지 못하는 경우가 많았다. 그 이유는 현장 상황에 따라 어도의 종류와 형태가 다양하게 설계되고 있는 것에 반해 이를 검토할 수 있는 방법이 수리실험으로 한정되어 있어서 어도내 흐름특성을 결정하기 어렵기 때문이다. 어도 설계를 위한 수리실험은 시간적, 공간적 및 경제적인 제약으로 인해 다양한 형태의 어도 조건과 수리조건을 검토하기에는 현실적으로 어려움이 있는 반면에 수치모의는 매개변수 결정에 어려움이 있지만 수리실험에 비해 다양한 형태와 수리조건에 대해 간편하게 흐름특성을 예측할 수 있는 장점이 있다. 따라서 본 연구에서는 어도 설계시 간편하게 어도내 흐름특성을 예측할 수 있도록 기존에 사용되고 있는 수리실험 결과와 수치모의 기법을 이용한 흐름해석 결과를 비교하여 보았다. 수치모의는 3차원 흐름모형인 FLOW-3D를 이용하였고, 어도 형태는 도류벽식 어도를 대상으로 수행하였다. 수행 결과 수리실험과 비교하여 수심별로 최대 13% 정도의 오차를 보이고 있으며, 최대유속 발생 지점을 비교한 결과 하폭의 6% 정도 오차를 보였다. 따라서 최종 설계 이전에 어도의 흐름특성을 예측하기 위한 방법으로 FLOW-3D를 사용한다면 충분히 활용 가능할 것으로 판단된다.

  • PDF

Japanese composition system design based on writing Korean (한국어 작성에 의한 일본어 작문지원시스템 설계)

  • Chang, Won;Yhu, Sang-Hwa;Sim, Chul-Min;Kim, Tae-Wan
    • Annual Conference on Human and Language Technology
    • /
    • 1997.10a
    • /
    • pp.296-302
    • /
    • 1997
  • 본 논문은 일본어 작문지원시스템에 관한 것으로서, 사용자가 일본어에 대한 언어지식이 전혀 없더라도 한국어 작성 능력만으로 일본어를 작문할 수 있도록 지원하는 일본어 작문지원 시스템 개발 방법에 관한 것이다. 본 논문에서 제안하는 일본어 작문지원 시스템은, 사용자가 일어로 작문하고자 하는 문장을 한 국어의 어절단위 또는 연속된 문자열로 작성해 나가면, 시스템이 자동개입하여 한국어 분석기술과 일본어로의 변환/생성 기술로 일본어의 대응 문자열을 생성해 준다. 따라서 한국어 작성능력만으로 일본어를 작문할 수 있도록 지원한다. 특히, 한국어 분석의 중의성과 일본어 변환시 대응어 선택의 중의성 문제가 있을 경우에는, 사용자가 시스템이 사용자 대화창에 제공하는 한국어 도움말 정보를 참조하여 선택함으로서 문제점을 해소하여 정확한 작문을 유도한다.

  • PDF