• Title/Summary/Keyword: 어휘정보

Search Result 1,062, Processing Time 0.03 seconds

Design of Ontology Object Model Generation System (온톨로지 객체 모델 생성 시스템 설계)

  • Park, Cheon-Shu;Lee, Mi-Kyoung;Sohn, Joo-Chan;Ham, Ho-Sang
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2003.11b
    • /
    • pp.1297-1300
    • /
    • 2003
  • 본 논문은 웹 온톨로지 데이터를 접근, 표현 및 처리 할 수 있는 온톨로지 객체 모델을 생성하기 위한 시스템이다. 시멘틱 웹의 대두로 인해 웹 상에 존재하는 데이터의 특성에 따라서 접근 할수 있는 방법도 다양화 되었다. 이에 웹 상에서 산재되어 있는 지식들을 가져와 각 도메인에 맞게 새로운 온톨로지를 생성하고 서로 다른 언어로 표현된 온톨로지를 계층 어휘들을 이용하여 시멘틱웹 환경에서 지식을 처리하기 위해 웹 온톨로지를 구축하고 처리할 수 있는 온톨로지 객체 모델을 제공하고, 온톨로지 객체 모델 API를 통해 외부 어플리케이션과의 정보를 교환한다. 본 논문에서는 웹 온톨로지를 표현하기 위한 모델을 계층별로 구별하여 프레임 기반의 상위 온톨로지(frame-based ontology layer), 다른 도메인에서도 사용이 가능한 공통된 어휘(vocabulary)를 표현한 핵심 온톨로지(generic ontology layer)와 각각의 온톨로지 언어에 의존적인 어휘를 표현한 기능 온톨로지(functional ontology layer)로 구성하여 표현의 중복을 없애고 재 사용성을 높이기 위한 모델을 제공함으로써, 온톨로지 추론, 병합 및 저작 도구 등의 외부 어플리케이션이 온톨로지 객체 모델에 손쉽게 접근할수 있고, 온톨로지에 대한 쉬운 지식 표현 및 핸들링을 제공할 수 있다.

  • PDF

Experiment and Evaluation of the XMDR-based Ontology Building Method (XMDR 기반 온톨로지 구축 방법에 대한 실험 및 평가)

  • Lee, Sukhoon;Jeong, Dongwon;Kim, Jangwon;Baik, Doo-Kwon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2010.11a
    • /
    • pp.185-188
    • /
    • 2010
  • 온톨로지 간 이질성 문제를 해결하고 상호운용성을 향상시키기 위한 연구가 진행되어 왔으며, 최근 XMDR에 기반한 온톨로지 구축 방법이 제안되었으나 기존 연구와의 비교 평가가 부족하여 장점을 정확하게 보이지 못하였다. 따라서 이 논문에서는 XMDR 기반 온톨로지 구축 방법의 장점을 보다 명확하게 보이기 위해 정량적인 평가를 수행한다. 이를 위해 실제 온톨로지를 구축하고, 구축된 온톨로지는 온톨로지 참조 기반 온톨로지 구축 방법, 사전 참조 기반 온톨로지 구축 방법, 기존 방법론을 이용한 온톨로지 구축 방법을 평가 대상으로 하여 5가지 평가 지표로 분석된다. 평가 지표로는 구축된 온톨로지의 어휘 및 구조의 일관성 비교를 위하여 어휘 및 구조의 빈도수 평균과 엔트로피를 사용하고 구축 비용의 평가를 위하여 각 온톨로지의 구축 시간을 사용한다. 이러한 실험 및 평가의 결과로써, 온톨로지 참조 기반의 온톨로지 구축 방법은 다른 온톨로지 구축 방법들에 비해 온톨로지 어휘 및 구조가 일관적이고 효율적임을 보인다.

Hemispheric Asymmetry in Processing Semantic Relationship Shown in Normals and Aphasic (정상인과 명칭성 실어증 환자에게서 보이는 의미적 관련성의 좌우반구 편재화)

  • Chae, Su-Kyung;Kim, Dung-Hye;Pyum, Sung-Bum;Hong, Sung-Bin;Lee, Hong-Jae;Nam, Ki-Chun
    • Annual Conference on Human and Language Technology
    • /
    • 1999.10e
    • /
    • pp.462-469
    • /
    • 1999
  • 본 연구에서는 시각적으로 제시되는 단어 자극의 의미 관련성의 차이에 따라 좌우반구의 처리가 어떻게 이루어지는지 알아보고자 하였다. 이를 위해서 명칭성 실어증 환자와 정상인 대학생 피험자를 대상으로 점화 어휘판단 과제를 수행하였다. 이 연구의 기본 논리는 명칭성 실어증 환자의 왼쪽 뇌가 손상되어 있기 때문에 어떤 정보처리가 왼쪽 뇌에서 일어나는 것이라면 정상인과 명칭성 실어증환자간의 수행에서 어떤 차이가 나타날 것을 기대되는 반면, 만일에 우뇌에서 처리되는 것이라면 정상인의 과제 수행 형태와 명칭성 실어증 환자의 것이 일치하는 형태를 보일 것이라는 것이다. 실험 1에서는 수직적 범주관련성이 어느 반구에서 정보처리 되는지를 조사하였다. 그 결과 정상인은 좌반구에서 유의미한 점화효과가 있고 우반구에서는 점화효과가 없었던 반면에, 명칭성 실어증 환자는 정상인과 정반대의 점화 효과를 보이고 있다. 이러한 결과는 좌반구가 일차적으로 수직적 범주 관련성 정보처리와 관련이 있음을 시사해 준다. 또한 수평적 범주 관련성에 따른 실험 은 정상인과 환자 두 집단 모두 수평적 범주관련성이 우반구에서 처리되는 유사한 패턴을 보여주었다. 실험2에서는 연합적 범주관련성에 따른 두 집단간의 점화 효과를 비교하였다. 정상인 집단과 환자 모두 좌우반구에 점화효과를 보여주고 있지만, 정상인 집단의 경우에는 우반구에서, 환자는 좌반구에서 점화량이 더 컸다. 연합관련 정보처리는 좌우반구 모두에서 일어난다고 하는 기존의 견해와 관련하여 볼 때 연합관련 정보처리는 좌우반구에서 일어난다고 해석할 수 있을 것이다. 명칭 실어증 환자의 정보처리는 정상인과 다르게 이루어지므로 이러한 좌우반구에서의 차이가 난 것으로 볼 수 있다. 이상의 실험1과 2의 결과를 종합해 보면, 시각적으로 제시되는 단어의 범주적 관련성이 주는 어휘정보 처리는 반구에 따라 처리하는 기능이 다르다고 결론 내릴 수 있다. 즉, 좌반구는 수직적 범주 관련성을 담당하고 우반구는 수평적 관련성을 담당하며, 연합적 관련성은 좌우반구 모두에서 정보처리 된다는 것이다.

  • PDF

Computational Model for Proving Phonological Information a Role in Visual Korean Word Recognition (한국어 시각단어재인 과정에서의 음운정보 역할 규명을 위한 계산주의적 모델)

  • Park, Ki-Nam;Lim, Heui-Seok;Han, Kun-Hee
    • Proceedings of the KAIS Fall Conference
    • /
    • 2007.05a
    • /
    • pp.178-180
    • /
    • 2007
  • 본 논문은 인간의 언어정보처리 과정 중 시각단어재인(visual word recognition) 과정에서 음운정보와 철자정보의 역할 및 심성어휘집의 표상 형태를 알아보기 위해, 계산주의적 모델을 제안하고, 제안된 모델을 이용하여 실험하였다. 실험결과 계산주의적 모텔은 한국어에 대한 시각 단어재인 시 보이는 언어현상 중 음운, 철자 이웃 크기효과(phonological and orthographic neighborhood effect)를 나타냈으며, 이를 통해 한국어 시각단어재인 과정에서 심성어휘집이 음운정보로 표상되어 있다는 것을 시사하는 증거를 보였다.

  • PDF

Resolution of Ambiguous Grammatical Functions of Korean Using Conceptual Patterns and Statistical Information (개념패턴과 통계정보를 이용한 한국어 미지격의 구문관계 결정 방법)

  • Lee, Hui-Feng;Kang, In-Su;Lee, Jong-Hyeok
    • Annual Conference on Human and Language Technology
    • /
    • 1998.10c
    • /
    • pp.261-266
    • /
    • 1998
  • 본 논문은 보조사로 인해 야기되는 한국어 미지격의 구문관계 중의성 해소를 위한 새로운 기법을 제안한다. 기존의 연구는 수작업으로 얻어진 동사의 의미적 선택 제약을 사용하는 방식과 단어 간의 공기패턴과 빈도를 어휘 레벨에서 추출하여 중의성을 해소하는 방식으로 나뉠 수 있다. 본 논문은 말뭉치에서 어휘 레벨이 아닌 개념패턴과 격의 분포 값을 자동으로 추출하여 미지격의 구문관계를 결정한다. 개념패턴과 용언의 격 분포 정보를 적용하여 구문분석 단계에서 실험한 결과, 본 논문이 제안한 방법은 92%의 미지격 결정 정확율을 보였다. 개념패턴은 지식의 저장공간을 줄이고 격 결정 범위를 확장할 수 있기에 범용 구문분석 시스템으로의 확장을 가능하게 한다.

  • PDF

The Design of Text and Dictionary Management System (텍스트 및 전자사전 관리시스템의 설계)

  • Lee, Jae-Sung;Choi, Byung-Jin;Lee, Woon-Jae;Choi, Key-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 1996.10a
    • /
    • pp.408-414
    • /
    • 1996
  • 자연언어처리 프로그램에서 어휘지식을 제공하는 전자사전은 그 중요성에 비해 작성 및 관리에 불편함이 많다. 본 논문에서는 전자사전의 작성 및 관리를 편리하게 할 수 있도록, 다양한 형태의 어휘 자료로부터 필요한 정보를 추출, 변형하고, 편집할 수 있는 텍스트 및 사전 관리시스템(TDMS: Text and Dictionary Management System)의 설계에 관하여 소개한다. TDMS에서는 SGML(Standard General Markup Language)의 일부를 사용하여, 표준사전 표기언어(SDML: Standard Dictionary Markup Language)를 정의하고, 이를 이용하여 다양한 형태의 사전 형식을 기술하고 있다. 또, 표준사전 표기언어로 표현된 사전이나 텍스트는 각종 응용프로그램에 독립적인 형태로 존재하여, 정보의 표준화와 교환을 용이하게 한다.

  • PDF

Biomedical Terminology Recognition using CRF (CRF를 이용한 생물/의학 전문용어 인식)

  • Bae, Young-Jun;Kim, Jae-Hoon;Ock, Cheol-Young;Choi, Yun-Soo
    • Annual Conference on Human and Language Technology
    • /
    • 2009.10a
    • /
    • pp.87-91
    • /
    • 2009
  • 전문용어의 수가 급증하면서 전문용어를 자동으로 인식하는 연구가 활발히 진행되고 있다. 전문용어를 인식하기 위해서 전문용어의 범위를 정한 뒤 그 전문용어의 분야를 선택해야 한다. 본 논문에서는 생물/의학 사전정보와 CRF(Conditional Random Fields) 기계학습 기법을 사용하여 연구를 진행한다. 기계학습을 위한 자질로 품사, 접사, 대소문자, 숫자, 특수문자, 단서어휘 등을 사용한다. 특히 단서어휘와 사전정보를 중요한 요소로 생각하여, 3가지 방법으로 나누어 실험한다. 총 분야의 개수는 7개이며, 각 분야별로 정확률, 재현율, F-measure를 측정한다. 경계인식은 83.92%의 정확률, 96.42%의 재현율, 89.73의 F-measure가 결과로 나타났고, 분야분류는 79.29%의 정확률, 91.06%의 재현율, 84.77%의 F-measure가 결과로 나타났다.

  • PDF

Morphological Processing in an Expanded Dictionary Environment (확장 사전 환경에서의 한국어 형태소 해석과 생성)

  • Cho, Young-Hwan;Cha, Hee-Joon;Kim, Gil-Chang
    • Annual Conference on Human and Language Technology
    • /
    • 1993.10a
    • /
    • pp.355-368
    • /
    • 1993
  • 형태소 처리의 기본 원칙은 사전의 표제어를 형태소 수준으로 함으로써 사전의 크기를 줄이고, 중복되는 정보의 양을 최소화하는 것이다. 본 논문에서는 형태소 처리를 위한 여러 환경 요소들 중에서 특별히 확장된 사전 표제어를 기본으로 하는 환경을 제안한다. 확장 사전 환경은 어휘에 대한 사전 표제어와 사전 정보의 분리를 기본으로 한다. 기본 사전 표제어에 대하여 어휘의 활용형을 사전 작성의 후처리인 사전 표제어에 대한 색인구조 구성시에 자동으로 확장함으로써 용언의 불규칙 활용과 음운 축약 현상에 대처한다. 확장 사전 환경의 장점은 형태소 해석과 생성시에 필요한 불규칙 활용에 대한 처리를 사전 확장 시간으로 앞당기고, 어절의 부분문자열과 사전 표제어간의 직접 대응성을 제공하여 여러 응용에 쉽게 적용이 가능하다는 것이다.

  • PDF

An English Vocabulary Learning Method by using Digital Storytelling (디지털 스토리텔링을 이용한 영어어휘학습설계)

  • Yoo, Ji-Ho;Lim, Heui-Seok
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2011.11a
    • /
    • pp.1445-1448
    • /
    • 2011
  • 이야기를 통한 메시지 전달은 가장 강력한 소통의 기구다. 그것은 디지털미디어가 발달하면서도 마찬가지이다. 정보의 급격한 양과 질적인 변화는 인간에게 다양하고 변화되는 학습이 요구되고 있으며, 평생교육의 개념이 강화되는 상황 속에서, 디바이스의 발달은 지식정보화 사회에서의 필수적인 학습도구로서 자리잡고 있으나, 진화를 요구 받게 되어있다. 특히, 영어학습에서 디바이스들은 EFL 에서 학습한계를 극복하고, 문화적 교육을 가능하게 하는 도구로 발전하고 있으므로, 수집된 정보들은 의미전달에 있어서 효율성을 취하는 설계에 있어서 디지털 스토리텔링방법의 효과성 검증과 디지털 매체 그리고 변화된 환경의 학습자 분석을 통한 교수학습의 촉진기반연구가 필요하며, 이에 기반한 영어어휘 교수 학습설계의 개발연구를 제안하고자 한다.

Engineering a deep-generative model for lyric writing based upon a style transfer of song writers (심층생성모델 기반 가수 스타일 전이형 작사 모델 구현)

  • Hong, Hye-Jin;Kim, So-Hyeon;Lee, Jee Hang
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2021.11a
    • /
    • pp.741-744
    • /
    • 2021
  • 본 논문은 사전 학습된 심층생성모델을 기반으로 가수 별 가사의 특성을 반영하여 새로운 가사를 생성하는 모델을 소개한다. 베이스 모델로 한국어 사전 학습 모델 KoGPT-2 를 사용하였으며, 총 가수 10 명의 노래 823 곡을 수집하여 미세조정 기법을 바탕으로 학습하였다. 특히, 가수 별로 구분한 가사를 학습 데이터로 구축하여, 가수 별로 독특하게 나타나는 가사 스타일이 전이되도록 하였다. 가수의 이름과 시작 단어를 입력으로 주고 작사를 수행한 실험 결과, (i) 가수 별로 생성되는 가사의 어휘와 스타일이 그 가수의 기존 곡들의 가사와 유사함을 확인하였고, (ii) 작사 결과 가수 별 차이를 확인하였다. 추후 설문을 통해, 개별 가수들의 가사와 생성된 가사의 어휘와 스타일 유사성을 확인하고, 가수 별 차이 또한 확인하고자 한다.