• 제목/요약/키워드: 의미(語義)

검색결과 29건 처리시간 0.025초

상호 정보를 이용한 어의 모호성 해소에 관한 연구 (A Study on Resolving Word Sense Ambiguity Using Mutual Information)

  • 전미선;박세영
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1994년도 제6회 한글 및 한국어정보처리 학술대회
    • /
    • pp.369-373
    • /
    • 1994
  • 정보 검색 시스템의 정확성은 색인어의 정확성과 질의 해석의 정확성에 의존한다. 한국어 정보 검색분야에서는 한국어의 특성을 고려하는 것이 무엇보다 중요하다. 한국어의 문서 색인과 질의 해석시 야기되는 어의 모호성(word sense ambiguity)을 가지는 단어에 대해서는 어의 모호성을 해소한 정확한 색인과 질의 해석이 전제되어야 정확한 문서를 검색해낼 수 있다. 본 논문은 한국어 문서 색인시 동음이의어(homonym)에 의해 발생하는 어의 모호성을 해소하기 위한 방안에 대해 다루고 있으며 의미적 관련 정보를 이용할 것을 제안하고 타당성을 보이는 실험 결과를 제시한다.

  • PDF

한국어 어휘의미망을 이용한 자동 수화 번역 시스템의 개발 (Development of Automatic Sign Language Translation System using Korean WordNet)

  • 김민호;최성기;권혁철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 추계학술발표대회
    • /
    • pp.1358-1361
    • /
    • 2013
  • 한국어와 한국 수화 간 자동 번역을 위해서는 한국어-한국 수화 대역어 사전이 필요하지만, 현재 한국 수화 사전으로 가장 공신력 있는 한국 수화 사전은 등재 어휘 수가 약 12,000개에 불과하다. 이 때문에 한국어를 한국 수화로 자동 번역을 할 때 대치어가 없어 완벽하게 번역이 되지 않는다. 본 연구에서는 한국 수화 사전의 미등재어로 말미암은 번역률 저하를 최소화하고자 한국어 어휘의미망의 동의어와 상 하위어 정보를 이용한다. 또한, 자동 번역에서 빈번하게 발생하는 어의 중의성 문제도 한국어 어휘의미망의 정보를 이용하여 어의 중의성 해소 규칙을 일반화한다.

세종 전자사전과 준지도식 학습 방법을 이용한 용언의 어의 중의성 해소 (Word Sense Disambiguation of Predicate using Semi-supervised Learning and Sejong Electronic Dictionary)

  • 강상욱;김민호;권혁철;오주현
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제22권2호
    • /
    • pp.107-112
    • /
    • 2016
  • 국립국어원의 주관으로 10년에 걸쳐 구축된 21세기 세종 계획의 결과물들은 한국어를 대상으로 한 대부분의 자연언어 처리 시스템 및 연구에 널리 이용되고 있다. 21세기 세종 계획의 결과물 중, 세종 전자사전은 한국어 어휘의 내재정보에 대한 체계적인 분석 정보를 담고 있어 세종 전자사전 내의 상세 정보를 이용하여 어의 중의성 해소(Word Sense Disambiguation) 규칙을 구축하는 데 이용할 수 있다. 하지만 한국어의 특성상 다양한 문형과 논항이 출현할 수 있으므로 문형과 논항에 대한 모든 정보를 담을 수 없는 단점이 존재한다. 본 연구에서는 세종 전자사전의 용언 하위범주화 정보와 한국어 어휘의미망(Korean Lexico-semantic Network)을 이용하여 구축한 어의 중의성 해소 규칙을 준지도 학습 방법을 이용하여 논항의 선택제약 정보를 확장 및 일반화한다.

약어와 두문자어의 모호성 해결을 통한 임상 의무기록의 정규화 (Normalization of Clinical Medical Records by Disambiguating Abbreviations and Acronyms)

  • 배인호;김진상;김윤년
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 추계학술발표대회
    • /
    • pp.676-678
    • /
    • 2008
  • 임상 의무기록에 나타나는 많은 두문자어들은 기계적인 처리과정에서 의무기록의 모호성을 크게 증가시키기 때문에, 정보추출이나 텍스트 마이닝을 하기 전에 전처리 과정으로 의무기록이 정규화 되어야 한다. 본 연구에서는 임상 의무기록 중 하나인 퇴원요약지에 사용된 약어와 두문자어들의 모호성을 제거하기 위한 정규화 시스템을 설계하고 구현했다. 정규화를 위해 문맥정보를 이용하여 의무기록의 종류와 기록내 위치정보를 파악하였고 이를 이용하여 약어와 두문자어의 의미를 학습하고 분류하였다. 본 연구에서 구현한 정규화 시스템은 실험에서 6가지 두문자어들이 가지는 16가지 의미들에 대해 94.7%의 정확률을 얻었다.

그림의 부호화 과정과 신경기제 : fMRI 연구 (Neural Substrates of Picture Encoding: An fMRI Study)

  • 강은주;김희정;김성일;나동규;이경민;나덕렬;이정모
    • 인지과학
    • /
    • 제13권1호
    • /
    • pp.23-40
    • /
    • 2002
  • 본 연구는 fMRI를 이용하여 정상인에 있어서 자극 유형, 특히 그림 자극의 부호화와 관련된 두뇌영역을 확인하고자 하였다. Scan 1에서는 그림 자극의 부호화 과정에 관여하는 두뇌 영역을 화인하기 위하여 어의범주 판단 과정 중에 그림과 단어에 대하여 비교 관찰하였으며 Scan 2에서는 그림자극에 대하여 그림 명명과제와 어의범주 판단과제를 비교하여 과제 유형에 따른 그림의 부호화에 관여하는 두뇌 활성화 영역을 연구하였다. 피험자는 어의범주(인공물/자연물)에 따라 마우스를 눌러 반응하거나(Scan 1) 그림명명이나 범주 소속 여부를 속으로 말하도록(subvocal response)(Scan 2) 요구되었다. 자극의 유형과 무관하게 부호화 중에 좌측 전전두 영역 양측의 두정엽, 그리고 양측의 고차시각 피질 등이 공통적으로 활성화 되었다. 그림보다 단어의 부호화에는 좌측 하 전전두엽, 우측 전측 전전두 영역, 양측의 도(insula), 좌측 두정-측두엽 등 광범위한 언어/개념관련 두뇌 영역에서 더 높은 활성화가 발견되는 반면, 그림의 부호화에는 양측의 고차 시각 영역과 해마방화(parahippocampal gyrus) 영역에서 더 높은 활성화가 관찰되었다. 이는 동일한 어의판단 과제를 수행하는 과정에도 단어는 어의적/언어적 처리가 그림은 지각적 정보처리 및 novelty 관련 정보처리가 서로 다른 해부학적인 영역에 의하여 매개됨을 의미한다. 그림 명명과제나 어의범주 판단과제 모두를 속으로 말하는 수행(Scan 2)은 배측 하 전전두 영역, 즉 Broca영역의 활동 증가를 야기시켰으며, 특히 명명과제 수행에는 어의범주 판단과제를 수행할 때에 비하여 양측의 시각영역에서 더 많은 활성화가 발견되었는데, 이는 대상의 명칭을 인출하는 과정에 고차 시각정보 처리가 더 많이 관여하였을 가능성을 시사한다.

  • PDF

한국어 부사어의 분류와 분포 제약

  • 채희락
    • 한국언어정보학회:학술대회논문집
    • /
    • 한국언어정보학회 2001년도 학술대회 논문집
    • /
    • pp.95-96
    • /
    • 2001
  • 문장에서 술어를 수식하는 대표적인 표현은 부사어이다. 부사어는 일반적으로 문장 구성에서 핵심적 역할을 하지 않는 첨가어(adjuncts)이기 때문에 핵심적인 역할을 하는 보충어(complements)에 비해 상대적으로 연구가 덜 이루어진 분야이다. 그렇지만 부사어는 피수식어의 의미를 구체화/한정하는 기능을 하기 때문에 정확한 의사소통을 위해서는 반드시 필요한 요소이며 어순, 호응(concord)등의 통사적 현상과도 밀접한 관련이 있다. 이 연구의 일차적 목적은 이러한 부사어를 통사적, 의미적 기준에 의해 정확하게 분류하고 그들의 분포제약을 밝히는 것이다. 그 다음으로, 부사어와 관련된 통사 현상으로, 부사어와 피수식어의 공 기(co-occurrence)관계 및 부사어와 술어 어미의 호응 관계에 대한 분석을 제공하려고 한다. 부사어는 통사적인 기준과 의미적인 기준으로 분류할 수 있다 (손남익 1995, 김경훈 1996, 임유종 1998). 통사적 기준으로는 단어나 구를 수식하는 성분부사와 문장을 수식하는 문장 부사로 나누는 방법과 위치에 대한 제약이 있느냐 없느냐에 따라 제약부사와 자유부사로 나 누는 방법이 있다. 이 두 통사론적 기준에 의해 분류되는 부사들은 서로 어떤 상관관계를 보이고 있는지 살펴 볼 것이다. 일반적으로 문장부사는 문두에 놓여야 한다는 위치적 제 약 이 있기 때문에 제약부사로 분류된다. 의미적 기준으로 부사어를 분류할 수도 있는데, 시간/ 공간 부사어, 양태/정도 부사어 등으로 나눌 수 있다. 의미적 기준에 의해 분류된 부사어는 통사적 기준에 의해 분류된 것들과는 어떤 상호 관련성을 맺고 있는지 살펴 볼 것이다. 일 반적으로 시간부사와 장소부사는 자유부사에 속하며 양태부사와 정도부사는 제약부사에 속 한다. 부사어와 피수식 요소와의 통사적 공기 관계 및 의미적 관계 그리고 그와 관련된 문 법 현상도 연구의 대상이 된다. 예를 들어, 자유로운 어순을 가진 부사들이지만 “*순이는 빨리 과연 달린다”에서 볼 수 있는 종류의 분포적 특성을 알아 볼것이다 (심재기 1982, 송 철의 1989). 또한 “길이/*길게 빛나다”와 “*길이/길게 드리워졌다”와 같은 대조에서 나타나는 통사, 의미적 기능의 상관 관계 및 제약들의 상호 작용도 살펴 볼 것이다.

  • PDF

어의의 기술 -중간언어의 관점에서

  • 장석진
    • 한국언어정보학회:학술대회논문집
    • /
    • 한국언어정보학회 2001년도 학술대회 논문집
    • /
    • pp.113-139
    • /
    • 2001
  • 중간언어 (interlingua, IL) 구축을 지향하는 시각에서 단어의 다의성 (polysemy) 문제를 각종 워드넷의 기술 방식과 용례를 대비하여 논의하고, 센스(어의) 번호를 부착한 세계 워드넷 (Would Wordnet) 데이터베이스를 구상하고, 이 연장 선상에서 (Pustejvsky 식) 생성 어휘 부와 TMR(텍스트의미표상)이론을 가미한 제약기반 통합문법(CUG)으로 IL구축에 다리를 놓고, 이로부터 개별언어 기술로 변환한다.

  • PDF

두문자어 의미 태깅 방법 (A Method for Acronym Sense Tagging)

  • 황명권;정도헌;성원경
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 춘계학술발표대회
    • /
    • pp.1199-1201
    • /
    • 2011
  • 본 논문은 의미적 정보처리에서 걸림돌이 되는 두문자어(Acronym)의 의미처리를 위한 전체적인 구조설계를 포함하고 있다. 두문자어는 일반적으로 복합어에서 의미가 큰 단어의 첫 번째 문자들로 구성된다. 두문자어를 구성하는 복합어는 다른 일반 명사들과 달리 대부분 고유한 의미를 갖고 있기 때문에 정보처리에서 의미 파악의 핵심적인 역할을 수행할 수 있다. 본 논문은 문서에서 출현하는 두문자어의 정확한 의미를 판단하기 위한 방법을 제안하며 현재까지 진행된 결과에 대해 언급하도록 한다.

한성부 동촌(東村) 어의동지(於義洞池) 일대의 환경 특성과 장소적 의미 (A Study on Environmental Traits and Significance of Eouidongji Pond(於義洞池) Area in Dongchon(東村), Hanseong-bu(漢城府))

  • 길지혜;손용훈;황기원
    • 한국전통조경학회지
    • /
    • 제35권2호
    • /
    • pp.1-14
    • /
    • 2017
  • 본 연구는 고지도에서 한성부 성내 동쪽인 '동촌(東村)'에 표기된 못의 환경 특성과 장소적 의미를 파악하는 데 목적을 두고 있다. 여러 문헌과 지도 자료를 검토하여 못의 명칭을 정리하였고, 연구에서는 그중 국가 공식기록과 지리적 명칭을 따라 '어의동지(於義洞池)'로 명명하였다. 연구 결과, 첫째, 입지 및 환경 특성을 보면 어의동지 일대는 도성 내에서 전원적 정취가 있는 지역이었다. 산자락 계곡부 물이 많이 모이는 지대에 있었고, 약 2천 평 정도의 필지 안에서 수위에 따라 못 경계가 변화하였다. 둘째, 조성 배경을 볼 때 어의동지는 자연적으로 형성된 못을 국초 도성 내 수체계를 관리하면서 함께 정비한 것으로 보인다. 유수지 역할과 함께 연(蓮) 관련 부산물을 진상하는 연지(蓮池)로 운영되었고, 인근에 별궁이 활발히 이용되면서 함께 관리된 것으로 판단한다. 20세기 초 이미 매몰된 상태였고, 연지를 다시 수축하고자 했으나 식민지기 학교 부지로 편입되며 소멸하였다. 셋째, 어의동지는 개인이 완상하거나 멀리서 조망하며 자연경관 일부로 감상하는 경우가 많았다. 또한, 동촌에 진입하는 가로 가까이 있는 진입경관이었고, 주변 다른 행락지와 연계해 방문하기 좋았다. 어의동지의 입지 및 환경 특성, 조성 및 소멸 배경과 시대별 운영 관리, 당대의 이용과 경관 감상의 특성을 고찰한 결과, 어의동지는 국가적으로는 도성 내 수체계를 보완하면서 국용 연 수확물을 제공할 수 있는 실용적 가치가 높은 못이었다. 또한, 도시환경 차원에서는 넓은 면적으로 펼쳐진 수평적 랜드마크이자 효과적인 경계지물이었다. 그리고 한성부 지역민이 자유롭게 이용할 수 있는 열린 장소였고, 접근성이 높아 공공적 가치도 높았다.

단어 간 연관성 측정을 통한 문맥 철자오류 교정 (Context-sensitive Spelling Correction using Measuring Relationship between Words)

  • 최성기;김민호;권혁철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 추계학술발표대회
    • /
    • pp.1362-1365
    • /
    • 2013
  • 한국어 텍스트에 나타나는 오류어의 유형은 크게 단순 철자오류와 문맥 철자오류로 구분할 수 있다. 이중 문맥 철자오류는 문맥의 의미 통사적 관계를 고려해야만 해당 어휘의 오류 여부를 알 수 있는 오류로서 철자오류 중 교정 난도가 가장 높다. 문맥 철자오류의 유형은 발음 유상성에 따른 오류, 오타 오류, 문법 오류, 띄어쓰기 오류로 구분할 수 있다. 본 연구에서는 오타 오류에 의해 발생하는 문맥 철자오류를 어의 중의성 해소와 같은 문제로 보고 교정 어휘 쌍을 이용한 통계적 문맥 철자오류 교정 방법을 제안한다. 미리 생성한 교정 어휘 쌍을 대상으로 교정 어휘 쌍의 각 어휘와 주변 문맥 간 의미적 연관성을 통계적으로 측정하여 문맥 철자오류를 검색하고 교정한다. 제안한 방법을 적용한 결과 3개의 교정 어휘 쌍 모두 90%를 넘는 정확도를 보였다.