• 제목/요약/키워드: 의미론

검색결과 2,571건 처리시간 0.029초

의미론적 feature 공간상에서의 negative sampling을 통한 검색 성능 개선 (Improving passage retrieval via negative sampling from semantic feature space)

  • 이정두;홍범석;최원석;한영섭;전병기;나승훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.146-149
    • /
    • 2022
  • 최근 검색 태스크에서는 좋은 negative sample을 얻는 방법론들이 적용되어 큰 성능 향상을 이뤘다. 하지만 좋은 negative sample 대부분의 방법들은 큰 계산 비용이 든다. 따라서 본 논문에서는 계산 비용이 적고 효과적인 negative sample을 얻기 위해 Mixed Gaussian Recurrent Chain (MGRC) sampling을 사용하여 feature 공간상에서 의미론적으로 유사한 feature를 얻고 이를 negative sample로 활용하여 기존 baseline 모델보다 좋은 성능을 얻었다.

  • PDF

한국어 추론 벤치마크 데이터 구축을 위한 방법론 연구 (A Study on Methodology on Building NLI Benchmark Dataset in korean)

  • 한지윤;김한샘
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.292-297
    • /
    • 2020
  • 자연어 추론 모델은 전제와 가설 사이의 의미 관계를 함의와 모순, 중립 세 가지로 판별한다. 영어에서는 RTE(recognizing textual entailment) 데이터셋과 다양한 NLI(Natural Language Inference) 데이터셋이 이러한 모델을 개발하고 평가하기 위한 벤치마크로 공개되어 있다. 본 연구는 국외의 텍스트 추론 데이터 주석 가이드라인 및 함의 데이터를 언어학적으로 분석한 결과와 함의 및 모순 관계에 대한 의미론적 연구의 토대 위에서 한국어 자연어 추론 벤치마크 데이터 구축 방법론을 탐구한다. 함의 및 모순 관계를 주석하기 위하여 각각의 의미 관계와 관련된 언어 현상을 정의하고 가설을 생성하는 방안에 대하여 제시하며 이를 바탕으로 실제 구축될 데이터의 형식과 주석 프로세스에 대해서도 논의한다.

  • PDF

증명론적 타당성의 사소성 문제 (The triviality problem in proof-theoretic validity)

  • 정인교
    • 논리연구
    • /
    • 제18권3호
    • /
    • pp.307-335
    • /
    • 2015
  • 논증의 타당성에 대한 덤밋과 프라위츠의 증명론적 정의의 핵심사항 중의 하나는 열린 논증은 그 전제들에 대한 타당한 논증들을 그 결론에 대한 타당한 논증으로 전환하는 효과적인 방법이 있을 경우 타당하다는 조건이다. 그러나 그들의 정의에서 이 조건은 적절한 의미에서 결정 불가능한 전제들을 지니는 열린 논증들은 모두 사소하게 타당하게 된다는 부적절한 귀결을 지닌다. 필자는 프라위츠의 정의를 중심으로 증명론적 타당성 개념을 설명한 후, 이에 대한 사소성 문제를 제기하고 검토할 것이며, 이에 의거하여 프라위츠의 정의에 대한 수정안을 제시할 것이다.

  • PDF

라이프니츠의 법칙과 헤세이티즘(Haecceitism)

  • 손병홍
    • 논리연구
    • /
    • 제2권
    • /
    • pp.35-61
    • /
    • 1998
  • 개최들의 개별화를 위한 대표적인 법칙으로 간주되고 있는 라이프니츠의 법칙은 철학에서만 아니라 수학이나 논리학과 같은 순수과학에서도 중요한 법칙으로 사용되고 있다. 그러나 최근에 들어서 라이프니츠의 법칙은 그 논리적 위상과 관련하여 심각한 논란의 대상이 되고 있다. 이러한 논란의 근본적 원인은 칸트나 블랙과 같은 철학자들에 의해 라이프니츠의 법칙이 적용되지 않을 기능성을 보이는 반례가 제시되었고, 많은 철학자들이 이에 동조한 데에서 찾을 수 있다. 라이프니츠의 법칙의 논리적 위상과 관계된 철학자들의 입장은 크게 두 가지로 구분된다. 첫 번째 입장은 블랙 등에 의해 제시된 예들을 라이프니츠의 법칙에 대한 정당한 반례로 간주하는 입장이고, 두 번째 입장은 이러한 예들은 리이프니츠의 법칙에 대한 반례로 간주될 수 없다는 입장이다. 두 번째 입장을 쥐이는 대표적 철학자는 헷킹이다. 헷킹은 시공간에 대한 인습주의에 입각하여 블랙 등에 의해 제시된 예는 완전한 가능성을 나타내는 것이 아니고 라이프니츠의 법칙은 가능세계에 대한 메타 원칙으로 간주되어야 한다고 주장하고 있다. 본고에서 필자는 리이프니츠의 법칙을 옹호하려는 헷킹의 시도는 성공적이지 못하고, 또한 블랙 등에 의해 제시된 예들은 라이프니츠의 법칙에 대안 정당한 반례로 간주되어야 한다는 입장을 개진하고 있다. 필자가 이러한 입장을 취하게 된 것은 헷킹의 입장은 논리적 기능성과 물리적 기능성 사이의 구별을 어렵게 한다는 문제점 이외에도 가능세계 의미론과 관련된 중요한 문제점들을 야기하고 있기 때문이다. 가능세계 의미론과 관련된 문제점은 이러한 시도는 가능세계 의미론에 입각한 양상명제들의 해석의 범위를 제한하게 만들고 De-Re 양상명제에 대한 해석을 위해 필수적인 헤세이티즘의 수용을 불가능하게 한다는 것이다.

  • PDF

확률론적 무선통신 채널 모델 고찰 (A Consideration on the Stochastic Wireless Communication Channel Model)

  • 권순만;이종무;김춘경;천종민;박민국
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2007년도 심포지엄 논문집 정보 및 제어부문
    • /
    • pp.437-438
    • /
    • 2007
  • 본 논문에서는 우리의 일상생활에 많이 이용되고 있는 무선채널의 시변특성 및 확률론적 모델에 대해 고찰한다. 채널의 일반적인 시간영역 및 주파수 영역에서의 선형시변 특성의 물리적인 의미를 고찰하고 마지막으로 확률론적인 채널 특성을 나타내는 상관함수의 의미를 고찰한다.

  • PDF

Word2vec을 활용한 문서의 의미 확장 검색방법 (Semantic Extention Search for Documents Using the Word2vec)

  • 김우주;김동희;장희원
    • 한국콘텐츠학회논문지
    • /
    • 제16권10호
    • /
    • pp.687-692
    • /
    • 2016
  • 기존의 문서 검색 방법론은 TF-IDF와 같은 벡터공간모델을 활용한 키워드 기반 방법론을 사용한다. 키워드 기반의 문서검색방법론으로는 문제가 몇몇 문제점이 나타날 수 있다. 먼저 몇 개의 키워드로 전체의 의미를 나타내기 힘들 수 있다. 또 기존의 키워드 기반의 방법론을 사용하면 의미상으로 비슷하지만 모양이 다른 동의어를 사용한 문서의 경우 두 문서 간에 일치하는 단어들의 특성치만 고려하여 관련이 있는 문서를 제대로 검색하지 못하거나 그 유사도를 낮게 평가할 수 있다. 본 연구는 문서를 기반으로 한 검색방법을 제안한다. Centrality를 사용해 쿼리 문서의 특성 벡터를 구하고 Word2vec알고리즘을 사용하여 단어의 모양이 아닌 단어의 의미를 고려할 수 있는 특성 벡터를 만들어 검색 성능의 향상과 더불어 유사한 단어를 사용한 문서를 찾을 수 있다.

객체지향 뷰 기술을 이용한 투명한 스키마 진화 (Transparent Schema Evolution using Object-Oriented View Technology)

  • 나영국
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제28권1호
    • /
    • pp.1-14
    • /
    • 2001
  • 중대한 산업용 소프트웨어가 동작하는 공유된 객체지향 데이터베이스를 안전하게 변경하기 위해서는, 그 공유 데이터베이스를 변경할 동안 데이터베이스 위에서 작동하는 기존의 응용 프로그램이 지속적으로 작동되어야 한다. 데이터베이스 변경을 필요로 하는 새로운 요구사항은 새 응용 프로그램의 추가, 기존 응용 프로그램의 기능 확장, 초기 디자인 에러 수정 등으로 인하여 발생할 수 있다. 우리는 한 사람의 사용자가 다른 사용자에게 악영향을 주지 않고 데이터베이스 스키마를 변경할 수 있게 하여 이 문제를 해결하는 투명한 스키마 진화(TSE: Transparent Schema Evolution) 방법론을 소개한다. 이 방법론은 기존의 스키마를 직접 변경하는 대신 스키마 변경 연산의 의미를 반영하는 데이터베이스 큐를 공유 객체지향 데이터베이스 상에 생성하여 투명한 진화를 달성한다. 데이터베이스의 용량을 증가시키지 못하는 뷰 메카니즘의 한계를 극복하기 위하여 이 방법론은 데이터베이스 용량 증가 연산에 대하여 다음의 새 단계로 정렬된다. (1) 기저의 베이스 스키마는 데이터베이스 용량 증가를 위해 물리적으로 변호한다. (2) 데이터베이스 변경의 의미를 달성하는 목표 뷰가 위의 변화된 베이스 스키마로부터 생성된다. (3) 변화 이전의 베이스 스키마는 데이터베이스 뷰로서 재 구축된다. 이로써 기존의 다른 사용자가 정의한 데이터 인터페이스가 보존된다. 우리는 객체-지향 뷰 기술을 이용하여 스키마 변화 연산을 구현함으로써 TSE 방법론의 구현가능성(feasibility)을 확인하였다. 표준적인 객체-지향 뷰 모델이 정의되고 상용 객체-지향 데이터베이스인 잼스톤(Gemstone) 위에 구현되었다. 그 뷰 모델은 갱신 의미(semantic) 정의를 그 뷰가 베이스 스키마의 갱신 의미를 보존하도록 정의하였다. 그러한 뷰는 사용자가 그들이 실제로는 베이스 스키마가 아니라 뷰에서 작업하고 있다는 사실을 모르게 하기 위하여 TSE에서 필요하다.

  • PDF

언어장애인용 문장발생장치에 적용 가능한 동사예측 (An Applicable Verb Prediction in Augmentative Communication System for Korean Language Disorders)

  • 이은실;홍승홍;민홍기
    • 감성과학
    • /
    • 제3권1호
    • /
    • pp.25-32
    • /
    • 2000
  • 본 논문에서는 언어장애인용 문장발생장치의 통신율을 증진시키기 위한 처리방안으로 신경망을 이용하여 문장발생장치에 동사예측을 적용하는 방법을 제안하였다. 각 단어들은 구문론과 의미론에 따른 정보벡터로 표현되며, 언어처리는 전통적으로 사전을 포함하는 것과는 달리, 상태공간에서 다양한 영역으로 분류되어 개념적으로 유사한 단어는 상태공간에서의 위치를 통하여 알게 된다. 사용자가 심볼을 누르면 심볼에 해당하는 단어는 상태공간에서의 위치를 찾아가며, 신경망 학습을 통해 동사를 예측하였고 그 결과 제한된 공간 내에서 약 20% 통신율 증진을 가져올 수 있었다.

  • PDF

온톨로지 기반 SOA 개발 방법론 (Ontology Based SOA Development Methodology)

  • 최고봉;박세권;류승완;명광식
    • 한국IT서비스학회:학술대회논문집
    • /
    • 한국IT서비스학회 2009년도 추계학술대회
    • /
    • pp.188-197
    • /
    • 2009
  • 최근 비즈니스 환경이 빠르게 변화함에 따라 기업의 민첩한 대응이 요구되고 있으며, 서비스지향 아키텍쳐(Service-Oriented Architecture(SOA))가 유력한 대안으로 제시되고 있다. SOA는 서비스를 공유하고 재사용 할 수 있도록 정보시스템을 구축하는 소프트웨어 설계 방법론으로써, 급변하는 비즈니스 환경에 맞도록 민첩한 대응이 가능하도록 한다. 이러한 SOA의 장점으로 인해 현재 많은 기업에서 SOA를 이용한 시스템 개발을 진행하고 있다. 그러나, 이러한 SOA를 적용한 시스템 개발 노력이 계속 시도되고는 있지만 SOA기반의 표준화된 방법론은 아직 정립되지 않은 실정이다. 따라서, SOA를 이용한 시스템 개발은 현재 많은 어려움에 직면하고 있다. 본 논문에서는 표준화된 방법론으로써 온톨로지 기반의 SOA 개발방법론을 제시한다. 제안하는 방법은 온톨로지를 이용하여 서비스를 서비스 프로파일과 서비스 모델로 구분하여 정의하여 서비스 식별을 위한 기본 프레임워크를 제시한다. 또한 식별된 서비스들을 온톨로지 개념을 이용하여 검색, 재사용 할 수 있는 방법론을 제시하여 서비스 재활용도를 높일 수 있도록 한다. 본 논문에서 제안하는 온톨로지 기반의 SOA 개발 방법론은 현재 사용중인 다른 개발방법론과 비교 분석하였다. 비교 결과 본 논문에서 제안하는 온톨로지 기반 SOA 개발방법론은 현재까지 제안된 다른 방법보다 효율적이고 체계적인 개발 결과를 제공하는 것으로 나타났다. 본 논문에서 제안하는 연구 결과는 SOA에 표준방법론의 개발의 기반을 제공하여, 서비스의 의미론적 접근에 대한 시도 등 향후 연구에 중요한 방향성을 제공할 수 있을 것으로 기대 된다.

  • PDF

Plasmid-DNAgram : 녹색형광단백질 발현 Plasmid DNA 기반 분자컴퓨팅에 의한 언어 퍼즐 문제 해결 (Plasmid-DNAgram : Anagram Solving by Molecular Computing Based on GFP-Expressing Plasmid DNA)

  • 김수동;이은석;장병탁
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2003년도 제15회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.293-299
    • /
    • 2003
  • 인간 게놈 프로젝트가 완료됨에 다라 생체서열과 언어 사이의 대응 관계가 부각되고 있다. 본고에서는 Lewis Carroll의 언어 유희 사례를 컴퓨터생물학의 측면에서 재조명하고, Carroll이 제시한 문제 중에서 간단한 anagram 문제의 해결을 다루고자 한다. 우선 DNA 컴퓨팅의 방법론을 적용한 DNAgram의 개념을 확장하여 plasmid-DNAgram의 개념을 새롭게 도입하였다. 이 개념을 형광단백질에 대한 DNAgram의 개념을 확장하여 plasmid-DNAgram의 개념을 새롭게 도입하였다. 이 개념을 형광단백질에 대한 FRET(fluorescent resonance energy transfer)분석기법의 응용 사례인 cameleon 형광단백질에 대한 FRET 분석기법에 적용함으로써 anagram 문제의 어휘론적, 구문론적, 의미론적, 화용론적 측면에 대응하는 바이오분자 컴퓨팅 방법론을 제안하였다.

  • PDF