• Title/Summary/Keyword: 의미 모호성

검색결과 200건 처리시간 0.03초

OpenGIS공간 연산자 구현시의 모호성 분석 (Analyzing the Ambiguities of Spatial Operators in OpenGIS)

  • 정소영;홍은지;유석인
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (1)
    • /
    • pp.105-107
    • /
    • 1998
  • 지리 정보 시스템(Geographic Information System, GIS)에서 이용되는 공간 데이터 모델의 표준 규약인 OpenGIS 명세서(specification)를 이용하여 공간 관계 연산자(Spatial Relational Operator)를 구현하고자 할 때 세부적인 의미가 명확하게 이해되지 않는 경우가 많다. 본 논문에서는 각각의 공간 객체들의 내부(Interior), 외부(Exterior), 경계(Boundary)의 정의를 이용하여 실제로 공간 연산자를 구현할 때 고려해야 하는 의미의 불확실성에 대해 고찰하여, 세부적 의미를 밝힌다.

한국어 개체명 인식 과제에서의 의미 모호성 연구 (A study on semantic ambiguity in the Korean Named Entity Recognition)

  • 김성현;송영숙;송치성;한지윤
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.203-208
    • /
    • 2021
  • 본 논문에서는 맥락에 따라 개체명의 범주가 달라지는 어휘를 중심으로 교차 태깅된 개체명의 성능을 레이블과 스팬 정답률, 문장 성분과 문장 위치에 따른 정답률로 나누어 살펴 보았다. 레이블의 정확도는 KoGPT2, mBERT, KLUE-RoBERTa 순으로 정답률이 높아지는 양상을 보였다. 스팬 정답률에서는 mBERT가 KLUE-RoBERTa보다 근소하게 성능이 높았고 KoGPT2는 매우 낮은 정확도를 보였다. 다만, KoGPT2는 개체명이 문장의 끝에 위치할 때는 다른 모델과 비슷한 정도로 성능이 개선되는 결과를 보였다. 문장 종결 위치에서 인식기의 성능이 좋은 것은 실험에 사용된 말뭉치의 문장 성분이 서술어일 때 명사의 중첩이 적고 구문이 패턴화되어 있다는 특징과 KoGPT2가 decoder기반의 모델이기 때문으로 여겨지나 이에 대해서는 후속 연구가 필요하다.

  • PDF

IT 산업계의 기술이전에 관한 연구 (A Study on Technology Transfer in IT Industry)

  • 성태경
    • 경영과정보연구
    • /
    • 제28권3호
    • /
    • pp.45-68
    • /
    • 2009
  • 본 연구는 한국의 IT 산업계에서 기술의 이전에 영향을 미치는 요인을 파악하고, 파악된 요인에 기술 이전의 성공에 미치는 영향력을 조사하며, IT 산업계의 성공적인 기술 이전을 위한 전략을 제시하는 데 그 목적이 있다. 기술의 이전에 영향을 미치는 주요 요인들로는 대화, 거리, 모호성, 동기를 들 수 있다. 대화는 기술을 얼마나 정확하고 효율적으로 전달할 수 있는가 그리고 전달매체의 충분성을 의미한다. 연구개발자와 이를 상용화하는 사용자간의 대화정도를 측정하는 것으로 아주 수동적에서 아주 능동적으로 평가할 수 있다. 거리는 전달자와 수신자와의 물리적 그리고 문화적 차이를 의미한다. 최근 전달자와 수신자 사이의 문화적(가치, 판단기준, 태도, 교육, 환경 등) 차이에 대한 중요성이 점차 대두되고 있다. 모호성은 이전하고자 하는 기술이 얼마나 구체적이고 분명한가를 의미한다. 모호성이 높은 기술은 이해시키기 어렵고, 이해하기 어렵고, 실현 가능성을 증명하기 어렵게 때문에 이전이 용이하지 않다. 동기는 기술의 이전을 하여야 할 동기가 부여되거나 아니면 이를 유도할 유인책이 있는가를 의미한다. 기술 이전 준거틀은 기술의 이전에 영향을 미치는 주요 요인들(대화, 거리, 모호성, 동기)의 조합으로 나타낸 것이다. 각 격자는 4가지 경우를 나타내는데, 격자 I과 IV는 기술의 이전이 완벽한 상황과 불가능한 상황을 의미하며, 격자 III과 IV는 기술의 이전에 영향을 미치는 요소가 복합하여 강점과 약점으로 작용하는 상황을 나타낸다. 기술 이전 준거틀에서 가장 기술 이전의 가능성이 높은 격자를 성취하기 위해서는 적절한 기술 이전 전략의 수립 및 집행이 중요하다고 할 수 있다. 따라서 정부는 물론 유관기관 및 기술 이전 추진 조직은 기술 이전에 영향을 미치는 주요 요인을 최적화하는 대안 개발에 초점을 맞추어야 할 것이다.

  • PDF

한국어 텍스트의 개체 URI 탐지: 품사 태깅 독립적 개체명 인식과 중의성 해소 (A Non-morphological Approach for DBpedia URI Spotting within Korean Text)

  • 김영식;함영균;김지성;황도삼;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2014년도 제26회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.100-106
    • /
    • 2014
  • URI spotting (탐지) 문제는 텍스트에 있는 단어열 중에서 URI로 대표되는 개체(entity)에 해당되는 것을 탐지하는 것이다. 이 문제는 두 개의 작은 문제를 순차적으로 해결하는 과제이다. 즉, 첫째는 어느 단어열이 URI에 해당하는 개체인가를 인식하는 것이고, 둘째는 개체 중의성 해소 문제로서 파악된 개체가 복수의 URI에 해당할 수 있는 의미적 모호성이 있을 때 그 URI중 하나를 선택하여 모호성을 해소하는 것이다. 이 논문은 디비피디아 URI를 대상으로 한다. URI 탐지 문제는 개체명 인식 문제와 비슷하나, URI(예를 들어 디비피디아 URI, 즉 Wikipedia 등재어)에 매핑될 수 있는 개체로 한정되므로 일반적인 개체명 인식 문제에서 단어열의 품사열이 기계학습의 자질로 들어가는 방법론과는 다른 자질을 사용할 수 있다. 이 논문에서는 한국어 텍스트를 대상으로 한국어 디비피디아 URI 탐지문제로서 SVM을 이용한 개체경계 인식 방법을 제시하여, 일반적 개체명 인식에서 나타나는 품사태거의 오류파급효과를 없애고자 한다. 또한 개체중의성 해소 문제는 의미모호성이 주변 문장들의 토픽에 따라 달라지므로, LDA를 활용하며 이를 영어 디비피디아 URI탐지에서 쓰인 방법들과 비교한다.

  • PDF

관계형 데이터베이스에서의 시맨틱 기반 키워드 탐색 시스템 (Semantic-based Keyword Search System over Relational Database)

  • 양영휴
    • 한국컴퓨터정보학회논문지
    • /
    • 제18권12호
    • /
    • pp.91-101
    • /
    • 2013
  • 키워드의 모호성은 효율적인 키워드 탐색에 있어서 일반적인 이슈가 되어왔는데, 이 모호성은 탐색결과의 신뢰성에 큰 영향을 줄 수 있으며, 기본적으로 질의에 사용된 용어 자체가 가지는 문맥상 의미의 모호함에 기인한다. 질의 자체의 모호함뿐만 아니라, 사용자들이 그 탐색 결과를 적절하게 해석하기 위해 결과에 나타나는 키워드간의 관계도 중요하므로 명확하게 명시 되어야 한다. 이 논문에서는 기존의 질의 용어와 스키마 용어/인스턴스간의 키워드 매핑기법을 적용하여 키워드 탐색의 모호성을 해결한다. 용어간의 매핑에서는 질의 키워드와 스키마 용어간의 구문적 유사성은 물론 시맨틱 유사성까지 고려하기 때문에 기존의 시스템에 비해 매핑과 정밀도가 50% 이상 상승하는 결과를 얻을 수 있다. 탐색결과에 나타나는 용어간의 불분명한 관계를 점 더 명확하게 나타내기 위하여 시맨틱 웹 기술을 적용하여 키워드간의 의미 있는 관계를 더 많이 지식베이스 내에서 찾을 수 있도록 하였다.

연관 관계와 TF*IDF를 이용한 검색 결과 Re-Ranking (Re-ranking for Search result using association relationship and TF*IDF)

  • 이정훈;전서현
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2010년도 한국컴퓨터종합학술대회논문집 Vol.37 No.1(C)
    • /
    • pp.349-352
    • /
    • 2010
  • 질의를 이용한 정보 검색 기술에서 단어 의미의 모호성에 의해 사용자가 검색 하고자 하는 주제 이외의 문서 까지 검색되고 있다. 이러한 문제는 모바일기기의 검색 환경에서 두드러진다. 모바일에서의 검색은 문서의 로딩속도가 느리며 작은 화면에 의해 스크롤이 잦다. 그러므로 원하는 검색 결과가 검색 첫 페이지 이외에 위치하거나, 또는 페이지 하단에 위치할 경우 검색 결과를 확인하는 대에 많은 시간과 노력이 필요하다. 이러한 문제를 해결하기위해선 단어 의미의 모호성을 해결하고 사용자가 검색하고자하는 주제의 검색결과를 검색 상위에 위치시킬 수 있는 방법을 필요로 한다. 이 연구에서는 연관 단어 추출과 TF*IDF를 이용하여, 검색결과를 re-ranking하는 방법을 제시한다.

  • PDF

의미속성에 기반한 한국어 명사 의미 TAG에 관한 연구 (A Study on A Korean Noun Semantic TAG based on Semantic Features)

  • 이수광;조평옥;안미정;옥철영;박재득;박동인
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1998년도 제10회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.412-418
    • /
    • 1998
  • 의미 TAG는 한국어 기초어휘에 대한 개념지식을 구축하는 데 기본이 될 뿐만 아니라, 문장 분석시의 구조적 모호성과 단어 의미 모호성을 해소하는 중요한 단서를 제공할 수 있다. 이러한 의미 TAG가 실용적으로 여러 응용 시스템에서 사용되기 위해서는 광범위하고 타당한 자료를 바탕으로 하여 객관적인 방법으로 설정 되어야 한다. 국어사전의 뜻풀이말에서의 상위개념을 표제어의 상위어로 선정하는 bottom-up 방식으로 구축하였던 한국어 명사의미체계는 근본적으로 사전편찬자의 비일관적인 뜻풀이말의 기술에 따른 여러 문제점이 있었다. 본 연구에서는 이러한 문제점들을 해결하기 위해서 사전 뜻풀이말에서 상위개념을 수식하는 어절과 용언의 의미호응관계에서 상위개념의 의미속성을 추출하고, 이들 의미속성에 의한 명사 의미체계를 구축하여 이를 바탕으로 명사의미 TAG를 설정할 수 있도록 하였다.

  • PDF

대화형 상품 검색 시스템에서 의미 구조 생성에 관한 연구 (Generation of a Semantic Structure on a Conventional Goods Search System)

  • 정혜경;배우정;이용석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2006년도 제18회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.197-204
    • /
    • 2006
  • 인터넷 쇼핑몰 분야에서 한국어 인터페이스에 대한 필요성이 대두되면서 이와 관련한 연구가 진행되어 왔다. 이러한 기존 연구들의 문제점은 다른 응용 분야에 대한 확장성이 떨어지고, 대화식 질의 문장을 처리하기 위해 필요한 상황 지식을 사용할 수 없다는 것이다. 확장성을 위해 한국어 인터페이스는 내부 구현의 변경 없이 도메인 지식의 교체만으로 다른 분야에 대한 적용이 쉬워야 한다. 아울러, 한국어 질의 문장을 SQL이나 ACL과 같은 여러 응용 분야의 인공 언어에 쉽게 변환할 수 있으려면 모호성이 전혀 없는 의미 구조로 표현되어야 한다. 이렇게 표현된 의미 구조는 상황 지식의 표현과 적용을 용이하게 한다. 본 논문은을 Sowa의 개념 구조를 이용하여 의사 의미 구조를 유형 정의, 관계형 정의, 액터와 같은 도메인 지식베이스를 이용하여 표준 의미 구조로 변환하는 시스템을 제안한다. 본 논문은 먼저 필요한 도메인 지식베이스의 종류와 역할 등을 설명하고, 상황 지식을 이용하여 불완전한 의미 구조를 완전한 의미 구조로 변환하는 방법을 보인다. 아울러, 같은 의미를 갖는 여러 형태의 의사 의미 구조가 하나의 표준 의미 구조로 변환됨으로서 시스템의 일관성을 유지하는데 용이함을 보일 것이다. 본 시스템에서 생성한 의미구조는 중간 언어의 역할을 하므로, 제안하는 한국어 인터페이스 시스템은 데이터베이스 분야뿐만 아니라 에이전트 분야, 시맨틱 웹 분야 등에서도 손쉽게 적용할 수 있다는 장점을 가진다.

  • PDF

'맞은편'은 어디인가? 공간언어의 모호성과 의사소통 문제 (Which Direction Is the Opposite Side? The Ambiguity of Spatial Language and Communication Problems)

  • 이종원
    • 대한지리학회지
    • /
    • 제43권1호
    • /
    • pp.71-86
    • /
    • 2008
  • 공간정보를 전달하고 이해하는 과정에서 여러 가지 원인으로 의사소통의 불일치가 발생한다. 이 연구의 목적은 '맞은편' 이라는 공간언어를 통해 공간언어가 갖고 있는 의미의 모호성이 사람들 간 의사소통 문제를 일으키는 하나의 원인이 된다는 점을 실험을 통해서 증명하는 것이다. 단순화된 '사거리'를 활용하는 평가도구를 통해 실험 참가자들이 생각하는 '맞은편'은 어디이며, 그 방향이 맞은편을 얼마나 정확하게 의미하는지를 조사하였다. 본 실험은 대부분의 실험 참가자들이 한 방향 이상을 '맞은편'으로 적절하다고 판단하고 있음을 밝혔다. 이러한 결과는 '맞은편' 이라는 용어가 갖고 있는 의미의 모호성을 증명하는 것이다. 대부분의 실험 참가자들은 준거로 주어진 정사각형 건물의 수직과 수평 방향을 고르게 '맞은편'으로 고려하는 경향을 보였다. 준거가 되는 건물의 형태 변화, 준거가 되는 건물에 내재적 방향성 부여 등도 '맞은편' 의 방향을 결정하는데 의미 있는 영향을 주는 것으로 드러났다.

소렌센의 더미와 '모호함'의 모호함 (Sorensen's Sorites and the Vagueness of 'Vague')

  • 이진희
    • 논리연구
    • /
    • 제13권2호
    • /
    • pp.117-134
    • /
    • 2010
  • '모호함'의 모호성을 정당화하는 소렌센의 논증은, '모호함'에 대한 직관적 이해를 체계적으로 정당화한다는 측면에서 매우 중요한 의미를 갖는다. 그러나 필자는 이러한 소렌센의 논증이 성립하지 않음을 보이고자 한다. 소렌센의 논증에 대한 가장 일반적인 비판은, 'n-작음'이라는 용어에 기초하는 그의 논증은 '모호함'의 모호함이 아니라 '작음'의 모호함을 입증할 뿐이라는 것이다. 그런데 이러한 비판에 근거한 디즈와 헐의 논의는, 소렌센의 더미를 구성하는 "'n-작음'은 모호하다."의 주어는 언급된 정확한 용어라는 바르찌의 주장에 의해 반박된다. 그러나 필자는 "'n-작음'은 모호하다."의 진리값 결정에 술어 '모호함'이 아무런 역할을 수행하지 못함을 보임으로써 바르찌의 주장을 반박하고, 소렌센의 논증으로부터 정당화되는 것은 '작음'의 모호성뿐임을 보이고자 한다. 물론 필자 역시 '모호함'이 모호하다는 것에는 동의한다. 본 논문을 통해 필자가 주장하는 것은 이러한 '모호함'의 특징에 대한 소렌센의 정당화가 성립하지 않는다는 것뿐이다.

  • PDF