• 제목/요약/키워드: 정보표현

검색결과 9,346건 처리시간 0.042초

워드 임베딩을 활용한 관용표현 인식 연구 (Korean Idiom Classification Using Word Embedding)

  • 박서윤;강예지;강혜린;장연지;김한샘
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.548-553
    • /
    • 2020
  • 우리가 쓰는 일상 언어 중에는 언어적 직관이 없는 사람은 의미 파악이 힘든 관용표현이 존재한다. 관용표현을 이해하기 위해서는 표현에 대한 형태적, 의미적 이해가 수반되어야 하기 때문이다. 기계도 마찬가지로 언어적 직관이 없기 때문에 관용표현에 대한 자연어 처리에는 어려움이 따른다. 특히 일반표현과 중의성 관계에 있는 관용표현의 특성이 고려되지 않은 채 문자적으로만 분석될 위험성이 높다. 본 연구에서는 '관용표현은 주변 문맥과의 관련성이 떨어진다'라는 가정을 중심으로 워드 임베딩을 활용한 관용표현과 일반표현에 대한 구분을 시도하였다. 실험은 4개 표현에 대해 이루어 졌으며 Skip-gram, Fasttext를 활용한 방법을 통해 관용표현은 주변 단어들과의 유사성이 떨어짐을 확인하였다.

  • PDF

시간 관계성을 고려한 정적 이미지의 시간 정보 표현 방안 (A Representation Scheme of Temporal Information for Still Images with Temporal Relationship)

  • 김찬섭;엄기현
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (1)
    • /
    • pp.308-310
    • /
    • 1999
  • 정적 이미지도 시간 정보를 갖는다. 그래서, 정적 이미지 데이터에 시간 정보를 반영하여 시간적으로 연관된 이미지들간의 시간 관계성을 분석하고 표현하여, 사용자가 제시하는 시간 관계의 정보 요구 사항인 질의에 적절한 처리결과를 제공하는데 활용할 필요가 있다. 본 논문은 이미지에 표현될 수 있는 시간 정보를 추출하고 이 시간 정보를 바탕으로 이미지 도메인에 메핑되는 시간 도메인을 정의하며, 이미지들간의 시간 관계성을 표현하는 표현 구조를 설계하여 이중 그래프 모델의 표현 능력을 확장한다.

  • PDF

정보자원사전에 대한 서술논리 표현과 관리 (First Order Predicate Logic Representation and Management for Information Resource Dictionary)

  • 김창화
    • 정보기술과데이타베이스저널
    • /
    • 제5권1호
    • /
    • pp.13-37
    • /
    • 1998
  • 인터넷 등의 컴퓨터 통신 네트워크의 발달로 인하여 분산된 정보자원의 공유를 통한 자원에 대한 재사용성의 필요성이 대두되었다. IRD(Information Resource Dictionary)는 조직 내에서 관련된 모든 정보에 대한 데이터가 논리적으로 중앙화된 정보저장소(repository)이다. IRD 내의 데이터는 다른 데이터를 기술하므로 이른바 메타 데이터라고 하기도 한다. IRD의 사전(dictionary) 요소는 정보자원의 종류, 정보자원의 의미, 정보자원의 논리적 구조, 정보자원의 위치, 그리고 정보자원의 접근방법 등을 기술한다. FIPS ANSI의 IRDS는 이항 관계를 이용하여 무결성 제약조건을 표현하므로 제약조건 규칙의 표현과 일반적인 추론 규칙의 표현이 제한되어 있으며, 다양한 형태의 무결성 제약조건의 표현과 IRD와 관련된 여러 정보의 도출 또는 추론 및 관리에 관한 사항은 IRD 응용 고유의 문제로 간주하여 언급하고 있지 않다. 한편, FIPS IRDS는 사용자가 SQL 및 IRD에 대한 전문적 지식이 없이는 사용자 질의 작성이 어려운 점등에 대한 문제점을 안고 있다. 본 논문은 FIPS IRDS의 기본모델에서 정보자원 표현, 정보자원들간의 관계, 정보자원의 관리 정보 구분을 명확히 하기 위해 정보자원 모델을 정보자원 표현요소와 정보자원 관리요소의 두 부류로 나누어 구분하고, 각 부류에 대한 자격 질의(competency question)를 통하여 유추된 요소들을 FIPS ANSI IRDS 기본 모델의 스키마 기술 레벨과 스키마 레벨에 첨가함으로써 그 기본 모델을 확장한다. 그리고, FIPS ANSI IRDS가 제공하는 IRD 기술과 관리 기능을 그대로 포함하면서 앞에서 문제점으로 지적된 제약조건 표현과 추론규칙 표현을 위하여 확장된 기본 모델을 중심으로 각 레벨의 구성 요소들의 형식적 의미(formal semantics)와 레벨 내 혹은 레벨 구성요소들간의 관계성(relationship), 그리고 제약조건의 표현과 질의 추론 규칙들을 식별하여 FOPL(First Order Predicate Logic)로 표현한다. 또한, 본 논문은 FOPL로 표현된 predicate들과 규칙들을 구현하기 위하여 Prolog로 변환하기 위한 이론적 방법론을 제시하고 정보자원 관리를 위한 기본 함수들과 스키마 진화(schema evolution)를 위한 방법론을 제안한다.

  • PDF

전문용어 및 정보추출에 기반한 문서분류시스템 (Text Categorization Based on Terminology and Information Extraction)

  • 이경순;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.79-84
    • /
    • 1999
  • 본 연구에서는 문서분류시스템에서 자질의 표현으로 전문분야사전을 이용한 분야정보와 개체정보추출을 통한 개체정보를 이용한다. 또한 지식정보를 보완하기 위해 통계적인 방법으로 범주 전문용어를 인식하여 자질로 표현하는 방법을 제안한다. 문서에 나타난 용어들이 어떤 특정 전문분야에 속하는 용어들이 많이 나타나는 경우 그 문서는 용어들이 속한 분야의 문서일 가능성이 높다. 또한, 정보추출을 통해 용어가 어떠한 개체를 나타내는지를 인식하여 문서를 표현함으로써 문서가 내포하는 의미를 보다 잘 반영할 수 있게 된다. 분야정보나 개체정보를 알 수 없는 용어에 대해서는 학습문서로부터 전문분야를 자동 인식함으로써 문서표현의 지식정보를 보완한다. 전문분야, 개체정보 및 범주전문용어에 기반해서 표현된 문서의 자질에 대해서 지지벡터기계 학습에 기반한 문서분류기틀 이용하여 각 범주에 대해 이진분류를 하였다. 제안된 문서자질표현은 용어기반의 자질표현에 비해 좋은 성능을 보이고 있다.

  • PDF

가상환경 데이터 표현 인터페이스 구현 (Implementation of a Virtual Environment Data Representation Interface)

  • 이명원;이민근;이솔메;임태진;김성곤
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제10권3호
    • /
    • pp.9-16
    • /
    • 2004
  • 가상환경의 표현 정보가 의미있는 데이터로서 사용되게 하기 위해서는 지구상 모든 물체를 유일하게 정의하고 표현할 수 있는 데이터 구성 체계가 요구된다. 이를 위해서는 화면에 표현할 물체의 속성 정보가 표준화된 기술 방법에 따라서 표현되어야 한다. 이것은 가상환경 정보가 실세계 정보처리 분야에서 의미있는 데이터로서 유효하게 사용되도록 하기 위해서 모든 물체에 대한 고유한 물리적 정보 기술 방법이 고려되어야 함을 의미한다. 여기에는 물체 표현에 필요한 외관에 관한 정보 뿐 아니라 물체의 내부 표현을 포함하여 물체의 기능 및 성능 표현, 길이 및 무게, 지리적 위치 등의 속성 정보까지 모두 표현되고 관리될 수 있어야 한다. 본 논문에서는 이와 같은 속성 기술 방법을 위해서 lSO/IEC JTC1 SC24 WG8에서 표준화작업을 진행하고 있는 SEDRIS를 이용하여 물체의 모습과 속성을 표현하는 데이터구조를 가시화하고 이 데이터구조에 따라 물체의 모습을 렌더링하고 조작하는 가상환경 표현 인터페이스 구현에 대해 설명한다.

  • PDF

관용표현 중의성 해소를 위한 다층위 임베딩 연구 (Embedding with different levels for idiom disambiguation)

  • 박서윤;강예지;강혜린;장연지;김한샘
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.167-172
    • /
    • 2021
  • 관용표현 중에는 중의성을 가진 표현이 많다. 즉 하나의 표현이 맥락에 따라 일반적 의미와 관용적 의미 두 가지 이상으로 해석될 가능성이 있어 이런 유형의 관용표현을 중의성 해소 없이 자연어 처리 태스크에 적용할 경우 문제가 발생하게 된다. 본 연구에서는 관용표현의 특성인 중의성과 더불어 '관용표현은 이미 사용자의 머릿속에 하나의 토큰으로 저장되어 있다'라는 'Idiom Principle'을 바탕으로 관용표현에 대해 각각 표면형, 단순 단일 토큰형, stemming 단일 토큰형 층위의 임베딩을 만들어 관용표현 분류 연구를 진행하였으며, 실험 결과 표면형 및 stemming을 적용하지 않은 단순 단일 토큰으로 학습하는 것보다, stemming을 적용한 후 단일 토큰으로 학습하는 것이 관용표현의 중의성 해소에 유의미한 효과가 있음을 확인하였다.

  • PDF

음성인식 기반 리마인더를 위한 시간 표현 분석 기법 (Time Expression Analysis For Reminder Applications Using Speech Recognition)

  • 박재성;이상원;장재나;강상우
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2017년도 제29회 한글및한국어정보처리학술대회
    • /
    • pp.264-266
    • /
    • 2017
  • 본 연구는 리마인더 앱을 위한 효과적인 시간 표현 분석 방법을 제안한다. 시간 표현 분석을 위한 정규식 패턴을 이용하여 사용자 발화 텍스트로부터 시간 정보를 분석하고 시간 표현 유형에 따라 절대적 시간 정보로 변환한다. 제안한 방법은 정규식 패턴을 이용한 시간 표현 분석 기법으로 시스템의 유지 관리가 용이하고 정보량이 많은 패턴과의 매칭을 위해 효과적이다.

  • PDF

클라이언트/서버 응용 개발 도구에서 자동표현 기능의 설계 및 구현 (Design and Implementation on Auto-Presentation Feature in Client/Server Application Development Tools)

  • 이근영;김문자;임채덕;인소란
    • 한국정보처리학회논문지
    • /
    • 제4권8호
    • /
    • pp.1940-1947
    • /
    • 1997
  • 본 논문은 클라이언트/서버 응용 개발도구에서 원하는 정보를 자동으로 표현할 수 있는 자동표현(Auto Presentation) 기능의 설계 및 구현에 대한 것이다. 이러한 자동표현 기능은 먼저 표현하고자 하는 정보가 표현될 순서, 표현이 지속되는 시간, 표현 형태, 그리고 반복 회수를 편집한다. 그리고 설정된 순서에 따라 사용자의 간섭없이 이를 자동으로 표현하게 된다. 본 논문에서는 클라이언트/서버 응용 개발도구인 한우리/C에서 구현한 자동표현 기능에 대해서 기술한다. 한우리/C의 자동표현 기능은 데이타베이스에 있는 데이타를 자동으로 추출하여 표현할 수 있는 특징이 있다.

  • PDF

구조설계 CAD 시스템 개발을 위한 시스템 설계정보의 표현 (Representation of System Design Information for Developing Computer-Aided Structural Design System)

  • 이창호
    • 전산구조공학
    • /
    • 제11권4호
    • /
    • pp.371-382
    • /
    • 1998
  • 지난 수 십년 간 컴퓨터는 구조설계에 있어서 그 이용이 증가하고 있다. 구조설계를 위한 컴퓨터 시스템을 개발하기 위해서는 먼저 구조설계에 관련된 정보와 작업을 정형화한 표현이 필요하다. 본 논문은 구조설계에서 설계정보와 설계작업의 이해와 표현이 어려운 분야의 하나인 시스템설계에 대하여 논하고 있으며, 빌딩 프레임구조물의 시스템 설계정보를 표현하는 한 방법을 기술하고 있다. 3차원 공간을 표시하기 위하여 기준평면과 그리드 라인을 정의하였으며, 빌딩 프레임구조물의 시스템을 프레임 서브시스템, 플로어 서브시스템, 시스템요소 기둥의 세 종류의 요소로 분해하였다. 시스템요소 기둥은 프레임의 요소가 아니고, 시스템의 요소이다. 시스템 설계정보를 표현하기 위한 이와 같은 방법을 개체형 통합설계모델의 표기법을 이용하여 표시하였다. 개체형 통합설계모델은 설계정보와 설계작업을 표현하기 위하여 각각 프로덕트 개체와 프로세스 개체를 이용한다. 시스템 설계정보를 위하여 본 논문에서 정의한 프로덕트 개체들은 정형화된 시스템 설계정보를 표현하는데, 이것은 구조설계 CAD 시스템 개발에 유용하다.

  • PDF

객체지향 프로그램 정보 분석기 설계 및 구현 (Design and Implementation of an Information Analyzer for Object-Oriented Program)

  • 김운용;최영근
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (1)
    • /
    • pp.490-492
    • /
    • 1999
  • 본 논문에서는 객체지향 프로그램에 대한 프로그램 정보를 분석하여 이들간의 관계를 표현할 수 있는 방법을 제시한다. 현재까지 프로그램을 분석하고 표현하기 위한 그래프 표현으로 호출 그래프, 제어흐름 그래프 및 종속 그래프 등이 있으며 이를 이용하여 테스팅, 슬라이싱, 디버깅, 프로그램 이해, 병렬처리, 역공학과 같은 다양한 분야에 적용되고 있다. 본 논문에서는 객체지향 언어의 프로그램의 시각적 이해를 돕고, 분석에 필요한 정보를 표현하는 그래프들간의 관계성을 고려한 효율적인 분석기를 표현한다. 이를 위해 클래스, 상속관계, 호출관계, 제어흐름 및 데이터 종속관계를 고려하여 객체 지향언어 분석에 필요한 그래프 요소를 멤버함수레벨, 클래스 레벨, 모듈 클래스 레벨 단위로 추출하고 이들간의 정보를 저장소로 통합 구성한다. 이를 통해 기존의 특정목적을 위해 표현하는 그래프 표현 방식은 그래프간의 관계성과 분석정보의 독립성 그리고 재사용성의 특징을 가지는 통합 분석기로 구성될 수 있다. 이러한 특징은 프로그램의 이해와 정보의 관리효과를 증가시킬 수 있으며, 많은 소프트웨어 엔지니어링 도구와 기술들에 필요한 통합화된 정보를 제공하고 이용될 수 있을 것이다.

  • PDF