• Title/Summary/Keyword: 형식적 언어

Search Result 375, Processing Time 0.026 seconds

A tool for analysis of Ontology using Formal Concept Analysis (형식개념분석기법을 이용한 온톨로지 분석도구)

  • Kim, Dong-Soon;Hwang, Suk-Hyung;Kim, Hong-Gee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2007.05a
    • /
    • pp.423-426
    • /
    • 2007
  • 온톨로지는 의미적인 지식을 표현하고, 공유하기 위해서 여러 분야에서 널리 사용되고 있으며, 특히 시멘틱 웹의 상호운용성을 해결할 수 있는 중요한 요소로 자리 잡고 있다. 현재 온톨로지의 구축을 지원하는 다양한 도구들과 방법론들이 제시되고 있지만, 실제 구축되어진 온톨로지가 실용적이고, 도메인의 정보를 정확하게 반영했는지 검증할 수 있는 도구나 방법은 매우 미비하다. 따라서 본 연구에서는 OWL언어로 구축되어진 온톨로지의 소스로부터 온톨로지의 주요 요소들을 추출하여 형식개념분석(Formal Concept Analysis)모델로 변환하고 분석함으로써, 온톨로지에 포함된 구조적인 문제점을 파악할 수 있는 방법과 도구에 대해서 설명한다. 본 연구에서 제시한 온톨로지 분석도구를 사용하면, 구축되어진 온톨로지에 포함된 구조적 오류 및 온톨로지의 구조를 수월하게 파악할 수 있고, 온톨로지 구축작업 및 수정보완에 있어서 더 좋은 개념계층구조를 갖는 온톨로지를 제안할 수 있다.

Triplet Extraction using Korean Dependency Parsing Result (한국어 의존 파싱을 이용한 트리플 관계 추출)

  • Kwak, Sujeong;Kim, Bogyum;Lee, Jae Sung
    • Annual Conference on Human and Language Technology
    • /
    • 2013.10a
    • /
    • pp.86-89
    • /
    • 2013
  • 자연언어 문서에서 지식 추출은 QA 시스템을 비롯한 여러 분야에서 필수적이다. 트리플은 가장 일반적인 지식 추출 형식으로 문장 내부의 지식 정보를 주어, 서술어, 목적어의 관계로 표현한다. 본 논문에서는 한국어 의존 파서로 문장을 분석하고, 그 결과에서 트리플을 추출하는 방법을 제안했다. 제안된 트리플 추출기는 21개 문장에서 추출된 78개의 트리플 정답 집합과, 64개의 준정답 집합에 대해서 각각 60.75%와 66.67%의 F-measure 성능을 보였다.

  • PDF

An Analysis of the Uses of External Representations in Matter Units of 7th-Grade Science Digital Textbooks Developed Under the 2015 Revised National Curriculum (2015 개정 교육과정에 따른 중학교 1학년 디지털교과서의 물질 단원에서 나타난 외적 표상의 활용 실태 분석)

  • Song, Nayoon;Hong, Juyeon;Noh, Taehee
    • Journal of the Korean Chemical Society
    • /
    • v.64 no.6
    • /
    • pp.416-428
    • /
    • 2020
  • This study analyzed the uses of external representations presented in the matter units of the 7th-grade science digital textbooks developed under the 2015 revised national curriculum. The level, form, presentation, and interactivity of external representations presented in 5 types of digital textbooks were analyzed. As for the level, the macroscopic level of representations was mainly presented. The macroscopic level and microscopic level of representations were presented together in the particle description. As for the form, visual-verbal and visual-nonverbal representations were usually presented across the board. Very few audial-verbal and audial-nonverbal representations were presented. Visual-verbal and audial-verbal representations were mostly presented in formal form, and visual-nonverbal representations were mostly presented in illustration without movement. The presentation of representations was analyzed in three aspects. First, visual-verbal and visual-nonverbal representations were mainly presented together and none of audial-verbal and visual-nonverbal representations were presented together. When the representations of the audial-verbal, visual-nonverbal, and visual-verbal were presented together, some of the information presented in audial-verbal representations was repeatedly presented in the visual-verbal representations. Second, audial-nonverbal representations not related to learning content were presented along with other representations. Third, there were few cases of arranging visual-verbal and visual-nonverbal representations on the next pages. Audialverbal and visual-nonverbal representations were always presented synchronized. As for the interactivity, the manipulation level was mainly presented in the main area, and the feedback level was mainly presented in the activity area. The adaptation level and the communication level of interactivity were presented very few. Based on the results, the implications for the direction of constructing digital textbooks were discussed.

Deep Analysis of Question for Question Answering System (질의 응답 시스템을 위한 질의문 심층 분석)

  • Shin Seung-Eun;Seo Young-Hoon
    • The Journal of the Korea Contents Association
    • /
    • v.6 no.3
    • /
    • pp.12-19
    • /
    • 2006
  • In this paper, we describe a deep analysis of question for question answering system. It is difficult to offer the correct answer because general question answering systems do not analyze the semantic of user's natural language question. We analyze user's question semantically and extract semantic features using the semantic feature extraction grammar and characteristics of natural language question. They are represented as semantic features and grammatical morphemes that consider semantic and syntactic structure of user's questions. We evaluated our approach using 100 questions whose answer type is a person in the web. We showed that a deep analysis of questions which are comparatively short but enough to mean can analysis the user's intention and extract semantic features.

  • PDF

Semiautomatic Pattern Mining for Training a Relation Extraction Model (관계추출 모델 학습을 위한 반자동 패턴 마이닝)

  • Choi, GyuHyeon;nam, Sangha;Choi, Key-Sun
    • 한국어정보학회:학술대회논문집
    • /
    • 2016.10a
    • /
    • pp.257-262
    • /
    • 2016
  • 본 논문은 비구조적인 자연어 문장으로부터 두 개체 사이의 관계를 표현하는 구조적인 트리플을 밝히는 관계추출에 관한 연구를 기술한다. 사람이 직접 언어적 분석을 통해 트리플이 표현되는 형식을 입력하여 관계를 추출하는 규칙 기반 접근법에 비해 기계가 데이터로부터 표현 형식을 학습하는 기계학습 기반 접근법은 더 다양한 표현 형식을 확보할 수 있다. 기계학습을 이용하려면 모델을 훈련하기 위한 학습 데이터가 필요한데 학습 데이터가 수집되는 방식에 따라 지도 학습, 원격지도 학습 등으로 구분할 수 있다. 지도 학습은 사람이 학습 데이터를 만들어야하므로 사람의 노력이 많이 필요한 단점이 있지만 양질의 데이터를 사용하는 만큼 고성능의 관계추출 모델을 만들기 용이하다. 원격지도 학습은 사람의 노력을 필요로 하지 않고 학습 데이터를 만들 수 있지만 데이터의 질이 떨어지는 만큼 높은 관계추출 모델의 성능을 기대하기 어렵다. 본 연구는 기계학습을 통해 관계추출 모델을 훈련하는데 있어 지도 학습과 원격지도 학습이 가지는 단점을 서로 보완하여 타협점을 제시하는 학습 방법을 제안한다.

  • PDF

A thesaurus development system with an embedded graphic editor (Graph Editor형식의 통합정보사전 개발 시스템)

  • Nam, Dong-Su;Choi, Yong-Jun;Hwang, Do-Sam
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2000.10a
    • /
    • pp.341-344
    • /
    • 2000
  • 통합정보사전은 고도의 언어처리 및 이해를 목적으로 한 것이며, 체계적이고 과학적인 방법론을 이용하여 형태소, 구문, 의미정보 등 각종 정보가 통합된 전자사전으로, 이를 개발하는데는 막대한 개발시간과 노력을 필요로 한다. 이러한 특성 때문에 통합정보사전을 구축하기 위해서는 정보를 통합하고 관리하는 사전개발 시스템의 개발이 선행되어야 한다. 현재까지의 사전개발 시스템은 사전 항목을 정의하고, 정의된 항목에 표제어별 정보를 입력하는 시스템으로, 단순한 정렬 및 검색에 의한 표제어 찾기 및 편집을 지원하고 있다. 본 논문에서는 사전의 계층화된 항목정보를 트리 형식으로 나타내어 사전의 개발 및 구축작업을 효율적으로 지원하기 위한 통합정보사전 개발 시스템인 YDK3를 설계하고 구현하였다. 구현한 YDK3는 기존의 각종 사전의 다양한 사전정보를 입력하는 기본적인 기능 외에, 항목정보를 기반으로 한 graph editor형식의 사용자 인터페이스가 제공되어, 사전의 개발, 자료입력 및 검색을 보다 쉽게 할 수 있다는 특징이 있다.

  • PDF

Java Class File Execution Simulator (자바 클래스 파일 실행 분석기)

  • 박상필;고광만
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10a
    • /
    • pp.262-264
    • /
    • 2003
  • 자바 언어에 대한 클래스 파일은 소스 프로그램의 의미를 자바 가상 기계에서 실행가능한 형식으로 변환된 형태이다. 이러한 클래스 파일의 구조 및 실질적인 실행 과정에 대한 분석은 디컴파일러 구성, 소스프로그램의 디버깅 등에 편리성을 지원할 수 있다. 본 논문에서는 이러한 클래스 파일에 대한 분석 및 실제로 실행 과정을 보다 시각적으로 표현하기 위한 실행 과정 분석기에 관한 연구이다. 이를 위해 클래스파일을 내용을 GUI 환경에서와 같이 접근 및 표현이 용이하도록 구현하였으며 이러한 클래스 파일의 실행 과정에서 핵심 정보를 저장하고 있는 메소드 영역 정보, 오퍼란드 스택 정보, 지역 변수의 정보를 시각적으로 표현하였다.

  • PDF

Prints as Avant-garde Language of Mass Culture (대중문화의 전위 언어로서 프린트)

  • Yim, Young-Kil;Kim, Sook-Young
    • The Journal of the Korea Contents Association
    • /
    • v.9 no.2
    • /
    • pp.181-192
    • /
    • 2009
  • Prints in the contemporary art has the radical aspects at not only to maintain the characteristic of printmaking in a field of visual image but also to fulfill and communicate a desire of the public. We can see this from the change of the printmaking forms among the alternation of diverse expression methods and media such as from the line-cut at the Renaissance to colored print process, photography, the beginning of 20th century cartoons, advertisement, art, and graphic poster. From that, we can understand the printmaking as a fluid media, not fixed, has finely accomplished its functions as an act of visual language to smoothly communicate with the individual desire and character than word or language at the complex and various cultural surface. This study is focused on that prints as an avant-garde language in popular culture. Therefore, I have examined the following two aspects. First, with focussing at the specific characters of the graphic posters, I try to define the differences between language and visual language and the effect from it to our emotional perception and behavior with the politic and economic point of view. Second, how has the printmaking art as an fine arts finely accomplished an linguistic action. These are the purpose of this study.

Summarization Based Multi-news Title Extraction Using Term Relevance Estimation and Byte Pair Encoding (단어 관련성 추정과 바이트 페어 인코딩(Byte Pair Encoding)을 이용한 요약 기반 다중 뉴스 기사 제목 추출)

  • Yu, Hongyeon;Lee, Seungwoo;Ko, Youngjoong
    • Annual Conference on Human and Language Technology
    • /
    • 2018.10a
    • /
    • pp.115-119
    • /
    • 2018
  • 다중 문서 제목 추출은 하나의 주제를 가지는 다중 문서에 대한 제목을 추출하는 것을 말한다. 일반적으로 다중 문서 제목 추출에서는 다중 문서 집합을 단일 문서로 본 다음 키워드를 제목 후보군으로 추출하고, 추출된 후보를 나열하는 형식의 연구가 많이 진행되어져 왔다. 하지만 이러한 방법은 크게 두 가지의 한계점을 가지고 있다. 먼저, 다중 문서를 단순히 하나의 문서로 보는 방법은 전체적인 주제를 반영한 제목을 추출하기 어렵다는 문제점이 있다. 다음으로, 키워드를 조합하는 형식의 방법은 키워드의 단위를 찾는 방법에 따라 추출된 제목이 자연스럽지 못하다는 한계점이 있다. 따라서 본 논문에서는 이 한계점들을 보완하기 위하여 단어 관련성 추정과 Byte Pair Encoding을 이용한 요약 기반의 다중 뉴스 기사 제목 추출 방법을 제안한다. 평가를 위해서는 자동으로 군집된 총 12개의 주제에 대한 다중 뉴스 기사 집합을 사용하였으며 전문 교육을 받은 연구원들이 정성평가를 진행하여 5점 만점 기준 평균 3.68점을 얻었다.

  • PDF

Generation of Class MetaData Based on XMI (XMI기반 클래스의 메타데이터생성)

  • Lee, Sang-Sik;Choi, Han-Yong
    • The Journal of the Korea Contents Association
    • /
    • v.9 no.12
    • /
    • pp.572-581
    • /
    • 2009
  • Study on the class using XMI Meta model and XML MetaDats has significant difference from the method of Data creation which is widely used. Most of MXL System are focusing on the editor funcition, Database connection and Generation of Markup language. Unlikelly, however, this study has focused on the creation of Markup language of Class MetaData which are extracted from MXI data modedl. In addition to that, the attribute of unit element within the class and the relationship between the classes within the model were set to be given and expressed respectively. For the generation of Markup language, XML schema was used to declare the detail data type.