• 제목/요약/키워드: 온톨로지 추출

검색결과 200건 처리시간 0.028초

딥러닝 기반 기계번역 개념을 활용한 Text-to-Ontology 변환 사례 (A case study on Text-to-Ontology transformation on the basis of neural translation)

  • 신유진;이지항
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.891-894
    • /
    • 2021
  • 온톨로지(Ontology)는 사람과 컴퓨터, 또는 컴퓨터 간의 개념 및 개념 표현을 공유하기 위한 개념화의 명시적 규약을 의미한다. 기존의 온톨로지 생성은 전문가에 의한 수작업에 의존되어 비용과 시간이 많이 드는 한계가 있다. 이에 본 논문에서는 딥러닝(Deep learning)기반의 기계번역 개념을 적용한 사례를 활용하여, 수작업의 의존성이 감소한 방법으로 텍스트로부터 온톨로지를 생성하는 방법을 구현하였다. 특히 기존 연구에서 제안한, 딥러닝을 이용해 텍스트로부터 지식 표현 시퀀스를 추출한 정보를 활용하여, 지식 표현 구조를 온톨로지로 변환하고 지식 베이스로 확장하는 과정을 통해 자동화 된 Text-to-Ontology 변환 방법론을 제안하고자 한다.

한국한의학연구원 소셜 네트워크 온톨로지 구축 (Construction of Social Network Ontology in Korea Institute of Oriental Medicine)

  • 김상균;장현철;예상준;한정민;김진현;김철;송미영
    • 한국콘텐츠학회논문지
    • /
    • 제9권12호
    • /
    • pp.485-495
    • /
    • 2009
  • 본 연구에서는 한의학 연구자들이 연구를 하는데 있어 상호협력이 가능한 연구자들을 검색하고 연구자들이 가지고 있는 연구 정보를 공유하기 위해서 한국한의학연구원 소셜 네트워크 온톨로지를 구축하였다. 이를 위해 우선 모든 연구자들의 개인정보, 학력/경력/자격/학회정보, 연구정보, 인맥정보를 수집하였으며, 수집된 정보를 분석하여 온톨로지 객체의 관계, 계층구조, 속성들을 정의하고 이를 FOAF와 OWL 기반의 온톨로지로 구축하였다. 또한 온톨로지에서 정보들간의 관계성을 분석하여 온톨로지에서 명시되지 않은 새로운 추론 가능한 정보들을 추출하였다. 이렇게 구축된 온톨로지는 FOAF를 통해 다른 소셜 네트워크와 연계가 용이하며 또한 OWL 기반의 온톨로지 추론을 제공할 수 있는 장점이 있다.

의미관계 정보를 이용한 약품 온톨로지의 구축과 활용 (Medicine Ontology Building based on Semantic Relation and Its Application)

  • 임수연;박성배;이상조
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제32권5호
    • /
    • pp.428-437
    • /
    • 2005
  • 온톨로지는 주어진 응용 도메인의 특성을 나타내는 관련 개념들의 집합과 정의, 그리고 그들간의 관계로 이루어진다. 본 논문에서는 온톨로지를 구축하고 갱신할 때의 시간과 비용을 줄이기 위하여 텍스트의 분석결과를 이용한 도메인 온톨로지의 반자동 구축방안을 제안한다. 이를 위하여 관련 문서들 내에 출현한 전문용어들의 처리방안을 제시하고, 추출한 개념들과 그들간의 관계를 온톨로지의 구축에 활용한다. 실험 도메인은 약품분야로 정하였으며, 구축한 온톨로지는 문서의 검색에 활용하였다. 온톨로지 내의 계층관계들이 문서검색에 효용이 있음을 보이기 위하여 일반적인 키워드기반 문서검색과 온톨로지 내의 관련 정보들을 연관피드백에 이용한 온톨로지기반 문서검색을 비교한 결과, 후자의 경우 정확률이 $4.97\%$, 재현율이 $0.78\%$ 향상됨을 알 수 있었다.

온톨로지 및 순서 규칙 기반 대용량 스트리밍 미디어 이벤트 인지 (Ontology and Sequential Rule Based Streaming Media Event Recognition)

  • 소치승;박현규;박영택
    • 정보과학회 논문지
    • /
    • 제43권4호
    • /
    • pp.470-479
    • /
    • 2016
  • UCC(User Created Contents) 형태의 다양한 영상 미디어 데이터가 증가함에 따라 의미 있는 서비스를 제공하기 위해 많은 분야에서 활발한 연구가 진행 중이다. 그 중 시맨틱 웹 기반의 미디어 분류에 대한 연구가 진행되고 있지만 기존의 미디어 온톨로지는 메타 정보를 이용하기 때문에 정보의 부재에 따른 한계점이 있다. 따라서 본 논문에서는 영상에서 인지되는 객체를 정하고 그 조합으로 구성된 서술 논리 기반의 온톨로지를 구축하고 영상의 장면에 따른 순서 기반의 규칙을 정의하여 이벤트 인지에 대한 기틀을 제안한다. 또한 증가하는 미디어 데이터에 대한 처리를 위해 분산 인-메모리 기반 프레임워크인 아파치 스파크 스트리밍을 이용하여, 영상 분류를 병렬로 처리하는 방법에 대해 설명한다. 유튜브에서 추출한 영상을 대상으로 대용량 미디어 온톨로지 데이터를 생성하고, 이를 이용하여 제시된 기법에 대한 성능 평가를 진행하여 타당성을 입증한다.

소프트웨어 제품 계열 공학의 온톨로지 기반 휘처 공동성 및 가변성 분석 기법 (Ontology-based Approach to Analyzing Commonality and Variability of Features in the Software Product Line Engineering)

  • 이순복;김진우;송치양;김영갑;권주흠;이태웅;김현석;백두권
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제34권3호
    • /
    • pp.196-211
    • /
    • 2007
  • 제품 계열 공학에서 제품의 공통성 및 가변성 분석을 결정짓게 하는 기준인 휘처 (feature) 분석에 대한 기존 연구는 개발자의 직관이나 도메인 전문가의 경험에 근간으로 분석 기준이 객관적이지 못하며, 비정형적인 휘처 분석으로 인한 이해 당사자 (stakeholder)의 공통된 휘처의 이해 부족 및 불명확한 휘처를 추출하는 문제점이 있었고, 기 개발된 소프트웨어에서 사용된 휘처의 재사용 개념이 부족했었다. 본 논문에서는 특정 도메인의 휘처 모델을 온톨로지로 변환하여 의미 기반 유사성 분석 기준에 의해 휘처의 공통성과 가변성을 추출하는 기법을 제시한다. 이를 위해, 먼저 공통된 휘처 중심의 메타 휘처 모델 기반으로 휘처의 속성을 정립하고, 메타 모텔에 준거하여 휘처 모델을 생성하여 온톨로지로 변환 후, 휘처 온톨로지 리포지토리 (Repository)에 저장한다. 이후, 동일 제품 계열 도메인의 휘처 모델 구축 시, 기 존 생성 모델과 온톨로지의 의미 기반 유사성 비교 분석 기법을 통해 휘처의 공통성과 가변성을 추출하는 것이다 또한 유사성 비교 알고리즘을 툴로 구현하였으며, 전자 결재 시스템 도메인의 실험 및 평가를 통 해 효과성을 보인다. 본 기법을 통해 메타 휘처 모델의 구문적 정립으로 이해성과 정확성을 제고시켜 고품질의 휘처 모델을 구축할 수 있으며, 온톨로지의 의미 기반 매핑으로 휘처의 공통성 및 가변성 추출을 정형화할 수 있고, 재사용성을 향상시킬 수 있다.

한국어에 적합한 자동 온톨로지 생성을 위한 모델 제안 및 구현 (Implementation and Model to Automatically Generate an Ontology for Korean)

  • 정영규;박미성;최재혁;이상조
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2003년도 제15회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.173-176
    • /
    • 2003
  • 본 논문은 언어학적 데이터로부터 자동으로 온톨로지를 생성하기 위한 모델을 제안하고 이를 구현한다. 모델 제안을 위해 온톨로지의 기본 구성 요소인 개념과 관계를 정의하고 이러한 개념과 관계 객체를 자동으로 추출하는 알고리즘을 제안한다. WordNet을 이용하여 개념을 자동으로 추출하고, 추출된 개념들간의 관계는 한국어의 구문적 특성을 이용하여 관계의 기본 형태를 정의하고 이를 기반으로 관계를 추출한다. 본 논문은 특허문서에서 전기통신기술문서를 대상으로 구현했으며, 제안된 알고리즘을 다른 영역으로 확장하여 이를 검증할 것이다.

  • PDF

적합성 검증을 통한 관계 추출 성능 향상 (Improving Relation Extraction Performance using Relevance Verification)

  • 원유성;김지성;남상하;함영균;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2015년도 제27회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.90-95
    • /
    • 2015
  • 기계적 학습을 위해서는 일반적으로 많은 양의 수동 주석데이터(Manually Labeled Data)가 요구된다. 원격지도(Distant Supervision)는 현실적으로 부족한 주석데이터(Labeled Data)를 대신해 자동적으로 주석데이터를 수집하여 학습하는 접근 방식으로 관계 추출(Relation Extracion) 문제에 널리 활용되고 있다. 이때 필연적으로 많은 노이즈(Noise)가 발생되는데, 적합성 검증(Relevance Verification)을 통해 수집된 학습데이터를 정제함으로써 노이즈로 인한 변동성을 줄이고 결과적으로 향상된 성능을 보여주는 관계 추출 방법을 제시한다.

  • PDF

소셜빅데이터 수집 및 분석을 위한 아동청소년 학교폭력 온톨로지 개발 (Ontology Development of School Bullying for Social Big Data Collection and Analysis)

  • 한윤선;김하영;송주영;송태민
    • 한국콘텐츠학회논문지
    • /
    • 제19권6호
    • /
    • pp.10-23
    • /
    • 2019
  • 소셜빅데이터는 아동청소년의 학교폭력 현상에 대한 풍부하고 다각적 시각을 제공할 수 있지만, 복잡하고 다양한 비정형 텍스트로 구성되어 있어 자료의 체계적인 수집과 활용이 어렵다. 소셜빅데이터의 수많은 정보 가운데 의미 있는 개념을 추출하고 자료를 효과적으로 수집하기 위해서는 연구주제에 상응하는 핵심용어를 명시하고, 해당 개념 간의 관계를 나타내주는 온톨로지의 역할이 중추적이다. 본 연구는 온톨로지의 개념을 정리하고, 7단계에 걸친 온톨로지 개발 과정을 구체적으로 설명한 후, 학교폭력 소셜빅데이터 수집 및 분석을 위한 온톨로지 구축에 적용하였다. 그 결과, 학교폭력의 대상, 원인, 유형, 장소, 지역, 대응방안 6가지 영역을 중심으로 최상위 계층인 대분류를 구성하고, 중분류 및 소분류 체계를 거쳐 총 2,400여 개의 핵심용어를 도출하였다. 본 연구의 의의는 온톨로지 수집 및 개발과정을 설명하고, 기존의 연구방법과는 다소 차별을 두는 소셜빅데이터를 활용한 연구모형을 학교폭력 연구에 제시하였다는 것이다. 소셜빅데이터 분석의 기초가 되는 온톨로지 개발 연구는 좁게는 학교폭력 대상자들에 대한 이해를 제고시킬 뿐 아니라, 거시적으로는 학교폭력이라는 사회현상을 바라보는 한국사회의 시각에 대한 정보를 제공하는 실천적 함의가 있다.

온톨로지를 이용한 의미 기반 정보 채움 시스템 (A Semantic-Based Information Filling System Using Ontology)

  • 민영근;김인수;이복주
    • 정보처리학회논문지B
    • /
    • 제14B권4호
    • /
    • pp.295-302
    • /
    • 2007
  • 테이블 형태로 이루어진 이력서 양식이나 인터넷 회원 가입에서 개인의 신상 정보를 매번 입력하는 일은 매우 반복적이고 번거로운 일이다. 개인의 신상 정보를 컴퓨터에 저장하고 있다가 인터넷 회원 가입 페이지에 자동으로 채워 주는 몇 개의 시스템이 나와 있으나 필드와 필드 값이 잘못 매치되는 등 정확도가 떨어지는 면이 있다. 본 연구는 컴퓨터에 개인의 신상정보를 저장하고 있다가 개인 데이터 온톨로지를 이용하여 회원가입 페이지(목표 페이지)에서 요구하는 사용자의 정보를 추론하고 자동으로 채워주는 시스템을 제안하였다. 추론의 과정에서 먼저 목표 페이지를 분석하여 요구하는 필드명을 추출하고, 유사어 온톨로지를 이용하여 요구 필드명을 표준 필드명으로 변환한다. 표준 필드명으로 변환된 요구 필드는 온톨로지 매치 메이킹을 이용하여 개인 데이터 온톨로지 상의 적절한 레벨을 찾아서 최종적인 필드값을 생성한다. 본 시스템은 목표 페이지와 유사한 필드를 가져올 뿐만 아니라 온톨로지 계층 상에 해당되는 필드를 추론하여 정확한 필드값을 가져오게 된다. 몇 개의 회원 가입 페이지를 대상으로 실험한 결과 본 시스템이 기존의 시스템에 비해 정확도에서 우수함을 보였다. 본 시스템은 이력서 양식 등 반복적으로 동일한 정보를 채우는 경우에도 쉽게 적용 가능하다.

연구 개발 트렌드 분석을 위한 기술 지식 온톨로지 구축 (Ontology Construction of Technological Knowledge for R&D Trend Analysis)

  • 황미녕;이승우;조민희;김순영;최성필;정한민
    • 한국콘텐츠학회논문지
    • /
    • 제12권12호
    • /
    • pp.35-45
    • /
    • 2012
  • 과학기술 분야 연구자들은 이전 연구와 개발 결과에 대한 조사 연구에 많은 시간을 소비한다. 또한, 연구자들은 유리한 입지를 성공적으로 차지하기 위해 일반적으로 학술 논문, 특허, 최근 연구 동향에 대한 웹 문서 등의 다양한 학술 자원을 분석하여 새롭게 등장하는 연구 주제를 선점하려고 한다. 하지만 키워드 기반의 정보 검색이나 참고문헌 정보에 근거한 연관 문서 추출 방법을 사용해서는 방대한 문헌에서 투자 가능한 연구 주제를 효율적으로 찾는 일이 쉽지 않다. 본 논문에서는 대규모 기술 문헌 자료에서 추출되는 기술, 제품, 연구 주체 간의 의미론적으로 연결된 정보를 효율적으로 생성, 저장하고 활용할 수 있는 방법을 제안한다. 세부적으로 텍스트 마이닝 기술을 활용하여 문헌에서 나타나는 주요 개체들과 연관 관계를 추출하여 시맨틱 웹 환경에 적용 가능한 기술 지식으로 생성하는데 적합한 온톨로지를 구축한다. 이렇게 구축된 온톨로지는 연관 관계를 가진 기술 지식 탐색을 지원하기에 연구 개발 트렌드 예측 및 분석 서비스인 InSciTe Adaptive에 사용되었다.