• 제목/요약/키워드: 지식의 분산도

검색결과 399건 처리시간 0.049초

동적 분산병렬 하둡시스템 및 분산추론기에 응용한 서버가상화 빅데이터 플랫폼 (An elastic distributed parallel Hadoop system for bigdata platform and distributed inference engines)

  • 송동호;신지애;인연진;이완곤;이강세
    • Journal of the Korean Data and Information Science Society
    • /
    • 제26권5호
    • /
    • pp.1129-1139
    • /
    • 2015
  • 시멘틱 웹 기술인 RDF 트리플로 표현된 지식을 추론 과정을 거치면 새로운 트리플들이 생성되어 나온다. 초기 입력된 수억개의 트리플로 구성된 빅데이터와 추가로 생성된 트리플 데이터를 바탕으로 질의응답과 같은 다양한 응용시스템이 만들어 진다. 이 추론기가 수행되는 과정에서 더 많은 컴퓨팅 리소스가 필요해 진다. 이 추가 컴퓨팅 리소스는 하부 클라우드 컴퓨팅의 리소스 풀로부터 공급받아 수행시간을 줄일 수 있다. 본 연구에서는 하둡을 이용하는 환경에서 지식의 크기에 따라 런타임에 동적으로 서버 컴퓨팅 노드를 증감 시키는 방법을 연구하였다. 상부는 응용계층이며, 중간부는 트리플들에 대한 분산병렬추론과 하부는 탄력적 하둡시스템 및 가상화 서버로 구성되는 계층적 모델을 제시한다. 이 시스템의 알고리즘과 시험성능의 결과를 분석한다. 하둡 상에 기 개발된 풍부한 응용소프트웨어들은 이 탄력적 하둡 시스템 상에서 수정 없이 보다 빨리 수행될 수 있는 장점이 있다.

지식공유 기반의 XMDR을 이용한 검색 시스템 설계 (Design of Retrieval system using XMDR based knowledge sharing)

  • 황치곤;이민노;박유신;정계동;최영근
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (C)
    • /
    • pp.127-129
    • /
    • 2006
  • 최근 대부분 기업들 환경에서의 정보 시스템들은 지역적으로 분산되어 있으며 다양한 형태로 구성되어 있으므로, 사용자 의사 결정을 지원하는데 필요한 통합된 정보를 얻는 것은 어려운 일이다. 따라서 이러한 문제를 효율적으로 정보 검색에 적용하기위해 사용자에게 단일 인터페이스를 제공하고, 이기종 시스템들 간에 구축된 데이터베이스 시스템들은 각각 독립성을 유지하면서 하나의 인터페이스처럼 투명성을 제공할 필요성이 있다. 이를 위해 ISO/IEC 11179에서 연구 중인 XMDR의 개념을 이용하여 정보검색에서 발생하는 "의미적 상호운용성(semantic interoperability)"이라는 문제점을 해결하고 이 XMDR에 지식 인스턴스 계층을 통한 지식공유를 가능하게 함으로써 단순 검색의 한계점을 극복할 수 있도록 한다. 본 논문에서는 데이터 표현에 사용되는 명칭, 속성, 관계성에 대한 이질적인 문제를 해결하기 위한 표준 온톨로지, 각 레거시 시스템을 연결하는 중간자(mediation)역할을 수행하는 로케이션 온톨로지, 지식공유가 가능하도록 하는 지식 인스턴스 계층으로 구성하는 방법을 제안한다. 또한 지식 인스턴스 계층은 협업적인 검색 환경하에서 각각의 정보시스템에서 다양한 형태의 지식을 공유 및 통합에 있어 구조화 되지 않은 지식들을 어떻게 공유할 것인가에 대한 개념적인 모델을 제시한다.

  • PDF

일본군 '위안부' 지식그래프: 파편화된 디지털 기록의 연결 (A Knowledge Graph on Japanese "Comfort Women": Interlinking Fragmented Digital Archival Resources)

  • 박하람;김학래
    • 한국기록관리학회지
    • /
    • 제21권3호
    • /
    • pp.61-78
    • /
    • 2021
  • 일본군 '위안부'에 대한 기록은 민간 기관에서 개별적으로 관리하고 있다. 일부 기록은 디지털 아카이브로 구축되어 온라인으로 접근할 수 있다. 그러나, 디지털 아카이브의 기록은 기관에 따라 메타데이터의 구성과 표현 방식이 다르다. 한편, 기록 사이의 관계를 정의할 수 있는 체계가 미흡하기 때문에, 현재 구축된 일본군 '위안부' 기록은 서로 연결되지 않고 파편적인 형식으로 남아있다. 본 연구는 일본군 '위안부' 디지털 기록을 연계하기 위한 지식 모델을 제안하고, 분산화된 디지털 아카이브의 기록을 통합하여 일본군 '위안부' 지식그래프를 구축한다. 일본군 '위안부' 디지털 아카이브의 메타데이터를 분석하여 공통 요소를 도출하고, 표준 어휘를 적용하여 디지털 기록의 다양한 개체와 개체 사이의 관계를 의미적으로 표현한다. 특히, 흩어져 있는 기록을 연계하고 검색하기 위해 수집한 데이터의 정제가 이루어지고, 외부데이터를 활용하여 기록의 맥락 정보를 강화하고 있다. 구축된 지식그래프의 검증은 분산된 기록의 탐색 여부를 측정하는 질의를 통해 수행된다. 검증 결과, 지식그래프는 흩어져 있는 기록을 연계하여 검색할 수 있고, 외부데이터로부터의 강화로 기록의 맥락 정보를 풍부하게 제공하며, 의미 기반의 검색을 통해 사용자의 의도에 맞춘 정확한 검색이 가능하다.

유효 작업수를 이용한 동적 부하 분산 시스템 성능 개선 (Improving Performance of Dynamic Load Balancing System by Using Number of Effective Tasks)

  • 최민;박은지;유정록;맹승렬
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (A)
    • /
    • pp.109-111
    • /
    • 2003
  • 클러스터 시스템의 성능 향상을 위해서는 컴퓨팅 자원을 효과적으로 사용하여야 한다. 과거에는 전체 시스템 자원을 효과적으로 사용하기 위해 각 노드들의 부하를 균등하게 하는 방향으로 연구가 진행되어 왔으나, 부하 분산 시스템이 작업의 자원 요구 형태를 고려하여 작업을 배치하는 경우 성능을 더욱 향상시킬 수 있다. 현재까지는 이런 자원 요구 형태에 대한 선행지식을 과거 작업 실행 기록에 기반하여 유추해내는 방법을 많이 사용하였으나 이 방법은 잘못된 예측을 가져와 실행시간을 증가시킬 수 있다. 본 논문에서는 이를 해결하기 위해 유효 작업수라 불리는 새로운 노드의 부하 측정 척도를 제시한다. 유효 작업수를 이용한 부하 분산 시스템은 작업의 자원 요구 사항을 알지 못하더라도 부하 분산 과정에서 작업이 잘못 배치되어 실행시간이 증가하는 경우를 방지한다. 성능분석 결과는 과거 자료에 의한 예측을 사용하는 기존 방법에 비해 전체 실행시간의 감소로 성능이 향상되었음을 보여준다.

  • PDF

분산 처리 환경에서 SWRL 규칙을 이용한 대용량 점증적 추론 방법 (Large Scale Incremental Reasoning using SWRL Rules in a Distributed Framework)

  • 이완곤;방성혁;박영택
    • 정보과학회 논문지
    • /
    • 제44권4호
    • /
    • pp.383-391
    • /
    • 2017
  • 빅데이터 시대가 도래 하면서 시맨틱 데이터의 양이 빠른 속도로 증가하고 있다. 이러한 대용량 시맨틱 데이터에서 의미 있는 암묵적 정보를 추론하기 위해서 지식 사용자의 경험적 지식을 기반으로 작성된 SWRL(Semantic Web Rule Language) 규칙들을 활용하는 많은 연구가 진행되고 있다. 그러나 기존의 단일 노드의 추론 시스템들은 대용량 데이터 처리에 한계가 있고, 다중 노드 기반의 분산 추론 시스템들은 네트워크 셔플링으로 인해 성능이 저하되는 문제점들이 존재한다. 따라서 본 논문에서는 기존 시스템들의 한계를 극복하고 보다 효율적인 분산 추론 방법을 제안한다. 또한 네트워크 셔플링을 최소화 할 수 있는 데이터 파티셔닝 전략을 소개하고, 점증적 추론에서 사용되는 추가된 새로운 데이터의 선별과 추론 규칙의 순서결정으로 추론 과정을 최적화 할 수 있는 방법에 대해 설명한다. 제안하는 방법의 성능을 측적하기 위해 약 2억 트리플로 구성된 WiseKB 온톨로지와 84개의 사용자 정의 규칙을 이용한 실험에서 32.7분이 소요되었다. 또한 LUBM 벤치 마크 데이터를 이용한 실험에서 맵-리듀스 방식에 비해 최대 2배 높은 성능을 보였다.

한국 철강산업 변화와 기술지식 네트워크 형성 과정 (Changes in Korea Steel Industry and Formation Process of Technology-knowledge network)

  • 박소현
    • 한국경제지리학회지
    • /
    • 제19권3호
    • /
    • pp.474-490
    • /
    • 2016
  • 본 논문은 국내 철강산업이 어떻게 기술적 다양화, 조직적 유연화, 지리적 분산화를 경험했는지 조사하고, 그 과정 속에서 기술지식 네트워크가 어떠한 방식으로 형성되었는지 분석했다. 특허 공동출원 자료를 기반으로 기술지식 네트워크를 구축하고, 각 2003년과 2013년 누적네트워크에 대한 k-medoid 클러스터링 분석 및 브로커리지 분석을 실시했다. 그 결과 네트워크 내 행위자가 점차 다양해진 동시에 동일 클러스터 내 내부성이 강화되었고, 산업 내 조직간 소속, 경쟁, 협력 관계 등이 네트워크 형성에 반영되어 있는 것으로 나타났다. 또한 대기업 및 비영리 연구기관 외에, 중소기업의 브로커 역할이 관찰되었다.

  • PDF

중간 문맥 식별 및 검색을 활용한 문서간 관계 추출 (Cross-document Relation Extraction using Bridging Context Identification)

  • 손준영;김진성;임정우;장윤나;소아람;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.654-658
    • /
    • 2023
  • 관계 추출은 질의응답이나 대화 시스템의 기반이 되는 지식을 구추하기 위한 작업으로, 정보 추출의 기초가 되는 기술이기도 하다. 최근 실세계 지식의 희소한 형태를 구현한 문서간 관계 추출 데이터셋이 제안되어, 여러 문서를 통해 분산되어 언급된 두 개체 사이의 관계 추론을 수행 및 평가할 수 있게 되었다. 이 작업에서 추론의 대상이 되는 개체쌍은 한 문서 안에 동시에 언급되지 않기 때문에 여러 문서에 언급된 중간 개체를 통하여 직/간접적으로 추론해야 하나, 원시 텍스트에서 이러한 정보를 수집하는 작업은 쉽지 않다. 따라서, 본 연구에서는 개체의 동시발생빈도에 기반하여 중간 개체의 중요도를 정량화하고, 이 중요도에 기반화여 중요한 문맥을 식별하는 방법론을 제안한다. 제안하는 방법론은 기존의 두 문서로 구성된 추론 경로를 식별된 중간 개체를 활용하여 확장하여, 관계 추론 모델의 수정 없이 추가된 문맥만을 활용하여 문서간 관계 추출 시스템의 성능을 개선할 수 있었다.

  • PDF

동적 환경 내에서의 자율 에이전트에 의한 다양한 행위의 설계 및 구현 (Design and Implementation of Diverse Behaviors of Autonomous Agents in Dynamic Environment)

  • 박형근;박종희
    • 전자공학회논문지CI
    • /
    • 제38권3호
    • /
    • pp.24-40
    • /
    • 2001
  • 에이전트의 정의와 구현에 관한 연구는 가상현실기술을 이용한 몰입형 교육 시스템 등의 구성에 있어서 매우 중요한 부분을 차지한다. 본 논문에서는 동적인 환경에서 에이전트의 행위의 효율적인 정의와 구현 방법을 제시하되 기존의 연구와 달리 행동의 다양성을 표현에 초점을 맞추고자 한다. 먼저 장이론에 기반하여 공간객체를 정의 한다. 장이론을 도입하여 공간객체를 정의함으로써 공간 객체에 대한 분류적 접근이 아닌 구조적인 접근이 가능해 지고, 공간객체의 동적인 생성 및 소멸과 전체적인 시공간 상황의 변화를 유도할 수 있게 된다, 다음으로 동적인 planning이 가능하도록 에이전트의 행위를 복합행위와 단위행동으로 구분한다, 마지막으로 에이전트와 관련된 객체의 관계에 따라 지식 베이스를 에이전트와 관련 객체들에 분산한다, 이를 통해 에이전트의 지식베이스의 효율적인 관리와 동적인 환경의 구축이 가능하다. 공간객체 내에서의 에이전트의 이동에 관한 상황을 구현함으로써 장이론에 기반한 공간객체의 정의와 행위의 복합행위와 단위행동으로의 구분, 그리고 에이전트와 관련 객체간의 지식 베이스의 분산의 효율성을 검증하였다.

  • PDF

블랙보드 구조의 그레이팅 스케쥴링 시스템에의 적용 (An Application of Blackboard Architecture to Grating Scheduling System)

  • 최규성;고종영;조대호
    • 한국정보처리학회논문지
    • /
    • 제7권1호
    • /
    • pp.12-19
    • /
    • 2000
  • 본 논문은 제조 공정의 생산관리 시스템을 개발함에 있어서, 생산 공정상의 스케쥴링 문제를 해결할 경우 시스템내의 여러 하위 모듈간의 협동을 통해서 처리하게 되는데, 이런 경우 각 모듈간의 원활한 협동을 위한 연동 방법을 정의하여야 한다. 이러한 연동 문제를 해결하기 위해서 분산 인공지능의 분산문제 해결 방법 중의 하나인 블랙보드 구조(Blackboard Architecture)를 사용하였다. 시스템의 문제 해결 과정을 여러 단계로 나뉘어진 공유 작업 공간(Shared Work Space)인 블랙보드에 나타내었으며, 구성 모듈간의 통신은 블랙보드를 통해서 이루어진다. 문제 해결의 처리 절차는 블랙보드의 구성요소중의 하나인 제어기에 지식의 형태로 정의되어 있고, 제어기는 이 지식을 바탕으로 모듈간의 실행 순서를 제어한다. 이와 같이 블랙보드 구조를 적용하여 하위 모듈간의 협동시에 발생하는 연동 문제를 해결하였으며 또한 시스템의 수정 및 확장에 대처 가능한 환경을 구성하였다.

  • PDF

공동저술 논문을 이용한 연구협력에 대한 공간적 분석 (A Spatial Analysis of Research Collaboration by Using Co-authorship Publications)

  • 백영기
    • 대한지리학회지
    • /
    • 제50권6호
    • /
    • pp.641-657
    • /
    • 2015
  • 오늘날 대학, 기업, 공공연구기관 사이의 연구협력은 과학 기반 기술 혁신과 연관되어 주요 정책 현안이 되고 있다. 본 연구는 지난 10년(2002~2012) 동안 7개의 과학 기반 기술에서의 한국인 과학자와 연구자들이 참여하여 세계의 주요 과학 저널에 발행된 공동저술 논문을 조사하여 연구협력의 공간적 패턴을 탐구한다. 공동 저자의 소속 기관과 그 위치 정보를 제공하는 공동저술 논문을 연구협력의 지표로 이용하여 국내와 국제적 스케일에서 여러 형태의 협력 패턴과 추세를 기술하였다. 지난 10년 동안 공저 논문의 수와 참여 공저자의 수가 크게 증가하면서 과학적 연구협력이 공간적으로 분산하는 증거가 뚜렷이 확인되었다. 국내 연구협력의 분산 추세에도 불구하고 지식 흐름이 혁신 중심 지역에 편향되며, 지역 내에서 과학적 지식 생산이 국지화하는 증거도 발견되었다.

  • PDF