• 제목/요약/키워드: 개체 기반

검색결과 920건 처리시간 0.028초

메모리 효율적인 3군 매칭 알고리즘 구현 (Memory Efficient Tri-Matching Algorithm)

  • 김동길;정성재
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2020년도 제62차 하계학술대회논문집 28권2호
    • /
    • pp.393-394
    • /
    • 2020
  • 세 군 매칭을 수행하여 관찰 데이터를 구축하고 통계분석에 기반한 연구를 수행하는 경우가 종종 발생한다. 매칭작업은 각 군에 속한 개체의 성향점수를 서로 비교해 거리가 가까운 짝을 찾아야 하므로 카테시안 곱 만큼의 경우의 수를 따져야 하는 문제이고, 메모리 소요가 크다. 특히 세 군 매칭은 세 쌍의 거리가 가까운 triplet을 찾는 문제로, 세 개체 사이에 존재하는 세 개의 거리를 따져야 하기 때문에 메모리 소요가 두 군 매칭에 비해 훨씬 크다. 각 군에 속한 개체가 늘어나면 메모리소요가 기하 급수적으로 늘어나게 된다. R패키지에 포함된 TriMatch함수는 세 군 매칭 수행을 위해 가장 널리 사용되는 프로그램이다. 이 프로그램은 세 개체 사이의 세 개 거리가 가장 짧은 triplet을 찾는 방식으로 구현 되었다. 이 프로그램은 메모리 소요가 매우 커 각 군에 속한 개체의 수가 많아지면 메모리 부족 에러가 발생하는 경우가 많다. 본 연구에서는 세 군 매칭에 소요되는 메모리 소요를 줄일 수 있는 알고리즘을 제안하고자 한다. 이 알고리즘의 구현을 통해 각 군에 속한 개체가 늘어나도 안정적인 세 군 매칭 결과를 얻을 수 있을 것으로 기대한다.

  • PDF

효과적인 HLA개체인식을 위한 부분매칭기법 (The partial matching method for effective recognizing HLA entities)

  • 채정민;정영희;이태민;채지은;오흥범;정순영
    • 컴퓨터교육학회논문지
    • /
    • 제14권2호
    • /
    • pp.83-94
    • /
    • 2011
  • 생의학분야에서 문헌에 표기된 개체를 인식하기 위해 길이우선매칭기법을 빈번히 사용한다. 길이우선매칭기법은 사전을 이용한 개체인식기법으로 좋은 사전만 구축되어 있다면 빠르고 정확하게 개체를 찾아낼 수 있다는 장점을 가진다. 그러나 개체가 나열되고 중복된 단어가 생략될 경우에는 길이우선매칭기법을 이용할 경우 성능이 현저히 떨어지게 된다. 우리는 이러한 인식성능문제를 해결하기 위해 부분매칭기법을 제안한다. 제안된 부분매칭기법은 생략이 발생될 수 있다는 것을 가정하여 다수의 후보개체를 만들어 내고 그 후에 최적화 알고리즘을 통해 다수의 개체후보 중에서 가장 타당해 보이는 개체를 선택한다. 우리는 생의학분야의 개체 중에서 나열되는 경우가 빈번한 HLA 유전자, HLA 항원, HLA 대립유전자 개체들을 대상으로 길이우선매칭기법과 제안된 부분매칭기법의 개체인식성능을 분석하였다. 3종의 HLA 개체들을 인식하기 위해서 먼저 확장사전과 태그기반사전을 구축하였으며, 그 후 구축된 사전을 이용해 길이우선매칭과 부분매칭을 수행하였다. 실험결과에 따르면 길이우선매칭기법은 HLA 항원 개체에서 좋은 성능을 보였으며 부분매칭기법은 생략된 표현이 빈번한 HLA 유전자 개체, HLA 대립유전자 개체에서 좋은 성능을 보였다. 부분매칭기법은 HLA 대립유전자 개체를 대상으로 95.59%의 높은 F-score를 얻었다.

  • PDF

개체명 인식 코퍼스 생성을 위한 지식베이스 활용 기법 (Automatic Training Corpus Generation Method of Named Entity Recognition Using Knowledge-Bases)

  • 박영민;김예진;강상우;서정연
    • 인지과학
    • /
    • 제27권1호
    • /
    • pp.27-41
    • /
    • 2016
  • 개체명 인식은 미리 정의된 개체 범주로 텍스트의 요소를 분류하는 과정을 의미하며 최근 주목 받고 있는 음성 비서 서비스 등 다양한 응용 분야에 널리 활용되고 있다. 본 논문에서는 지식베이스를 사용하여 개체명 인식 코퍼스를 자동으로 생성하는 방법을 제안한다. 지식베이스의 종류에 따라 두 가지 방법을 적용하며 그 중 첫 번째 방법은 위키피디아를 기반으로 위키피디아 본문의 문장에 개체명 표지를 부착하여 학습 코퍼스를 생성하는 방법이다. 두 번째 방법은 인터넷으로부터 다양한 형태의 문장을 수집하고 다양한 개체들 간의 관계를 데이터베이스에 보유 중인 프리베이스를 이용하여 개체명 표지를 부착하는 방법으로 학습 코퍼스를 생성한다. 자동 생성된 학습 코퍼스의 질과 본 논문에서 제안하는 학습 코퍼스 자동 생성 기법을 평가하기 위해 두 가지로 실험했다. 첫 번째, 다른 형태의 지식베이스인 위키피디아와 프리베이스(Freebase)를 기반으로 생성된 학습 코퍼스의 표지 부착 성능을 수동으로 측정하여 코퍼스의 질을 평가하였다. 두 번째, 각 코퍼스로 학습된 개체명 인식 모델의 성능을 통해 제안하는 학습 코퍼스 자동 생성 기법의 실용성을 평가하였다. 실험을 통해 본 방법이 타당함을 증명하였으며 특히 실제 응용에서 많이 사용되는 웹 데이터 환경에서 의미 있는 성능 향상을 보여주었다.

  • PDF

개방형 인터페이스를 이용한 지불 서비스 제공 방법 (Method of Payment Service based on Open API)

  • 임선환;이재용;김병철
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2008년도 춘계종합학술대회 A
    • /
    • pp.572-575
    • /
    • 2008
  • 본 논문에서는 Parlay X 웹서비스 기반의 지불 서비스를 설계하였다. 설계 과정에서 기능적 개체(Functional Entity)와 이의 개체들 간의 정보 흐름 (Information flow) 및 물리적 개체 (Physical Entity)와 이의 개체들 간의 정보 흐름 (Information Flow)을 기술하였다.

  • PDF

기업생태계에서의 IT역할

  • 한재민;김혜영
    • 한국경영정보학회:학술대회논문집
    • /
    • 한국경영정보학회 2007년도 International Conference
    • /
    • pp.1030-1035
    • /
    • 2007
  • 변화가 잦은 환경에서, 기업은 다른 조직들과의 유기적인 협력과 의존을 바탕으로 생태계(Ecosystem)를 이루고 있다. 이러한 조직간의 유기적인 형태를 기업생태계(Business ecosystem)라 하고, 기업생태계를 이루는 각 조직들은 기업생태계 전체와 운명을 공유한다. 기업이나 조직은 기업생태계 안의 개체가 되며, 각 개체는 생태계 안에서 고유한 역할을 하고, 생태계를 유지하는데 중요한 역할을 한다. 기업 전략의 범위를 기업 내에 한정하지 않고, 해당 기업이 속해있는 기업생태계의 범위로 확대하여 보고자 하는 이러한 관점에서, IT는 중요한 역할을 한다. 첫 째, 기업생태계는 기업 네트워크의 확장된 개념으로 파악할 수 있는데, 이러한 기업생태계에서 개체간의 상호작용에 IT가 중요한 역할을 한다. 두번째, 기업생태계에서는 외부의 자극이나 개체의 상태가 전체 건강성에 영향을 미치는데, 기업생태계를 다이나믹하고 건강하게 유지시키는데에 IT가 필요하다. 본 연구는 기업의 전략적 운명 공통체로써의 기업생태계에 대한 기존연구를 통해, 기업생태계 관점에서 IT 역할을 파악해야 할 필요성을 제시하고, IT역할 구분 시에 필요한 지침에 대해서 논의하여, 추후 수행될 연구의 기반을 마련하는 것을 목적으로 한다.

  • PDF

가중 투표 기반의 앙상블 기법을 이용한 한국어 개체명 인식기 (A Korean Named Entity Recognizer using Weighted Voting based Ensemble Technique)

  • 권순재;허윤석;이건철;임지수;최호정;서정연
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2016년도 제28회 한글및한국어정보처리학술대회
    • /
    • pp.333-336
    • /
    • 2016
  • 본 연구에서는 개체명 인식의 성능을 향상시키기 위해, 가중 투표 방법을 이용하여 개체명 인식 모델을 앙상블 하는 방법을 제안한다. 각 모델은 Conditional Random Fields의 변형 알고리즘을 사용하여 학습하고, 모델들의 가중치는 다목적 함수 최적화 기법인 NSGA-II 알고리즘으로 학습한다. 실험 결과 제안 시스템은 $F_1Score$ 기준으로 87.62%의 성능을 보여, 단독 모델 중 가장 높은 성능을 보인 방법보다 2.15%p 성능이 향상되었다.

  • PDF

인간과의 상호보완 알고리즘을 기반으로 한 다개체 청소 로봇 구조 (Multiple Cleaning Robots Architecture Based on Human-Aided Cleaning Algorithm)

  • 김기덕;김태형
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 한국컴퓨터종합학술대회논문집 Vol.34 No.1 (C)
    • /
    • pp.242-247
    • /
    • 2007
  • 다개체 이동 로봇 시스템을 사용함으로써 기존의 싱글 로봇 시스템이 할 수 없거나 하기 어려운 작업을 수행 할 수 있게 되었다. 또한 로봇 간의 협력적인 작업을 통하여 성능 향상을 가져오게 되었다. 그렇기 때문에 현재 상용화가 이루어진 청소 로봇에 대하여 다개체 이동 로봇 시스템이 적용된다면 작업 시간의 비용을 줄일 수 있을 것이기에, 본 논문에서는 사람과의 상호 보완을 이용한 청소 로봇 알고리즘을 다개체 청소 로봇 시스템에 적용하였을 때의 구조를 정의하고 이에 알맞은 알고리즘을 제안한다.

  • PDF

복잡적응시스템(complex adaptive system)을 위한 개체지향 시뮬레이션 기법의 검토: Cellular Automata를 이용한 3개채의 Lotka-Voltera 모델링을 중심으로 (Agent-based simulation technique for complex adaptive system-Using Cellular Automata simulation for 3 agent Lotka-Voltera modeling)

  • 고길곤
    • 한국시스템다이내믹스학회:학술대회논문집
    • /
    • 한국시스템다이내믹스학회 1999년도 창립학술대회발표논문집
    • /
    • pp.133-157
    • /
    • 1999
  • 시스템 다이나믹스는 전통적인 단선론적 인과론을 극복하고 시스템의 동태적 특성을 파악하는데 상당한 공헌을 하였다. 그러나 이러한 시스템의 특성을 방정식에 의존하는 시뮬레이션 기법(Equation-Based Simulation:EBS)을 이용하여 분석하는 경우 방정식으로 묘사하기 어려운 복잡적응시스템(Complex Adaptive System)에서는 한계를 갖고 있다. 따라서 시스템의 동태적 특성을 좀더 정확히 파악을 하기 위해서는 시스템을 구성하는 개체(agent)들의 행동이 시스템 전체에 미치는 영향들을 모형화 함으로써 파악하는 것이 바람직하다고 할 수 있다. 본 연구는 이러한 개체지향 시뮬레이션(Agent-eased Simulation: ABS)의 기법을 복잡성과학의 패러다임을 소개함으로써 그 중요성을 설명하고자 한다. 특히 카오스 이론으로부터 복잡성과학으로의 발전 과정을 개념을 중심으로 논의함으로서 복잡적응시스템의 이해를 돕고자 한다. 또한 ABS가 실제로 전통적인 EBS가 묘사하는 생태계 시스템의 변화를 잘 묘사할 수 있다는 사실을 보여주기 위하여 3개체가 있는 Lotka-Voltera 모형을 Cellular Automata 라는 ABS에 기반 한 시뮬레이션 기법을 활용하여 그 사용가능성을 제시하고자 한다.

가중 투표 기반의 앙상블 기법을 이용한 한국어 개체명 인식기 (A Korean Named Entity Recognizer using Weighted Voting based Ensemble Technique)

  • 권순재;허윤석;이건철;임지수;최호정;서정연
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2016년도 제28회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.333-336
    • /
    • 2016
  • 본 연구에서는 개체명 인식의 성능을 향상시키기 위해, 가중 투표 방법을 이용하여 개체명 인식 모델을 앙상블 하는 방법을 제안한다. 각 모델은 Conditional Random Fields의 변형 알고리즘을 사용하여 학습하고, 모델들의 가중치는 다목적 함수 최적화 기법인 NSGA-II 알고리즘으로 학습한다. 실험 결과 제안 시스템은 $F_1Score$기준으로 87.62%의 성능을 보여, 단독 모델 중 가장 높은 성능을 보인 방법보다 2.15%p 성능이 향상되었다.

  • PDF

효율적인 개념 클러스터링 기법 (An Efficient Conceptual Clustering Scheme)

  • 양기철
    • 한국엔터테인먼트산업학회논문지
    • /
    • 제14권4호
    • /
    • pp.349-354
    • /
    • 2020
  • 본 논문에서는 개체를 자유롭게 설명하고 효율적으로 클러스터링을 수행 할 수 있는 개념 그래프 기반의 새로운 클러스터링 체계 Clustering scheme Based on Conceptual graphs(CBC)를 제안한다. 개념적 클러스터링은 기계 학습 기술 중 하나이다. 개념 클러스터링에서 개체 간의 유사성은 개체의 의미나 환경을 고려하지 않고 유사성을 결정하는 일반적인 클러스터링 체계와 달리 개념 구성원의 자격에 따라 결정된다. 이 논문에서는 다양한 개체를 개념 그래프로 자유롭게 설명하여 효율적인 개념 클러스터링을 수행 할 수 있는 새로운 개념 클러스터링 체계인 CBC를 소개한다.