• 제목/요약/키워드: 검증집합

검색결과 364건 처리시간 0.024초

생의학 분야 학술 논문에서의 개체명 인식 및 관계 추출을 위한 언어 자원 수집 및 통합적 구조화 방안 연구 (A Study on Collecting and Structuring Language Resource for Named Entity Recognition and Relation Extraction from Biomedical Abstracts)

  • 강슬기;최윤수;최성필
    • 한국문헌정보학회지
    • /
    • 제51권4호
    • /
    • pp.227-248
    • /
    • 2017
  • 본 논문에서는 급격히 증가하는 생의학 분야 비정형 텍스트에서 핵심적 내용을 추출할 수 있는 기계학습 기반 정보 추출시스템을 구축하기 위한 언어자원 수집 및 통합적 구조화 방안을 제안한다. 제안된 방법은 정보 추출 시스템을 크게 개체명 인식과 개체명 간 관계 추출 시스템으로 구분하고, 각각의 시스템에 적합한 학습데이터를 구성하기 위해 생의학 분야 개체명 사전과 학습 집합을 수집한다. 그리고 수집된 해당 자원들의 특성을 분석하여 개체 구별을 위해 필수적으로 포함시켜야 할 항목들을 도출하고 이를 통해 시스템 학습과정에서 사용될 학습 데이터를 구성하기 위한 항목을 선정한다. 이와 같이 선정된 학습데이터의 구성 내용에 따라 수집된 자원들을 가공하여 학습 데이터를 구축한다. 본 연구에서는 생의학 분야의 하위 분야인 유전자, 단백질, 질병, 약물 4개 분야에 대한 개체명 사전과 학습 집합을 수집하여 각각을 학습 데이터로 구축하였으며, 개체명 사전을 통해 구축된 개체명 인식용 학습 데이터를 대상으로 개체명 수용 범위를 측정하기 위한 검증 과정을 수행하였다.

퍼지집합이론 및 뉴로-퍼지기법을 이용한 RMR 값의 추론 (Inference of RMR Value Using Fuzzy Set Theory and Neuro-Fuzzy Techniques)

  • 배규진;조만섭
    • 터널과지하공간
    • /
    • 제11권4호
    • /
    • pp.289-300
    • /
    • 2001
  • 터널의 설계에는 지반조사 자료의 부정확성과 평가의 애매성 그리고 자료수집 과정의 오류(observer error)등이 내재되어 있다. 그러므로 터널의 안정성과 경제적인 시공을 위해서는 시공 중 막장면의 조사가 매우 중요한 역할을 한다. 본 연구는 막장면 조사 시 지반의 고유 특성을 보다 정확하게 평가하고, 조사자의 주관성을 최소화시키기 위하여 수행되었다. 이러한 목적을 위하여 막장관찰 자료로부터 RMR값을 추론하고자 인공지능기법 중 퍼지집합이론과 뉴로-퍼지기법을 적용하였고, 46개의 학습자료에 대해 원래의 RMR값과 퍼지이론 및 뉴로저지기법의 추론에 의한 RM $R_{_FU}$ 및 RM $R_{_NF}$값의 상관성을 분석하였다. 본 연구의 결과는 원래의 RMR값과 퍼지추론에 의한 RM $R_{_FU}$값 및 뉴로-퍼지기법에 의한 RM $R_{_NF}$값의 상관계수가 각각 |R|= 0.96과 |R|=0.95로 상관성이 우수한 것으로 조사되었다. 이 결과로부터 암반평가를 위한 퍼지집합이론 및 뉴로-피지기법의 적용성이 충분함을 검증할 수 있었다.할 수 있었다.

  • PDF

천장의 반복 무늬를 이용한 로봇의 방향 및 위치 계산 (Computation of Robot Orientation and Localization using Repeating Feature of Ceiling Textures)

  • 진홍신;양창주;이왕희;김형석
    • 전자공학회논문지SC
    • /
    • 제47권3호
    • /
    • pp.5-12
    • /
    • 2010
  • 천장의 반복 무늬를 이용하여 로봇의 방향과 위치를 계산하는 새로운 알고리즘을 제안하였다. 방향 계산을 위해서 천장 영상으로부터 검출한 직선과 로봇의 현재 방향 간의 상대 각도를 계산한 후, 천장무늬에 포함된 여러 기준 직선의 방향들에 상기 상대각도를 더하여 로봇의 절대방향 후보 집합을 구성한다. 로봇 방향은 이 절대방향 후보 집합 중, 이전의 로봇 방향과 가장 가까운 방향으로 결정한다. 로봇의 위치도, 영상에서의 격자점의 화소 위치를 이용하여 로봇의 격자점과 로봇 간의 상대위치를 계산 한 후, 이전 로봇 주변의 격자점들에 상기 상대위치 벡터를 더하여 절대 위치 후보 집합을 구성하며, 이들 중 이전 로봇의 위치와 가장 가까운 위치를 현재 로봇 위치로 결정한다. 제안한 알고리즘을 이용하여 구한 위치 및 방향의 정확성을 검증하기 위한 실험을 수행하였다.

중첩 클러스터를 이용한 피드백 문서의 재샘플링 기법 (Resampling Feedback Documents Using Overlapping Clusters)

  • 이경순
    • 정보처리학회논문지B
    • /
    • 제16B권3호
    • /
    • pp.247-256
    • /
    • 2009
  • 대부분의 잠정적 적합피드백기법들은 질의에 대해 검색된 상위검색문서들이 적합하다고 가정하고, 그 문서들을 질의 확장을 위한 피드백 문서로 이용하고 있다. 그러나 초기검색결과에는 상당한 양의 부적합 문서를 포함하고 있는 것이 현실이다. 이 논문에서는 보다 좋은 피드백 문서를 선택하기 위해서 중첩클러스터를 이용한 피드백문서의 재샘플링 기법을 제안한다. 주요 아이디어는 질의 중심적인 초기검색문서집합에 대해서 중첩이 허용된 문서클러스터를 이용하여 문서들 사이의 관계를 반영하여 질의에 핵심역할을 하는 지배적 문서를 찾고, 이 문서들을 반복적으로 피드백 하여 질의가 내포하는 핵심 주제를 강조하는 것이다. 대규모 실험집합인 TREC GOV2와 WT10g에 대한 실험비교에서, 최근 잠정적 적합피드백 기법들 중에서 가장 좋은 성능을 보이고 있는 적합모델보다 재샘플링기법이 우수한 성능향상을 보였다. 제안기법에 대한 검증을 위해서 피드백문서에 포함된 적합문서의 정도를 나타내는 적합밀도를 측정하였다. 재샘플링 기법이 TREC 실험집합에 대해서 적합모델에 비해 높은 적합밀도를 보였고, 이 결과 적합피드백에서 검색성능을 향상시키게 되었다. 이는 제안 기법이 잠정적 적합피드백에서 유효한 방법임을 알 수 있다.

완전해싱을 위한 DHP 연관 규칙 탐사 알고리즘의 개선 방안 (Improvement of DHP Association Rules Algorithm for Perfect Hashing)

  • 이형봉
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권2호
    • /
    • pp.91-98
    • /
    • 2004
  • DHP 연관 규칙 탐사 알고리즘은 후보 빈발 항목 집합들에 대한 계수를 유지하기 위한 해쉬트리의 크기를 가능한 한 줄이기 위하여, 독립된 직접 해쉬 테이블을 미리 준비해 놓았다가 후보 빈발 항목 집합을 생성할 때 적용함으로써 전지 효과를 얻는다. 이 때 직접 해쉬 테이블의 크기가 클수록 전지효과는 커지며, 특히 길이 2인 후보 빈발 항목 집합을 생성하는 단계에서의 전지 효과는 알고리즘 전체의 성능을 좌우할 만큼 큰 영향을 발휘한다. 따라서 급속도로 보편화되고 있는 대용량 주기억장치 시스템 추세에 따라 단계 2에서의 직접 해쉬 테이블 크기의 극단적인 증가에 대한 시도가 이루어지고 있으며, 이러한 것 중의 하나가 완전 해쉬 테이블이다. 그러나 단계 2에서의 완전 해쉬 테이블을 사용할 경우, 이를 단순히 기존 DHP 알고리즘에 적용하여 버켓 크기(|H$_2$|)만을 재 설정하는 것 보다, DHP 알고리즘 자체를 조금 변경했을 때 약 20% 이상의 추가 성능 이득을 얻을 수 있음이 밝혀졌다. 이 논문에서는 단계 2에서의 완전 해쉬 테이블의 타당성을 조명해 본 후, 그 특성을 충분히 활용하도록 DHP를 개선한 PHP 알고리즘을 제안하며 그 결과를 실험적 환경에서 검증한다.

기업 보유역량 기반의 잠재 유망 기술-제품 포트폴리오 도출에 관한 연구 (Study on the Emerging Technology-Product Portfolio Generation Based on Firm's Technology Capability)

  • 이용호;권오진;고병열
    • 기술혁신학회지
    • /
    • 제14권spc호
    • /
    • pp.1187-1208
    • /
    • 2011
  • 본 연구는 기업의 보유자원(역량) 기반 관점에서 기업이 필요로 하는 유망기술 도출 모형을 제시하고자 하였다. 이를 위해서 첫째, 중소기업과 유망기술에 대한 고찰을 통해 중소기업이 필요로 하는 유망기술에 대해 개념적으로 정의하였다. 둘째로, 연구의 개념적 틀을 제시하고 X사의 사례 분석을 통하여 제시된 연구의 틀에 대한 유용성을 검증하였다. 기업이 진입해 있는 기술, 용도, 제품분야 키워드를 기준으로 기업의 진입영역을 대리하는 참조특허집합(reference patent set)을 구성하였다. 분석데이터는 참조특허집합을 두 단계까지 전방인용(forward citation)한 특허로 대상을 확장하여 구성하였다. 분석특허 풀에서 전문가가 선정한 키워드를 기준으로 클러스터 분석을 수행하고 클러스터의 활동성, 참조특허집합과의 관련성 지표를 기준으로 군집별 유망성을 분류하였다. 마지막으로 기업이 접근 가능한 영역에 대한 잠재 포트폴리오를 표현하고 기업이 단계적으로 접근가능한 유망영역, 모니터링 대상, 모니터링 제외대상 영역을 도출하였다.

  • PDF

러프 집합 기반 적응 모델 선택을 갖는 다중 모델 퍼지 예측 시스템 구현과 시계열 예측 응용 (Multiple Model Fuzzy Prediction Systems with Adaptive Model Selection Based on Rough Sets and its Application to Time Series Forecasting)

  • 방영근;이철희
    • 한국지능시스템학회논문지
    • /
    • 제19권1호
    • /
    • pp.25-33
    • /
    • 2009
  • 최근 시계열 예측에 결론부에 선형식을 갖는 TS 퍼지 모델이 많이 이용되고 있는데, 이의 예측 성능은 정상성과 같은 데이터의 특성과 밀접한 관련이 있다. 그러므로 본 논문에서는 특히 비정상 시계열 예측에 매우 효과적인 새로운 예측 기법을 제안하였다. 시계열의 패턴이나 규칙성을 잘 끌어내기 위한 데이터 전처리 과정을 도입하고 다중 모델 TS 퍼지 예측기를 구성한 뒤, 러프집합을 이용한 적응 모델 선택 기법에 의해 입력 데이터의 특성에 따라 가변적으로 적합한 예측 모델을 선택하여 시계열 예측이 수행되도록 하였다. 마지막으로 예측 오차를 감소시키기 위하여 오차 보정 메커니즘을 추가함으로써 예측 성능을 더욱 향상시켰다. 시뮬레이션을 통해 제안된 기법의 성능을 검증하였다. 제안된 기법은 예측 모델 구현과 예측 수행 과정에서 시계열 데이터의 특성들을 잘 반영할 수 있으므로 불확실성과 비정상성을 갖는 시계열의 예측에 매우 효과적으로 이용될 수 있을 것이다.

화면 응시 제어를 위한 유한 상태 기계 설계 (A Design of the Finite State Machine to Control User's Gaze on a Screen)

  • 문봉희
    • 한국컴퓨터정보학회논문지
    • /
    • 제16권5호
    • /
    • pp.127-134
    • /
    • 2011
  • 화면을 모니터링하고 있는 시스템에서 사용자가 시선을 화면에 집중하고 있는가를 판단하고 제어할 수 있는 유한 상태 기계를 설계 및 구현하였다. 유한 상태 기계는 화면을 응시하고 있는 눈동자의 상황에 대한 집합과 화면에 집중하고 있는 상태의 집합을 이를 기반으로 구성되었다. 특히 상태 집합을 3종류-주요 상태, 예비 상태, 잠재 상태로 분류하였다. 이전의 상황과 현재의 상황을 연계하여 현 상태를 판단하는 상황 이력을 이용함으로써 판단의 정확도를 높였다. 이 유한 상태 기계에 대하여, 기존의 눈동자 검출 방법에서 얻은 눈동자 위치 데이터를 이용하여 시뮬레이터를 구현하고 작동과정의 모니터링을 통하여 검증하였다. 실제 눈동자의 이미지를 바탕으로 실험한 결과로 상황 이력을 이용한 판정은 현재의 응시 상태가 1회성 또는 장기적인 상태인가를 판단할 수 있는 장점을 보였다.

인지 무선 시스템을 위한 채널 집합 관리기의 개발 및 성능 분석 (Channel Set Manager Development and Performance Analysis for Cognitive Radio System)

  • 박창현;송명선
    • 전자공학회논문지CI
    • /
    • 제45권5호
    • /
    • pp.8-14
    • /
    • 2008
  • 인지 무선(Cognitive Radio : CR) 시스템의 개발은 Mitola 가 제안한 개념의 완전 인지 무선(Full Cognitive Radio)시스템과 현재 표준화 논의가 진행 중인 스펙트럼 인지무선 시스템의 두 가지 방향으로 이루어지고 있다. 본 논문은 스펙트럼 인지무선 시스템을 위한 인지 엔진(Cognitive Engine : CE)을 개발 하고 인지 엔진의 핵심 기능인 채널 집합 관리 알고리즘에 대한 가상 실험을 통해 성능 분석을 하였다. 채널 집합 관리는 과거의 채널 점유 기록을 기반으로 CR시스템의 이동 가능 채널들 중 채널 품질 및 유휴 가능성이 높은 채널을 평가하고 결정하는 기능을 수행한다. 이를 위한 핵심 기능이 채널 상태 예측이고 본 논문에서는 채널 상태 예측을 위해 은닉 마르코프 모델(HMM)의 활용을 제안하였으며 HMM기반의 채널 상태 예측 성능을 향상 시킬 방법을 제안 및 적용하여 가상 실험을 하였다. 가상 실험 결과 채널 상태 예측 성능의 향상을 확인하였고 난수 선택 방법(Random Selection), 통계적 선택 방법(Statistical Selection) 과의 성능 비교를 통해 본 논문에서 제안한 방법의 우월성을 검증하였다.

규칙의 커플링문제를 최소화하기 위한 퍼지-러프 분류방법 (A Fuzzy-Rough Classification Method to Minimize the Coupling Problem of Rules)

  • 손창식;정환묵;서석태;권순학
    • 한국지능시스템학회논문지
    • /
    • 제17권4호
    • /
    • pp.460-465
    • /
    • 2007
  • 본 논문에서는 규칙의 커플링 문제를 최소화하기 위해 주어진 데이터의 통계적 특성과 퍼지-러프집합을 기반으로 한 새로운 패턴분류 방법을 제안한다. 제안한 방법 하에서 주어진 데이터의 통계적 특성은 입력부 퍼지집합의 파티션 개수를 결정하고, 생성된 규칙의 커플링문제를 최소화하기 위한 선택기준으로 사용하였다. 또한 러프집합은 수치적인 데이터로부터 생성된 규칙들 간의 불필요한 속성들을 제거하기 위한 도구로서 이용하였다. 제안된 방법의 타당성을 검증하기 위하여 Fisher의 IRIS 데이터를 사용하여 기존의 패턴분류 방법과 분류 정확도를 비교하였다. 실험결과, 제안한 방법이 기존의 학습에 의한 방법들보다 비교적 좋은 성능을 가진다는 것을 알 수 있었다.