• 제목/요약/키워드: 선별성능

검색결과 439건 처리시간 0.023초

도메인 변화에 강건한 사전학습 표 언어모형 (Domain-agnostic Pre-trained Language Model for Tabular Data)

  • 조상현;최제훈;권혁철
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.346-349
    • /
    • 2021
  • 표 기계독해에서는 도메인에 따라 언어모형에 필요한 지식이나 표의 구조적인 형태가 변화하면서 텍스트 데이터에 비해서 더 큰 성능 하락을 보인다. 본 논문에서는 표 기계독해에서 이러한 도메인의 변화에 강건한 사전학습 표 언어모형 구축을 위한 의미있는 표 데이터 선별을 통한 사전학습 데이터 구축 방법과 적대적인 학습 방법을 제안한다. 추출한 표 데이터에서 구조적인 정보가 없이 웹 문서의 장식을 위해 사용되는 표 데이터 검출을 위해 Heuristic을 통한 규칙을 정의하여 HEAD 데이터를 식별하고 표 데이터를 선별하는 방법을 적용했으며, 구조적인 정보를 가지는 일반적인 표 데이터와 엔티티에 대한 지식 정보를 가지는 인포박스 데이터간의 적대적 학습 방법을 적용했다. 기존의 정제되지 않는 데이터로 학습했을 때와 비교하여 데이터를 정제하였을 때, KorQuAD 표 데이터에서 f1 3.45, EM 4.14가 증가하였으며, Spec 표 질의응답 데이터에서 정제하지 않았을 때와 비교하여 f1 19.38, EM 4.22가 증가한 성능을 보였다.

  • PDF

분류기 성능 향상을 위한 범주 속성 가상예제의 생성과 선별 (Generation and Selection of Nominal Virtual Examples for Improving the Classifier Performance)

  • 이유정;강병호;강재호;류광렬
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제33권12호
    • /
    • pp.1052-1061
    • /
    • 2006
  • 본 논문에서는 베이지안 네트워크를 기반으로 생성하고 평가한 가상예제를 활용하여 범주 속성 데이타에 대한 분류 성능을 향상시키는 방안을 제안한다. 가상예제를 활용하는 종래의 연구들은 주로 수치 속성 데이타를 대상으로 하였고, 대상 도메인에 특화된 지식을 활용하여 특정 학습 알고리즘의 성능을 향상시키는 것을 목표로 하였다. 본 연구에서는 도메인에 특화된 지식을 활용하는 대신 주어진 훈련 집합을 기반으로 만든 베이지안 네트워크로부터 범주 속성 가상예제를 생성하고, 그 예제가 네트워크의 조건부 우도를 증가시키는데 기여할 경우 유용한 것으로 선별한다. 이러한 생성 및 선별과정을 반복하여 적절한 크기의 가상예제 집합을 수집하여 사용한다. 범주 속성 데이타를 대상으로 한 실험 결과, 여러 가지 학습 모델의 성능이 향상됨을 확인하였다.

선별된 특성 정보를 이용한 안드로이드 악성 앱 탐지 연구 (A Study on Android Malware Detection using Selected Features)

  • 명상준;김강석
    • 융합정보논문지
    • /
    • 제12권3호
    • /
    • pp.17-24
    • /
    • 2022
  • 모바일 악성 앱이 급증하고 있으며, 전 세계 모바일 OS 시장의 대부분을 차지하고 있는 안드로이드가 모바일 사이버 보안 위협의 주요 대상이 되고 있다. 따라서 빠르게 진화하는 악성 앱에 대응하기 위해 인공지능 구현기술 중 하나인 기계학습을 활용한 악성 앱 탐지 기법의 필요성이 대두되고 있다. 본 논문은 악성 앱의 탐지성능을 향상할 수 있는 특성 선택 및 특성 추출을 이용한 특성 선별 방법을 제안하였다. 특성 선별 과정에서 특성 개수에 따라 탐지 성능이 향상되었으며, 권한보다 API가 상대적으로 좋은 탐지 성능을 보였고, 두 특성을 조합하면 평균 93% 이상의 높은 탐지 정밀도를 보여 적절한 특성의 조합이 탐지 성능을 높일 수 있음을 확인하였다.

비전시스템을 이용한 재활용기계의 성능 향상을 위한 연구 (A study on the Performance Improvement of Recycle Machine using Vision System)

  • 추경모;이상결;박영미;차의영
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2003년도 춘계학술발표대회논문집
    • /
    • pp.347-350
    • /
    • 2003
  • 최근 '생산자 책임 재활용제도'가 시행되면서 의무재활용 캔, PET 용기류 생산자들은 판매되 제품에 대한 수집·선별·재활용의 편의를 위해 재활용기계 등의 연구·제작이 필요하게 되었다. 본 논문에서는 부탄가스캔과 비슷한 모양의 일반 음료캔을 부탄가스캔으로 오인식하는 현재의 재활용 기계의 문제점을 분석하고, 비선시스템을 이용하여 부탄가스캔만이 가진 특징형상을 추출하여 선별방식의 문제점을 보완할 수 있는 방법을 제안한다.

  • PDF

수직(垂直)컬럼형(形) 풍력선별기(風力選別機)의 분리효율향상(分離效率向上)을 위한 bypass유로(流路)의 적용(適用) (Application of Bypass Flow for Improving Performance of the Vertical Column Pneumatic Separator)

  • 이계승;송영준;요츠모토 히로키
    • 자원리싸이클링
    • /
    • 제22권3호
    • /
    • pp.65-72
    • /
    • 2013
  • 수직컬럼형 풍력선별기의 선별능력을 향상시키기 위해 일시적인 중광(middling)의 흐름을 형성할 수 있는 측로(bypass)를 선별컬럼의 중앙에 설치하였다. 측로를 흐름을 조절하여 주선별컬럼에서 상부흐름의 속도는 가벼운 물질만이 상부로 회수하도록 설정하고 하부흐름의 속도는 무거운 물질만이 하부로 회수되도록 설정하였다. 측로로 이동하는 흐름은 사이클론을 통과시켜 중광이 피더로 회수되도록 하였다. 일반 수직컬럼형 풍력선별기와 개조된 선별기에서 유리와 지르코니아 비드(bead)의 혼합물을 사용하여 성능향상의 효과를 실험하였다.

다단형 풍압처리에 의해 선별된 순환굵은골재 적용 콘크리트의 역학적 성능 평가 (Mechanical Performance Evaluation of Concrete with Recycled Coarse Aggregate Selected by Multi-stage Wind Pressure)

  • 추영규;이승태;이세현
    • 한국건설순환자원학회논문집
    • /
    • 제10권1호
    • /
    • pp.1-8
    • /
    • 2022
  • 본 연구에서는 순환골재의 고품질화를 위한 일환으로 다단형 풍압처리에 의해 선별된 순환굵은골재를 적용한 콘크리트의 역학적 특성을 평가하였다. 먼저, 천연골재 및 순환굵은골재의 기초물성을 고찰하였으며, 순환굵은골재 적용 콘크리트의 역학적 성능을 실험적으로 고찰하였다. 실험결과에 의하면, 다단형 풍압처리 기법은 순환골재의 밀도, 흡수율 등 기초물성을 개선시켰으며, 콘크리트의 역학적 성능도 매우 향상시키는 효과를 나타냄으로써, 순환골재의 고품질화에 유효하게 작용하는 것으로 나타났다.

2-단계 퍼지 색상 필터를 이용한 빠른 얼굴 감지 알고리즘 (Fast Face Detection Algorithm Using two-stage fuzzy color filter)

  • 김문환;주영훈;박진배
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2005년도 제36회 하계학술대회 논문집 D
    • /
    • pp.2861-2863
    • /
    • 2005
  • 본 논문에서는 조명에 변화에 강인하고 기존의 퍼지 색상 필터보다 정확하고 빠른 새로운 얼굴 감지알고리즘을 제안한다. 퍼지 색상 필터는 조명 변화 및 주변 환경 이미지에 강인한 반면 영상의 크기가 커지고 성능을 향상에 따라 그 처리 속도가 현저하게 느려지는 단점이 있다. 이를 극복하기 위해 논 본문에서는 2-단계 퍼지 색상 필터를 제안하였다. 제안된 2-단계 퍼지 색상 필터는 최소한의 규칙을 사용하여 대략적인 얼굴 후보 영역을 선별하고 선별된 얼굴 후보 영역에 대해 정확한 필터링을 적용함으로써 보다 빠르게 정확한 얼굴 후보 영역을 추출할 수 있다. 최종적으로 다양한 얼굴 영상을 이용하여 제안된 알고리즘의 성능을 평가하였다.

  • PDF

이동 환경에서 인증된 사용자에게 선별적으로 데이터를 전송하는 브로드캐스팅 기법의 성능분석 (Performance Analysis of Broadcasting Protocol Sending Information only to Authenticated Clients in Mobile Environment)

  • 임성화;정승식;김재훈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 춘계학술발표논문집 (하)
    • /
    • pp.1575-1578
    • /
    • 2002
  • 단말기의 컴퓨팅 능력과 이동 통신 기술이 발달함에 따라, 무선 이동망에서도 현재의 데스크탑에 버금가는 인터넷 컴퓨팅이 가능해 지고 있다. 브로드캐스팅(broadcasting)은 비대칭 통신 환경에서 정보를 효과적으로 전달하는 방법이다. 다수의 사용자가 요구하는 동일한 종류의 실시간 데이타를 전송할 경우, 무선 환경에서는 브로드캐스트 기법이 효과적이다. 그러나 유료 정보를 무선망에 브로드캐스트 할 경우 허가되지 않은 사용자들도 해당 정보를 이용할 수 있는 문제가 발생한다. 그러므로 이 경우 기존의 브로드캐스트 기법을 사용하는 대신, 1:1 전송 방식 또는 멀티캐스트 방식을 사용해야 한다. 그러나 사용자의 수가 많을 경우와 전송할 데이터의 크기가 커질 경우 기존의 방식들은 통신 오버헤드를 증가시킬 수 있다. 그러므로 사용자가 많고 전송할 데이터가 큰 경우 효율적인 통신을 위해서는 특정 사용자들에게 선별적 전송이 가능한 브로드캐스트 기법이 필요하다. 본 논문에서는 공개키 암호화 기술을 사용하여 정보를 허가된 사용자에게만 전송하는 브로드캐스트 기법을 제안하고 그 성능을 분석한다.

  • PDF

한글 텍스트 문서 분류시스템을 위한 속성선택 (Feature Selection for a Hangul Text Document Classification System)

  • Lee, Jae-Sik;Cho, You-Jung
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2003년도 춘계학술대회
    • /
    • pp.435-442
    • /
    • 2003
  • 정보 추출(Information Retrieval) 시스템은 거대한 양의 정보들 가운데 필요한 정보의 적절한 탐색을 도와주기 위한 도구이다. 이는 사용자가 요구하는 정보를 보다 정확하고 보다 효과적이면서 보다 효율적으로 전달해주어야만 한다. 그러기 위해서는 문서내의 무수히 많은 속성들 가운데 해당 문서의 특성을 잘 반영하는 속성만을 선별해서 적절히 활용하는 것이 절실히 요구된다. 이에 본 연구는 기존의 한글 문서 분류시스템(CB_TFIDF)[1]의 정확도와 신속성 두 가지 측면의 성능향상에 초점을 두고 있다. 기존의 영문 텍스트 문서 분류시스템에 적용되었던 다양한 속성선택 기법들 가운데 잘 알려진 세가지 즉, Information Gain, Odds Ratio, Document Frequency Thresholding을 통해 선별적인 사례베이스를 구성한 다음에 한글 텍스트 문서 분류시스템에 적용시켜서 성능을 비교 평가한 후, 한글 문서 분류시스템에 가장 적절한 속성선택 기법과 속성 선택에 대한 가이드라인을 제시하고자 한다.

  • PDF

미 경영대학원 입학 희망자를 위한 학교 선별 시스템 (School Selection System for MBA Applicants)

  • 윤기범;구본화;김남훈;고한식
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 제13회 신호처리 합동 학술대회 논문집
    • /
    • pp.919-922
    • /
    • 2000
  • 본 논문에서는 판단 보조 시스템으로써의 기능을 수행하는 Artificial Neural Network(ANN) 시스템의 응용과 설계를 수행하였다. ANN 시스템의 응용에 있어 실질적으로 활용이 가능한 미 경영대학원 진학 희망자들을 위한 학교 선별 시스템을 구현하였다. 미국 소재의 대부분의 경영대학원에서는 입학 지원자의 평가항목으로써 대학평점(GPA), TOEFL(Test Of English as Foreign Language), GMAT(Graduate Management Admission Test), Essay 그리고 실무 경력을 요구한다. 본 논문에서 소개하는 학교 선별 시스템에서는 이러한 평가 항목 중 객관적인 평가가 가능하고 수치화 할 수 있는 세가지 요소만을 고려했다. 즉, Essay와 실무 경력과 같은 평가항목은 각 학교별 다소 주관적인 평가가 이루어지기 때문에 배제하고 보다 객관적이라고 할 수 있는 GPA, TOEFL. GMAT 만을 평가 항목으로 고려했다. 일반적으로 경영대학원에서는 최소의 TOEFL 점수를 요구하고 있다는 점을 고려해 TOEFL 점수에 우선 순위를 두고 각 학교를 크게 4개의 그룹으로 나누어 4개의 각기 다른 Network를 설계했다 최소 5년 이상의 유학 상담 경험이 있는 현직 전문가들을 통해 본 논문에서 소개하는 시스템의 성능을 검증 받았다.

  • PDF