• 제목/요약/키워드: 수준 분류

검색결과 2,320건 처리시간 0.035초

주성분 분석을 활용한 안드로이드 악성코드 분류 성능 향상 방안 (Performance Enhancement of Android Malware Classification using PCA)

  • 전동하;이수진
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2022년도 제66차 하계학술대회논문집 30권2호
    • /
    • pp.249-250
    • /
    • 2022
  • 최근 API Call을 기반으로 하는 악성코드 탐지 및 분류에 대한 연구가 활발히 진행되고 있다. 그러나 API Call 기반의 데이터는 방대한 양과 다양한 차원의 특성으로 인해 분석과 학습 모델 구축 측면에서 비효율적인 한계가 있다. 이에 본 연구에서는 방대한 API Call 정보를 포함하고 있는 CICAndMal2020 데이터 세트를 대상으로 기존의 특성 선택 기법이 아닌 주성분 분석(Principal Component Analysis)을 사용하여 차원을 대폭 축소 시킨 후 머신러닝 기법을 적용하여 분류를 시도하였다. 실험 결과 전체 9,503개의 특성을 25개의 주성분(전체 대비 약 0.26% 수준)으로 축소시키고 다중 분류 기준 약 84%의 정확도를 나타냈다. 결과적으로 기존 연구에서의 탐지 모델 대비 정확도, F1-score 등의 성능 향상은 물론 차원 축소 측면에서 매우 향상된 결과를 달성하였다.

  • PDF

병렬 말뭉치를 이용한 CEFR 기반 문장 작문 평가 (CEFR-based Sentence Writing Assessment using Bilingual Corpus)

  • 최승권;권오욱
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.54-57
    • /
    • 2023
  • CEFR(Common European Framework of Reference for Language)는 유럽 전역의 교육기관에서 언어구사 능력을 평가하는 평가 기준이다. 본 논문은 학습자가 문장 작문한 것을 CEFR 에 기반하여 평가하는 모델을 기술하는 것을 목표로 한다. CEFR 기반 문장 작문 평가는 크게 전처리 단계, 작문 단계, 평가 단계로 구성된다. CEFR 기반 문장 작문 평가 모델의 평가는 CEFR 수준별로 분류한 문장들이 전문가의 수동 분류와 일치하는 지의 정확도와 학습자가 작문한 결과의 자동 평가로 측정되었다. 실험은 독일어를 대상으로 하였으며 독일어 전공 41 명의 대학생에게 CEFR 6 등급별로 5 문장씩 총 30 문장의 2 세트를 만들어 실험을 실시하였다. 그 결과 CEFR 등급별 자동 분류는 전문가의 수동 분류와 61.67%로 일치하는 정확도를 보였다.

지배적 피드백 루프에 대한 인지적 편향

  • 김병관;김동환
    • 한국시스템다이내믹스학회:학술대회논문집
    • /
    • 한국시스템다이내믹스학회 2000년도 하계학술대회발표논문집
    • /
    • pp.135-152
    • /
    • 2000
  • 지배적 피드백 루프는 구조가 시스템의 행동을 유발한다는 점에 있어서 매우 중요한 개념이다. 본 논문에서는 지배적 피드백 루프의 전환을 완만한 전환(continuous shifts)과 급격한 전환(discrete shifts)의 두 가지로 분류하였다. 본 연구에서는 지배적 피드백 루프의 전환에 대한 인지적 편향을 세 가지의 가설로 분류하여 제시하였다. 이에는 1) 완만한 전환에 대한 인식의 실패, 2) 의사결정 자들의 급격한 전환에 의존하는 경향, 3) 지배적 피드백 루프의 인식에 있어서 수준변수와 변화율 변수간의 차이 등이 포함된다. 마지막으로 본 논문에서는 지배적 피드백 루프에 의한 인지적 편향이 의사결정과정의 시간지연과 정책 개입의 시기에 대하여 어떠한 시사점을 주는지에 관하여 논의하였다.

Helmholtz Machine 학습에 기반한 문서 분류 (Text Categorization Using a Helmholtz Machine)

  • 장정호;장병탁;김영택
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.466-468
    • /
    • 2000
  • 이 논문에서는 Helmholtz machine을 사용하여 데이터의 분포 추정을 함으로써 문서 분류기를 학습하는 방법 제안한다. Helmholtz machine 은 생성 모델과 인식 모델로 구성된 그래프 모델로서, 그래프 모델에서의 분포 추정을 보다 가능하게 하기 위한 근사 방법 중의 하나이다. Helmholtz machine에서의 각 입력 노드는 문서를 구성하는 하나의 단어에 대응하는 이진 노드이다. 입력 노드의 개수가 많아지면 그만큼 학습 시간이 증가하기 때문에, 학습 시간을 줄이면서 적정 수준의 성능을 유지하기 위해 자질 선정이 필요하다. 이러한 요구 사항을 충족시키기 위해 정보획득량(information gain)기준을 이용하였으며, 뉴스 그룹 데이터에 대해 그 성능을 측정하고 Naive Bayes를 이용한 것과 비교한다.

  • PDF

컨테이너 사용 실태 (A Survey on Using of Container in Korea)

  • (사)한국포장협회
    • 월간포장계
    • /
    • 통권236호
    • /
    • pp.61-65
    • /
    • 2012
  • 본 조사의 대상은 회수용 및 일회용 운반 용기로서 사용되는 컨테이너이다. 컨테이너는 화물을 일정한 수량 단위로 하역 운송 보관하기 위하여 사용하는 단위화물 구성 수단이다. 트레일러 운송에 사용하는 대형 화물 컨테이너는 본 실태 조사의 대상에서 제외하였다. 조사 대상 업체의 범위는 원칙적으로 우리나라 산업 현장에서 컨테이너를 사용하고 있는 모든 업체이다. 조사 대상인 업체의 범위를 기본적으로 통계청에서 제공하는 표준 산업분류코드(KSIC)에 근거하여 업종, 규모 및 지역 관점에서 분류하여 처리하였다. 그러나 목재, 금속 및 종이 재질 컨테이너에 대한 조사는 다소 미흡한 수준이었으며, 플라스틱 컨테이너에 다소 편중된 조사가 이루어 졌다.

  • PDF

파렛트 사용 실태 (A Survey on Using of Pallet in Korea)

  • (사)한국포장협회
    • 월간포장계
    • /
    • 통권236호
    • /
    • pp.48-54
    • /
    • 2012
  • 본 조사의 대상은 화물을 일정한 수량 단위로 하역 운송 보관하기 위하여 사용하는 파렛트이다. 조사 대상 파렛트는 용도에 따라서 재사용 파렛트와 일회용 파렛트로 구분하되, 재사용 파렛트는 다시 구매 보유 물량과 임대 사용 물량으로 구분하였다. 아울러 재질에 따라서 플라스틱, 목재, 금속으로 구분하하였다. 조사 대상 업체의 범위는 원칙적으로 우리나라 산업 현장에서 파렛트를 사용하고 있는 모든 업체이다. 조사 대상인 업체의 범위를 기본적으로 통계청에서 제공하는 표준산업분류코드(KSIC)에 근거하여 업종, 규모 및 지역 관점에서 분류하여 처리하였다. 그러나 물류 업종에 대한 조사는 다소 미흡한 수준이었다.

  • PDF

파렛트 생산 실태 (The Production Conditions of Pallet in Korea)

  • (사)한국포장협회
    • 월간포장계
    • /
    • 통권236호
    • /
    • pp.43-47
    • /
    • 2012
  • 본 조사의 대상은 화물을 일정한 수량 단위로 하역 운송 보관하기 위하여 사용하는 파렛트이다. 조사 대상 파렛트는 용도에 따라서 재사용 파렛트와 일회용 파렛트로 구분하되, 재사용 파렛트는 다시 구매 보유 물량과 임대 사용 물량으로 구분하였다. 아울러 재질에 따라서 플라스틱, 목재, 금속으로 구분하였다. 조사 대상 업체의 범위는 원칙적으로 우리나라 산업 현장에서 파렛트를 생산하고 있는 모든 업체이다. 조사 대상인 업체의 범위를 기본적으로 통계청에서 제공하는 표준산업분류코드(KSIC)에 근거하여 재질, 규모 및 지역 관점에서 분류하여 처리하였다. 그러나 금속 및 종이 재질 업체에 대한 조사는 다소 미흡한 수준이었으며, 목재 재질 업체에 다소 편중된 조사가 이루어졌다.

  • PDF

낙농유제품의 관세체제 정비방안에 대한 연구

  • 한국낙농육우협회
    • 월간낙농육우
    • /
    • 제27권5호통권301호
    • /
    • pp.90-99
    • /
    • 2007
  • 본고는 지난 해 9월 협회가 낙농.유제품 산업정책의 기초자료로 활용키 위해 연구용역을 의뢰한 바 있는 "낙농유제품의 관세체제 정비방안에 대한 연구"(GSnJ 인스티튜트 이정환) 중 요약 발췌한 것이다. 연구용역에서는 혼합분유 수입이 국내 분유시장을 어지럽히고 있으며, 유사버터 제품 등 유제품 수입이 파행적으로 이뤄지고 있는 상황에 대해 유사제품의 분류를 세분화 하는 방안, 유사제품으로 수입되고 있는 물품의 분류를 변경하는 방안, 실행관세를 양허관세 수준으로 인상하는 등의 해결방안을 제시하고 있다.

  • PDF

정형화 수준에 따른 의료 데이터 분류 및 분석

  • 이미연;박예슬;김명희;이정원
    • 정보와 통신
    • /
    • 제31권12호
    • /
    • pp.57-63
    • /
    • 2014
  • 최근 빅 데이터가 중요한 이슈로 부상하면서, 의료 분야에서의 빅 데이터 관리 및 활용에 대한 요구도 급증하고 있다. 하지만 의료 분야의 데이터는 데이터 자체의 특성과 의료 분야의 특수성으로 인해 다른 분야의 일반적인 빅 데이터와는 차별점이 많다. 따라서 의료 분야에서는 데이터 분석에 앞서 다양한 종류와 형태의 의료 데이터를 의미적으로 융합할 수 있는 방법이 전제되어야 한다. 본 고에서는 우선 의료 관련 데이터에 대한 기술(description) 표준 동향을 소개한다. 더불어 다각도의 기준에 따라 의료 데이터를 분류해봄으로써 그 다양성을 확인하고, 의료 데이터 융합의 필요성을 강조함으로써 의료 데이터 관리기술의 나아갈 방향을 제시하고자 한다.

사물인터넷 특허 메가트렌드 분석 및 R&D 전략 도출

  • 배진우;최지석
    • 방송과미디어
    • /
    • 제20권3호
    • /
    • pp.37-53
    • /
    • 2015
  • 본 고에서는 사물인터넷과 관련된 한국, 미국, 일본 및 유럽 특허 분석을 통해 국가별, 응용분야별 기술개발 현황을 분석하였다. 특허검색 결과 총 101,245건이 검색되었으며 중복제거 및 필터링을 통하여 8,304건의 유효 분석대상 특허를 선별하였다. 사물인터넷의 응용분야를 기준으로 4개의 중분류로 기술체계를 수립하였으며, 중분류 내의 각 세부기술을 대상으로 분석을 수행하였다. 이를 통해 우리나라의 기술 수준, 선진 기업의 연구 개발동향 및 핵심특허 현황 등을 파악하여 객관적인 특허정보 제공과 사물인터넷 분야의 연구개발 방향을 제시한다.