• 제목/요약/키워드: rule accuracy

검색결과 499건 처리시간 0.028초

Improving the Classification of Population and Housing Census with AI: An Industry and Job Code Study

  • Byung-Il Yun;Dahye Kim;Young-Jin Kim;Medard Edmund Mswahili;Young-Seob Jeong
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권4호
    • /
    • pp.21-29
    • /
    • 2023
  • 본 논문에서는 인구 조사에서 산업 및 직업 코드를 자동 분류하기 위한 인공지능 기반 시스템을 제안한다. 산업 및 직업 코드의 정확한 분류는 정책 결정, 자원 할당 및 연구를 위해 매우 중요하지만, 기존의 방식은 사람이 작성한 사례 사전에 의존하는 규칙 기반 방식으로 규칙 생성에 필요한 시간과 자원이 많이 소요되며 오류 발생 가능성이 높다. 우리는 본 논문에서 통계 기관에서 사용하는 기존의 규칙 기반 시스템을 대체하기 위해 사용자가 입력한 데이터를 이용하는 인공지능 기반 시스템을 제안하였다. 이 논문에서는 여러 모델을 학습하고 평가하여 산업에서 86.76%의 일치율, 직업에서 81.84%의 일치율을 달성한 앙상블 모델을 개발하였다. 또한, 분류 확률 결과를 기반으로 프로세스 개선 작업도 제안하였다. 우리가 제안한 방법은 전이 학습 기술을 활용하여 사전 학습된 모델과 결합하는 앙상블 모델을 사용하였으며, 개별 모델과 비교하여 앙상블 모델의 성능이 더 높아짐을 보였다. 본 논문에서는 인공지능 기반 시스템이 인구 조사 데이터 분류의 정확성과 효율성을 향상시키는 잠재력을 보여주며, 인공지능으로 이러한 프로세스를 자동화함으로써 더 정확하고 일관된 결과를 달성하며 기관 직원의 작업 부담을 줄일 수 있다는 점을 보여준다.

고객 선호 변화를 고려한 토픽 모델링 기반 추천 시스템 (A Topic Modeling-based Recommender System Considering Changes in User Preferences)

  • 강소영;김재경;최일영;강창동
    • 지능정보연구
    • /
    • 제26권2호
    • /
    • pp.43-56
    • /
    • 2020
  • 추천 시스템은 사용자가 다양한 옵션 중에서 최선의 선택을 할 수 있도록 도와준다. 그러나 추천 시스템이 상업적으로 성공하기 위해서는 극복할 몇 개의 문제점이 존재한다. 첫째, 추천시스템의 투명성 부족 문제이다. 즉, 추천된 상품이 왜 추천되었는지 사용자들이 알 수 없다. 둘째, 추천시스템이 사용자 선호의 변화를 즉각적으로 반영할 수 없는 문제이다. 즉, 사용자의 상품에 대한 선호는 시간이 지남에 따라 변함에도 불구하고, 추천시스템이 사용자 선호를 반영하기 위해서는 다시 모델을 재구축해야 한다. 따라서 본연구에서는 이러한 문제를 해결하기 위해 토픽 모델링과 순차 연관 규칙을 이용한 추천 방법론을 제안하였다. 토픽 모델링은 사용자에게 아이템이 왜 추천되었는지 설명하는데 유용하며, 순차 연관 규칙은 변화하는 사용자의 선호를 파악하는데 유용하다. 본 연구에서 제안한 방법은 크게 토픽 모델링 및 사용자 프로파일 생성 등 토픽 모델링에 기반한 사용자 프로파일 생성 단계와 토픽에 사용자 선호 확인 및 순차 연관 규칙 발견 등 순차 연관 규칙에 기반한 추천 단계로 구분된다. 벤치마크 시스템으로 협업 필터링 기반 추천 시스템을 개발하고, 아마존의 리뷰 데이터 셋을 이용하여 제안한 방법론의 성능을 비교 평가하였다. 비교 분석 결과, 제안한 방법론이 협업 필터링 기반 추천시스템보다 뛰어난 성능을 보였다. 따라서 본 연구에서 제안하는 추천 방법을 통해 추천 시스템의 투명성을 확보할 수 있을 뿐만 아니라, 시간에 따라 변화하는 사용자의 선호를 반영할 수 있다. 그러나 본 연구는 토픽과 관련된 상품을 추천하기 때문에, 토픽에 포함된 상품의 수가 많을 경우 추천이 정교하지 못하는 한계점이 있다. 또한 토픽의 수가 적기 때문에 토픽에 대한 순차 연관 규칙이 너무 적은 문제점이 있다. 향후 연구에서 이러한 문제점을 해결한다면 좋은 연구가 될 것으로 판단된다.

이질성 학습을 통한 문서 분류의 정확성 향상 기법 (Improving the Accuracy of Document Classification by Learning Heterogeneity)

  • 윌리엄;현윤진;김남규
    • 지능정보연구
    • /
    • 제24권3호
    • /
    • pp.21-44
    • /
    • 2018
  • 최근 인터넷 기술의 발전과 함께 스마트 기기가 대중화됨에 따라 방대한 양의 텍스트 데이터가 쏟아져 나오고 있으며, 이러한 텍스트 데이터는 뉴스, 블로그, 소셜미디어 등 다양한 미디어 매체를 통해 생산 및 유통되고 있다. 이처럼 손쉽게 방대한 양의 정보를 획득할 수 있게 됨에 따라 보다 효율적으로 문서를 관리하기 위한 문서 분류의 필요성이 급증하였다. 문서 분류는 텍스트 문서를 둘 이상의 카테고리 혹은 클래스로 정의하여 분류하는 것을 의미하며, K-근접 이웃(K-Nearest Neighbor), 나이브 베이지안 알고리즘(Naïve Bayes Algorithm), SVM(Support Vector Machine), 의사결정나무(Decision Tree), 인공신경망(Artificial Neural Network) 등 다양한 기술들이 문서 분류에 활용되고 있다. 특히, 문서 분류는 문맥에 사용된 단어 및 문서 분류를 위해 추출된 형질에 따라 분류 모델의 성능이 달라질 뿐만 아니라, 문서 분류기 구축에 사용된 학습데이터의 질에 따라 문서 분류의 성능이 크게 좌우된다. 하지만 현실세계에서 사용되는 대부분의 데이터는 많은 노이즈(Noise)를 포함하고 있으며, 이러한 데이터의 학습을 통해 생성된 분류 모형은 노이즈의 정도에 따라 정확도 측면의 성능이 영향을 받게 된다. 이에 본 연구에서는 노이즈를 인위적으로 삽입하여 문서 분류기의 견고성을 강화하고 이를 통해 분류의 정확도를 향상시킬 수 있는 방안을 제안하고자 한다. 즉, 분류의 대상이 되는 원 문서와 전혀 다른 특징을 갖는 이질적인 데이터소스로부터 추출한 형질을 원 문서에 일종의 노이즈의 형태로 삽입하여 이질성 학습을 수행하고, 도출된 분류 규칙 중 문서 분류기의 정확도 향상에 기여하는 분류 규칙만을 추출하여 적용하는 방식의 규칙 선별 기반의 앙상블 준지도학습을 제안함으로써 문서 분류의 성능을 향상시키고자 한다.

CNN-LSTM 조합모델을 이용한 영화리뷰 감성분석 (Sentiment Analysis of Movie Review Using Integrated CNN-LSTM Mode)

  • 박호연;김경재
    • 지능정보연구
    • /
    • 제25권4호
    • /
    • pp.141-154
    • /
    • 2019
  • 인터넷 기술과 소셜 미디어의 빠른 성장으로 인하여, 구조화되지 않은 문서 표현도 다양한 응용 프로그램에 사용할 수 있게 마이닝 기술이 발전되었다. 그 중 감성분석은 제품이나 서비스에 내재된 사용자의 감성을 탐지할 수 있는 분석방법이기 때문에 지난 몇 년 동안 많은 관심을 받아왔다. 감성분석에서는 주로 텍스트 데이터를 이용하여 사람들의 감성을 사전 정의된 긍정 및 부정의 범주를 할당하여 분석하며, 이때 사전 정의된 레이블을 이용하기 때문에 다양한 방향으로 연구가 진행되고 있다. 초기의 감성분석 연구에서는 쇼핑몰 상품의 리뷰 중심으로 진행되었지만, 최근에는 블로그, 뉴스기사, 날씨 예보, 영화 리뷰, SNS, 주식시장의 동향 등 다양한 분야에 적용되고 있다. 많은 선행연구들이 진행되어 왔으나 대부분 전통적인 단일 기계학습기법에 의존한 감성분류를 시도하였기에 분류 정확도 면에서 한계점이 있었다. 본 연구에서는 전통적인 기계학습기법 대신 대용량 데이터의 처리에 우수한 성능을 보이는 딥러닝 기법과 딥러닝 중 CNN과 LSTM의 조합모델을 이용하여 감성분석의 분류 정확도를 개선하고자 한다. 본 연구에서는 대표적인 영화 리뷰 데이터셋인 IMDB의 리뷰 데이터 셋을 이용하여, 감성분석의 극성분석을 긍정 및 부정으로 범주를 분류하고, 딥러닝과 제안하는 조합모델을 활용하여 극성분석의 예측 정확도를 개선하는 것을 목적으로 한다. 이 과정에서 여러 매개 변수가 존재하기 때문에 그 수치와 정밀도의 관계에 대해 고찰하여 최적의 조합을 찾아 정확도 등 감성분석의 성능 개선을 시도한다. 연구 결과, 딥러닝 기반의 분류 모형이 좋은 분류성과를 보였으며, 특히 본 연구에서 제안하는 CNN-LSTM 조합모델의 성과가 가장 우수한 것으로 나타났다.

골밀도 측정의 정확한 정도관리방법 -이중 에너지 방사선 흡수법을 중심으로- (Accurate Quality Control Method of Bone Mineral Density Measurement -Focus on Dual Energy X-ray Absorptiometry-)

  • 김호성;동경래;류영환
    • 대한방사선기술학회지:방사선기술과학
    • /
    • 제32권4호
    • /
    • pp.361-370
    • /
    • 2009
  • 골밀도의 질 관리는 검사를 시행하는 방사선사들의 책임과 의무이다. 하지만 질 관리의 이해 부족과 방법의 무지로 인한 잘못된 결과는 환자에게 치명적인 오류를 범할 수 있다. 따라서 이 논문은 올바른 질 관리의 이해와 방법을 기술하여 검사자 및 환자, 의뢰의사에게 골밀도 검사의 신뢰성을 확보하는 것을 목적으로 한다. 이중 에너지 엑스선 골밀도 기기(dual energy X-ray absorptiometry, DXA)는 골밀도 측정은 정확도와 정밀도가 우수하여야 작은 골량의 변화에도 진정한 생물학적 변화를 알 수 있다. 따라서 정확도와 정밀도를 높이기 위한 수단으로 장비 및 검사자의 올바른 질 관리가 지속적으로 이루어져야 한다. 올바른 장비관리방법은 매일 아침 장비 보정 질 관리 후 제조사에서 권고하는 팬텀을 이용하여 10~25회 측정하여 평균값을 구하고 이를 기준으로 허용 범위(${\pm}1.5%$)를 지정한다. 팬텀의 측정은 검사가 있는 날에 매일 측정하거나 일주일에 3회 이상 측정하여 실제 골밀도의 값의 변화 유무를 확인하여야 한다. 또한 측정된 팬텀의 골밀도수치를 기록 한 Shewart control chart를 Rule에 따라 평가한다. 이러한 관리는 장비의 설치 및 이동 시에 반드시 행해져야 한다. 검사자 관리방법은 정밀도 측정으로 평가하는데 정밀도는 재검사하였을 때에 실제 생물학적 변화 없이 수치상의 결과 값을 똑같이 재현될 수 있는지 알아보는 것이다. 측정 방법은 골밀도 검사를 진행하면서 환자를 두번씩 30번 측정하는 방법과 세번씩 15번 측정하는 방법이 있다. 측정에서 중요한 것은 한 번 검사 후 두번째나 세번째 검사에서도 반드시 검사 테이블에서 내려왔다 다시 올라가서 검사를 해야 한다. 측정된 골밀도수치로 정밀오차를 산출하고 95% 신뢰수준으로 정밀오차에 2.77을 곱하여 최소한의 생물학적 골밀도 변화를 산출한다. 산출된 값을 최소한의 의미있는 변화라고 표현하며 이 값을 넘어섰을 경우가 진정한 생물학적 변화구간이라고 할 수 있다. 검사자의 정도관리는 처음 검사를 시작하는 경우와 장비의 이동 및 교체 시에 반드시 행해져야하며 지속적으로 이루어져야 한다. 골밀도 검사를 시행하는 방사선사의 올바른 질 관리의 수행은 장비의 수명 연장과 정확한 결과의 산출로 이어져 검사의 신뢰성 확보와 환자 및 방사선사에게 부적절한 검사로 인한 방사능 노출의 최소화에 도움을 줄 것이다.

  • PDF

데이터베이스 성능을 위한 SQL 감리 도구의 설계 및 구현 (Design and Implementation of SQL Audit Tool for Database Performance)

  • ;김태우;;여정모
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제5권5호
    • /
    • pp.203-208
    • /
    • 2016
  • 정보시스템 감리는 정보시스템을 성공적으로 구축하기 위한 요건이지만 정보시스템의 규모가 커질수록 감리작업 수행의 효율성이 저하되는 문제가 있다. 정보시스템 하위 감리 영역에도 동일한 문제가 존재하는데 본 논문에서는 데이터베이스 성능을 위한 SQL 감리 도구를 구현하여 데이터베이스 감리의 효율성 문제를 다루고자 한다. 본 본문에서 데이터베이스 성능을 위한 SQL 감리 도구를 설계하는 과정에서 SQL 감리작업에 필요한 요구사항들을 분석한다. 이를 바탕으로 SQL 감리 도구의 프로세스를 정보시스템 감리 절차에 따라 SQL 감리의 특성에 맞추어서 설계한다. 이후 데이터베이스 설계 방법론을 적용하여 SQL 감리 수행과정의 모든 정보를 저장하는 통합 레파지토리도 설계하였다. 구현하는 과정에서는 설계된 내용에 따라 감리작업 정의모듈, 감리작업 수행 모듈, 감리작업 결과 보고 모듈로 나누어 구현하였다. 구현한 도구를 활용하여 중국 모 전력 공사 프로젝트에 적용하여 보았고, SQL 감리에 활용할 수 있는 도구들과 비교해 보았다. 본 논문에서 구현한 SQL 감리 도구는 전반적인 SQL 감리 작업을 수행 할 수 있으며 데이터베이스 성능을 위한 감리 작업에 소요되는 비용을 줄이고 결과의 정확성을 높일 수 있을 뿐만아니라 SQL 파싱을 통해 검사규칙을 확장하여 적용할 수 있다.

명사 어휘의미망을 활용한 문법 검사기의 문맥 오류 결정 규칙 일반화 (Generalization of error decision rules in a grammar checker using Korean WordNet, KorLex)

  • 소길자;이승희;권혁철
    • 정보처리학회논문지B
    • /
    • 제18B권6호
    • /
    • pp.405-414
    • /
    • 2011
  • 국내에서 가장 일반적으로 사용되고 있는 규칙 기반 오류 검출 방법은 언어 전문가가 한국어 문서에서 자주 발생하는 오류에 대한 검출 규칙을 경험적으로 구축하고 있다. 그러나 이렇게 경험적으로 규칙을 만들면 새로운 패턴의 문장이 나타날 때마다 규칙이 수정되어야 하므로 일관성 있는 오류 검사 및 교정을 기대할 수 없다. 본 논문에서는 이를 해결하려고 최근 개발되고 있는 어휘의미망 중에서 KorLex와 같은 정규화된 언어 자원을 활용하여 단어들의 범주 정보를 추출하고 이를 이용하여 오류 결정 규칙을 일반화한다. 그러나 현재 구축된 KorLex에는 명사의 계층관계 정보는 구축되어 있지만, 문장 요소와의 관계 정보, 즉, 격틀 정보가 부족하다. 본 논문에서는 용언 의미 오류 결정 규칙으로 사용할 선택제약 명사 클래스를 정보이론에 기초한 MDL과 Tree Cut Model을 활용하여 추출하고 이러한 선택제약 명사 클래스를 사용하여 문법 검사기 규칙을 일반화하는 방안을 제안한다. 실험 결과, 혼동하기 쉬운 네 개의 용언에 대해 목적어로 사용된 명사를 선택제약 명사 클래스로 일반화하여 문법 검사기 오류 결정 규칙 수를 평균 64.8%로 줄였고 기존 명사를 사용한 문법 검사기보다 정확도 측면에서 평균 약 6.2%정도 향상된 결과를 얻을 수 있었다.

Bayes의 복합 의사결정모델을 이용한 다중에코 자기공명영상의 context-dependent 분류 (Context-Dependent Classification of Multi-Echo MRI Using Bayes Compound Decision Model)

  • 전준철;권수일
    • Investigative Magnetic Resonance Imaging
    • /
    • 제3권2호
    • /
    • pp.179-187
    • /
    • 1999
  • 목적 : 본 논문은 Bayes의 복합 의사결정모델을 이용한 효과적인 다중에코 자기공명영상의 분류방법을 소개한다. 동질성을 갖는 영역 혹은 경계선부위 등 영역을 명확히 분할하기 위하여 영상 내 국소 부위 이웃시스댐상의 주변정보(contextual information)를 이용한 분류 방법을 제시한다. 대상 및 방법 : 통계학적으로이질적 성분들로 구성된 영상을 대상으로 한 주변정보를 이용한 분류결과는 영상내의 국소적으로 정적인 영역들을이웃화소시스탬 내에서 정의되는 상호작용 인자의 메커니즘에 의해 분리함으로서 개선시킬 수 있다. 영상의 분류과정에서 분류결과의 정확도를 향상시키기 위하여 분류대상화소의 주변화소에 대한 분류패턴을 이용한다면 일반적으로 발생하는 분류의 모호성을 제거한다. 그러한 이유는 특정 화소와 인접한 주변의 데이터는 본질적으로 특정 화소와 상관관계를 내재하고 있으며, 만일 주변데이터의 특성을 파악할수 있다면, 대상화소의 성질을 결정하는데 도움을 얻을 수 있다. 본 논문에서는 분류 대상화소의 주변정보와 Bayes의 복합 의사결정모델을 이용한 context-dependent 분류 방법을 제시한다. 이 모델에서 주변 정보는 국소 부위 이웃시스댐으로부터 전이확률(tran­s sition probability)을 추출하여 화소간의 상관관계의 강도를 결정하는 상호인자 값으로 사용한다. 결과 : 본논문에서는 다중에코자기공명영상의 분류를 위하여 Bayes의 복합 의사결정모델을 이용한 분류방법을 제안하였다. 주변 데이터를 고려하지 않는 context-free 분류 방법에 비하여 특히 동질성을 강는 영역 혹은 경계선 부위 등에서의 분류결과가 우수하게 나타났으며, 이는 주변정보를이용한 결과이다. 결론 : 본 논문에서는클러스터링 분석과 복합 의사결정 Bayes 모델을 이용하여 다중에코 자기공명영상의 분류 결과를 향상시키기 위한 새로운 방법을 소개하였다.

  • PDF

이차성 원발암에서의 $^{18}F$-FDG PET/CT의 이용 (Use of $^{18}F$-FDG PET/CT in Second Primary Cancer)

  • 최준영;김병태
    • Nuclear Medicine and Molecular Imaging
    • /
    • 제41권3호
    • /
    • pp.185-193
    • /
    • 2007
  • 이 종설은 이차성 원발암에서의 $^{18}F-FDG$ PET/CT의 이용을 다루었다. 암환자에서 이차성 원발암의 발병 유무는 주요한 예후인자 중의 하나이다. 이차성 원발암을 조기에 진단하고 치료하는 것은 이와 관련된 암 사망률을 낮추는 데 중요하다. $^{18}F-FDG$ PET/CT는 해부학적 및 대사적 정보를 동시에 제공함으로써 종양 영역에서 CT나 기존의 PET보다 진단성능이 더 우수하다. 이러한 우수한 진단성능과 전신영상이 가능하다는 장점 때문에 PET/CT는 이차성 원발암을 발견하는 데에 CT나 기존의 PET보다 더 적합하다. $^{18}F-FDG$ PET/CT는 이차성 원발암에 대한 선별검사로서 높은 예민도와 비교적 좋은 양성예측도를 보이므로 유용하다. PET/CT 영상에서 이차성 원발암이 의심되는 병변이 보일 경우 추가적인 진단적 검사는 필수적이다. PET/CT는 이차성 원발암을 발견하는데 PET보다 우수하다.

인지적 통제 과정에 미치는 노화의 비대칭적 영향: ERP 연구 (Asymmetric effect of aging on cognitive control processes: An ERP study)

  • 진영선;김현옥
    • 인지과학
    • /
    • 제28권4호
    • /
    • pp.245-265
    • /
    • 2017
  • 최근 인지적 통제에 대한 연구들은 최적의 통제 수준이 보상과 비용에 의해 결정된다는 것을 밝혀냈다. 보상이 가지는 가치는 주관적이며 이에 따라 최적의 신호 강도도 달라진다. 우리는 인지적 통제에 대한 노화의 영향에 대한 연구 결과들이 비일관적인 이유가 노인이 탄력적으로 통제 신호를 조절한 결과일 수 있다고 보았다. 다시 말해, 노인은 최적의 통제 수준을 결정하는 능력을 잘 유지하고 있을 수 있는데, 이는 전대상회의 역할로 알려져 있다. 반면 인지적 통제에서 노화에 따른 기능의 감퇴는 주로 규칙 표상의 유지와 억제에서 나타나는데, 이는 주로 외측전전두피질이 담당하고 있다. 본 연구는 청년과 노인에게 보상의 유형을 조절한 Go-Nogo 과제를 수행하게 하여 각 보상 조건에서 행동결과와 ERN(Error-Related Negativity) 크기를 비교하였다. 두 집단 모두는 각 연령에게 가장 중요하다고 여겨지는 조건에서 가장 뛰어난 행동 수행과 가장 큰 ERN 크기를 나타내었다. 또한 노인은 d'과 정확률에서는 연령차를 나타내었으나 ERN의 크기에서는 연령차를 나타내지 않았다. 이와 같은 결과는 인지적 통제의 각 과정에 대한 노화의 영향이 상이할 수 있을 가능성을 보여준다.