• 제목/요약/키워드: Training intelligence

검색결과 750건 처리시간 0.023초

빅데이터 기반 추천시스템 구현을 위한 다중 프로파일 앙상블 기법 (A Multimodal Profile Ensemble Approach to Development of Recommender Systems Using Big Data)

  • 김민정;조윤호
    • 지능정보연구
    • /
    • 제21권4호
    • /
    • pp.93-110
    • /
    • 2015
  • 기존의 협업필터링 추천시스템 연구는 상품에 대한 고객의 평점(rating)이나 구매 여부 데이터로부터 하나의 프로파일을 생성하고 이를 기반으로 추천 성능을 향상시킬 수 있는 새로운 알고리즘을 개발하는 위주로 진행되어 왔다. 그러나 빅데이터 환경이 도래하면서 기업이 수집할 수 있는 고객 데이터가 풍부해지고 다양해짐에 따라, 보다 정확하게 고객의 선호도나 행태를 파악하는 것이 가능하게 되었고 이러한 데이터, 즉 퍼스널 빅데이터(personal big data)를 추천시스템에 활용하는 연구의 필요성이 대두되고 있다. 본 연구에서는 마케팅의 시장세분화 이론에 근거하여 퍼스널 빅데이터로부터 고객의 선호도나 행태를 다양한 관점에서 표현할 수 있는 5종의 다중 프로파일(multimodal profile)을 개발하고, 이를 활용하여 협업필터링 추천시스템의 성능을 개선하고자 한다. 제안하는 5종의 다중 프로파일은 프로파일 통합 유사도, 개별 프로파일 유사도 평균, 개별 프로파일 유사도 가중 평균이라는 세 가지 앙상블 기법을 통해 협업필터링의 이웃(neighborhood) 탐색과정에 적용된다. 실제 퍼스널 빅데이터에 본 연구에서 제안하는 방법론을 적용한 결과, 단일 프로파일을 사용하는 협업필터링 알고리즘보다 추천 성능이 상당히 개선되었으며 앙상블 방법 중에서는 개별 프로파일 유사도 가중 평균 기법이 가장 높은 추천 성능을 보여주었다. 본 연구는 빅데이터 환경에서 추천시스템을 개발하고자 할 때, 어떠한 성격의 데이터로부터 고객의 특성을 규명하는 프로파일을 만들고 이를 어떻게 결합하여 사용하는 것이 효과적인 지 처음으로 제안하였다는 점에서 그 의의가 있다.

초등학교 교사의 심리검사 이해도와 활용도 (The Degrees of Understanding and Utilization of Elementary School Teacher's Psychological Test)

  • 구영하;여태철
    • 초등상담연구
    • /
    • 제11권1호
    • /
    • pp.51-69
    • /
    • 2012
  • 이 연구는 학교에서 심리검사가 효과적으로 활용되는 토대를 마련하기 위한 기초연구로서 초등학교에서 사용되는 심리검사의 이용실태, 교사의 심리검사 이해도와 활용도, 그리고 현재 실시되고 있는 심리검사의 개선을 위해 요구되는 사항과 초등학교에서 요구하는 검사도구의 방향에 대해 조사 연구하였다. 연구의 결과는 다음과 같다. 첫째, 심리검사의 주요 활용목적은 검사종류별로 다르게 나타났으며 초등학교에서 주로 활용되고 있는 검사는 진로 적성 검사, 인성 성격검사, 학습검사, 창의성검사, 지능검사 순으로 나타났다. 둘째, 교사는 심리검사와 관련하여 검사 매뉴얼 의존도가 높았으며 T점수에 대한 이해도가 가장 낮게 나타났다. 초등학교 교사의 심리검사 이해를 저해하는 요인에는 교사의 전문적인 지식의 부족이었으며 이를 개선하기 위해서는 심리검사 도구에 대한 사전 교사 연수가 필요한 것으로 나타났다. 교사의 심리검사 활용도는 이해도에 비해 낮게 나타났는데 교사의 이러한 활용에 영향을 미치는 요인으로는 검사 후 추후지도 방법에 대한 이해가 부족한 것이 가장 큰 요인이었고 이를 개선하기 위해서는 검사 후 보다 구체적인 지도방법에 대한 안내가 필요한 것으로 조사되었다. 셋째, 교사의 상담관련 교육과정 이수 여부에 따라 심리검사의 이해도와 활용도에 차이가 나타나는지 교차분석을 실시해 본 결과 몇 가지 검사에 대해서 이해도에는 차이가 나타났지만 활용도에서는 차이가 발견되지 않았다. 마지막으로, 현재 초등학교에서 실시하는 심리검사와 관련해서 교사 대상의 연수가 가장 필요한 것으로 나타났고 초등학교에서 요구되는 검사도구에는 학습관련 검사와 부적응검사 등이 있었다.

  • PDF

G20 정상회의 시 주(主)행사장에서의 VIP 안전대책 방안에 관한 연구 (A Study Security Measures for Protection of VIP in the G20 Summit)

  • 이선기;이충수
    • 시큐리티연구
    • /
    • 제24호
    • /
    • pp.91-123
    • /
    • 2010
  • G20 정상회의 시 발생 가능한 위협요인으로 요인테러, 인질테러, 폭탄테러, 다중이용시설 테러, 항공기테러 등 이 예상된다. 한국에서 예상되는 위협집단으로는 북한, 이슬람 과격집단 및 국제회의를 반대하는 NGO 조직 등의 단체가 위해를 일으킬 가능성이 있다고 본다. 이에 본 연구는 G20 정상회의가 주로 진행되는 장소인 주행사장과 숙소에서의 VIP 안전대책이 매우 중요하다고 판단하여 이에 대한 방안을 제시하는데 연구의 목적이 있다. 본 연구에서는 국내 최초로 경호원리 중 세계 각국에서 공통적으로 '3선경호원리'를 채택하고 있으므로 이 원리에 입각하여 1선(안전구역) 2선(경비구역) 3선(경계구역)별로 대응방안을 도출하고 VIP 안전대책을 위하여 정책적으로 반영하여야 할 의견도 함께 제시하였다. 결론적으로 G20 정상회의에 대비하여 주(主) 행사장에서의 VIP 안전대책을 위한 방안으로 1선(안전구역)에서는 첫째, 직가시 승하차지점에 대한 차단대책 강구해야 한다. 둘째, 노출지역에서는 과감하게 근접도보대형을 강화해야 한다. 2선(경비구역)에서는 첫째, 주 행사장의 특수성을 고려하여 출입통제대책을 강구해야 한다. 둘째, 행사비표 내에 RFID 기능이 포함된 효율적인 비표운용계획을 도입해야 한다. 3선(경계구역)에서는 첫째, 각종 요인테러대비, 정 첩보 수집 및 해외 정보기관과의 공조 하에 대테러 정보수집체계를 강화해야 한다. 둘째, 경호 행사인력에 대한 유사시 비상대책훈련을 실시해야 한다. 셋째, VIP 제대의 일정한 속도를 유지하기 위하여 효율적인 교통통제시스템을 운용해야 한다. 마지막으로 VIP 안전대책을 위해 정책적으로 반영하여야 할 점은 첫째, VIP 숙소의 효율적인 분산배치 및 통제가 이루어져야 한다. 둘째, 다양한 기만작전을 활용하여 불순분자가 오판하여 공격이 실패하도록 하여야 한다. 셋째, 북한 대남공작 기구의 개편에 따라 금번 G20 정상회의부터는 강력한 '군사지원대책'을 추진해야 한다. 이를 위해 국방부 주관 하에 전 후방 군사대비태세를 보다 강화하고, 화생방테러에 대비하여 탐지 및 제독에도 적극 적으로 대응할 것을 제안하고자 한다.

  • PDF

Structural SVM을 이용한 백과사전 문서 내 생략 문장성분 복원 (Restoring Omitted Sentence Constituents in Encyclopedia Documents Using Structural SVM)

  • 황민국;김영태;나동열;임수종;김현기
    • 지능정보연구
    • /
    • 제21권2호
    • /
    • pp.131-150
    • /
    • 2015
  • 영어와 달리 한국어나 일본어 문장의 경우 용언의 필수격을 채우는 명사구가 생략되는 무형대용어 현상이 빈번하다. 특히 백과사전이나 위키피디아의 문서에서 표제어로 채울 수 있는 격의 경우 그 격이 문장에서 더 쉽게 생략된다. 정보검색, 질의응답 시스템 등 주요 지능형 응용시스템들은 백과사전류의 문서에서 주요한 정보를 추출하여 수집하여야 한다. 그러나 이러한 명사구 생략 현상으로 인해 양질의 정보추출이 어렵다. 본 논문에서는 백과사전 종류 문서에서 생략된 명사구 즉 무형대용어를 복원하는 시스템의 개발을 다루었다. 우리 시스템이 다루는 문제는 자연어처리의 무형대용어 해결 문제와 거의 유사하나, 우리 문제의 경우 문서의 일부가 아닌 표제어도 복원에 이용할 수 있다는 점이 다르다. 무형대용어 복원을 위해서는 먼저 무형대용어의 탐지 즉 문서 내에서 명사구 생략이 일어난 곳을 찾는 작업을 수행한다. 그 다음 무형대용어의 선행어 탐색 즉 무형대용어의 복원에 사용될 명사구를 문서 내에서 찾는 작업을 수행한다. 문서 내에서 선행어를 발견하지 못하면 표제어를 이용한 복원을 시도해 본다. 우리 방법의 특징은 복원에 사용된 문장성분을 찾기 위해 Structural SVM을 사용하는 것이다. 문서 내에서 생략이 일어난 위치보다 앞에 나온 명사구들에 대해 Structural SVM에 의한 시퀀스 레이블링(sequence labeling) 작업을 시행하여 복원에 이용 가능한 명사구인 선행어를 찾아내어 이를 이용하여 복원 작업을 수행한다. 우리 시스템의 성능은 F1 = 68.58로 측정되었으며 이는 의미정보의 이용 없이 달성한 점을 감안하면 높은 수준으로 평가된다.

온톨로지 지식 기반 특성치를 활용한 Bidirectional LSTM-CRF 모델의 시퀀스 태깅 성능 향상에 관한 연구 (Improving Bidirectional LSTM-CRF model Of Sequence Tagging by using Ontology knowledge based feature)

  • 진승희;장희원;김우주
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.253-266
    • /
    • 2018
  • 본 연구는 질의 응답(QA) 시스템에서 사용하는 개체명 인식(NER)의 성능을 향상시키기 위하여 시퀀스 태깅 방법론을 적용한 새로운 방법론을 제안한다. 사용자의 질의를 입력 받아 데이터베이스에 저장된 정답을 추출하기 위해서는 사람의 언어를 컴퓨터가 알아들을 수 있도록 구조화 질의어(SQL)와 같은 데이터베이스의 언어로 전환하는 과정이 필요한데, 개체명 인식은 사용자의 질의에서 데이터베이스에 포함된 클래스나 데이터 명을 식별하는 과정이다. 기존의 데이터베이스에서 질의에 포함된 단어를 검색하여 개체명을 인식하는 방식은 동음이의어와 문장성분 구를 문맥을 고려하여 식별하지 못한다. 다수의 검색 결과가 존재하면 그들 모두를 결과로 반환하기 때문에 질의에 대한 해석이 여러 가지가 나올 수 있고, 계산을 위한 시간복잡도가 커진다. 본 연구에서는 이러한 단점을 극복하기 위해 신경망 기반의 방법론을 사용하여 질의가 가지는 문맥적 의미를 반영함으로써 이러한 문제를 해결하고자 했고 신경망 기반의 방법론의 문제점인 학습되지 않은 단어에 대해서도 문맥을 통해 식별을 하고자 하였다. Sequence Tagging 분야에서 최신 기술인 Bidirectional LSTM-CRF 모델을 도입함으로써 신경망 모델이 가진 단점을 해결하였고, 학습되지 않은 단어에 대해서는 온톨로지 기반 특성치를 활용하여 문맥을 반영한 추론을 사용하였다. 음악 도메인의 온톨로지(Ontology) 지식베이스를 대상으로 실험을 진행하고 그 성능을 평가하였다. 본 연구에서 제안한 방법론인 L-Bidirectional LSTM-CRF의 성능을 정확하게 평가하기 위하여 학습에 포함된 단어들뿐만 아니라 학습에 포함되지 않은 단어들도 포함한 질의를 평가에 사용하였다. 그 결과 L-Bidirectional LSTM-CRF 모형을 재학습 시키지 않아도 학습에 포함되지 않은 단어를 포함한 질의에 대한 개체명 인식이 가능함을 확인하였고, 전체적으로 개체명 인식의 성능이 향상됨을 확인할 수 있었다.

한국표준산업분류를 기준으로 한 문서의 자동 분류 모델에 관한 연구 (A Study on Automatic Classification Model of Documents Based on Korean Standard Industrial Classification)

  • 이재성;전승표;유형선
    • 지능정보연구
    • /
    • 제24권3호
    • /
    • pp.221-241
    • /
    • 2018
  • 지식사회에 들어서며 새로운 형태의 자본으로서 정보의 중요성이 강조되고 있다. 그리고 기하급수적으로 생산되는 디지털 정보의 효율적 관리를 위해 정보 분류의 중요성도 증가하고 있다. 본 연구에서는 기업의 기술사업화 의사결정에 도움이 될 수 있는 맞춤형 정보를 자동으로 분류하여 제공하기 위하여, 기업의 사업 성격을 나타내는 한국표준산업분류(이하 'KSIC')를 기준으로 정보를 분류하는 방법을 제안하였다. 정보 혹은 문서의 분류 방법은 대체로 기계학습을 기반으로 연구되어 왔으나 KSIC를 기준으로 분류된 충분한 학습데이터가 없어, 본 연구에서는 문서간 유사도를 계산하는 방식을 적용하였다. 구체적으로 KSIC 각 코드별 설명문을 수집하고 벡터 공간 모델을 이용하여 분류 대상 문서와의 유사도를 계산하여 가장 적합한 KSIC 코드를 제시하는 방법과 모델을 제시하였다. 그리고 IPC 데이터를 수집한 후 KSIC를 기준으로 분류하고, 이를 특허청에서 제공하는 KSIC-IPC 연계표와 비교함으로써 본 방법론을 검증하였다. 검증 결과 TF-IDF 계산식의 일종인 LT 방식을 적용하였을 때 가장 높은 일치도를 보였는데, IPC 설명문에 대해 1순위 매칭 KSIC의 일치도는 53%, 5순위까지의 누적 일치도는 76%를 보였다. 이를 통해 보다 정량적이고 객관적으로 중소기업이 필요로 할 기술, 산업, 시장정보에 대한 KSIC 분류 작업이 가능하다는 점을 확인할 수 있었다. 또한 이종 분류체계 간 연계표를 작성함에 있어서도 본 연구에서 제공하는 방법과 결과물이 전문가의 정성적 판단에 도움이 될 기초 자료로 활용될 수 있을 것으로 판단된다.

경호요원 권총사격시 조준선정렬방식과 기록변화와의 관계 (The Effects of Sight Alignment Method on Pistol Shooting Records of Security Guard)

  • 이상철;신승철
    • 시큐리티연구
    • /
    • 제14호
    • /
    • pp.367-388
    • /
    • 2007
  • 경호요원들이 훌륭한 권총사격술을 하기 위해서는 여러 가지 중요한 요소들이 있겠지만 신속하고 정확한 사격을 위해서 가장 중요한 요소가 바로 조준방식을 어떻게 하느냐에 달렸다. 권총 사격 시 조준하는 시간이 상대적으로 많이 소요되기 때문에 조준방식에 변화를 주면 권총사격술에 많은 향상이 있으리라 예상된다. 하지만 우리나라 대부분의 국가기관 교육기관에서는 권총 사격 조준 시 가늠쇠, 가늠쇠를 교차 시켜 표적에 일치 시키는 기본적 조준 방식을 주로 가르친다. 즉 정지된 표적에 대한 조준 방식만 가르치는 것이다. 우리나라의 일부 기관이나 우리보다 총기의 사용빈도나 역사가 오래된 해외에서는 다른 조준방식들도 교육시키고 있다. 가늠쇠만 가지고 조준하는 방식과 지향조준방식을 대표적으로 교육시키는데 이 조준방법들은 대부분 움직이는 표적에 대하여 좋은 결과를 나타낼 것이라 판단되어지기 때문이다. 그 이유는 기본조준방식은 가늠쇠와 가늠자를 교차시켜 표적에 다시 일치시켜야 하는 단계에서 다른 조준방법보다 많은 시간이 소요될 것이기 때문에 다른 두 조준방식이 신속성과 정확성이 요구되는 현장에서 보다 좋은 결과를 나타낼 것이기 때문이다. 이에 국내 국가기관 중 권총사격에 익숙한 집단인 P국가기관요원들을 20명 선발하여 측정한 결과, 근거리인 5m에서는 지향조준방법이 가장 우수한 결과를 나타냈다. 또한 권총으로써 비교적 원거리인 15m에서는 정확성만 따지고 봤을 때는 기본조준방식이 가장 우수하였으나 통계적 결과분석을 비추어 볼 때 가장 우수한 조준방식은 지향 조준방식으로 판명되었다.

  • PDF

사회연결망분석과 인공신경망을 이용한 추천시스템 성능 예측 (Predicting the Performance of Recommender Systems through Social Network Analysis and Artificial Neural Network)

  • 조윤호;김인환
    • 지능정보연구
    • /
    • 제16권4호
    • /
    • pp.159-172
    • /
    • 2010
  • 협업필터링 추천은 다양한 분야에서 활용되고 있지만 트랜잭션 데이터의 성격에 따라 추천 성능에 현저한 차이를 보이고 있다. 기존 연구에서는 이러한 추천 성능의 차이가 나타나는 이유에 대한 설명을 구체적으로 제시하지 못하고 있고 이에 따라 추천 성능의 예측 또한 연구된 바가 없다. 본 연구는 사회네트워크분석과 인공신경망 모형을 이용하여 협업필터링 추천시스템의 성능을 예측하고자 한다. 본 연구의 목적을 달성하기 위해 국내 백화점의 트랜잭션 데이터를 기반으로 형성되는 고객간 사회 네트워크의 구조적 지표를 측정한 후 이를 기반으로 인공신경망 모형을 구축하고 검증한다. 본 연구는 협업필터링 추천 성능을 예측할 수 있는 새로운 모형을 제시하였다는 점에서 그 의의가 있으며 이를 통해 기업들의 협업필터링 추천시스템 도입에 대한 의사결정에 도움을 줄 수 있을 것으로 기대된다.

연관규칙 마이닝에서의 동시성 기준 확장에 대한 연구 (An Investigation on Expanding Co-occurrence Criteria in Association Rule Mining)

  • 김미성;김남규;안재현
    • 지능정보연구
    • /
    • 제18권1호
    • /
    • pp.23-38
    • /
    • 2012
  • 온라인 쇼핑몰은 인터넷을 통해 손쉽게 접근이 가능하기 때문에, 최초 구매의사가 발생한 시점으로부터 이에 대한 실제 구매가 실현되기까지의 기간이 오프라인 쇼핑몰에 비해 비교적 짧게 나타난다. 즉 오프라인 쇼핑몰의 경우 구매희망 물품을 바로 구매하기 보다는 몇 개의 물품들을 모아서 구매하는 행태가 일반적이다. 하지만, 인터넷 쇼핑몰의 경우 단 하나의 물품만을 포함하고 있는 주문이 전체 주문의 절반 이상을 차지한다. 따라서 온라인 쇼핑몰 데이터의 장바구니 분석에 전통적 데이터마이닝 기법을 그대로 적용할 경우, Null Transaction의 수가 지나치게 많음으로 인해 합리적 수준의 지지도(Support)를 만족시키는 규칙을 찾는 것이 매우 어렵게 된다. 이러한 이유로 온라인 데이터를 사용한 많은 연구는 동시성 기준을 여러 방법으로 확장하여 사용하였는데, 이들 동시성 기준은 명확한 근거나 합의 없이 연구자의 상황에 따라 임의로 선택된 측면이 있다. 따라서 본 연구에서는 온라인 마켓 분석에 적용되는 구매의 동시성 기준을 정확도 측면에서 평가함으로써, 구매의 동시성 기준 선정을 위한 근거를 제시하고자 한다. 또한 동시성 기준의 정확도가 고객의 평균 구매간격에 따라 상이하게 나타나는 것을 파악하여, 향후 고객의 특성에 따른 차별화된 추천 시스템 구축을 위한 기본 방향을 제시하고자 한다. 이를 위해 국내 대형 인터넷 쇼핑몰의 최근 2년간 실제 거래 내역을 대상으로 실험을 수행하였으며, 실험 결과 단골 고객의 구매 추천을 위한 분석의 경우 추천 범위와 분석 데이터의 동시성 기준을 맞추어 연관규칙을 도출하는 것이 바람직하며, 비단골 고객의 경우 대부분의 추천 범위에 대해서 분석 데이터의 동시성 기준을 비교적 길게 설정하여 연관규칙을 도출하는 것이 바람직한 것으로 나타났다.

통계적 접근법을 기초로 하는 지능형 교육 지원 시스템 (The Statistical Approach-based Intelligent Education Support System)

  • 정준희
    • 지능정보연구
    • /
    • 제18권1호
    • /
    • pp.109-123
    • /
    • 2012
  • 기존 학습 시스템에서는 선수 지식이 없는 학생에게 너무 어려운 내용을 제공해서 실제로 학생에게 도움이 되지 않는 경우도 있고, 이미 해당 내용을 알고 있는 학생에게 같은 내용의 콘텐츠를 반복 제공해서 학생에게 도움이 되지 않는 경우도 있다. 이러한 현상을 해결하는 방법으로 논문에서는 학생들에게 가장 적절한 난이도의 강의 콘텐츠를 전달하는 방법이 제안되었다. 난이도는 상대적인 개념이라서 어떠한 학생 집단에게는 A라는 콘텐츠가 B라는 콘텐츠보다 쉬울 수 있고, 어떠한 학생 집단에게는 B라는 콘텐츠가 A라는 콘텐츠보다 쉬울 수 있으므로 정확하게 측정하는 것은 쉽지 않지만 논문에서는 이러한 부분을 고려해서 학생들에게 적절한 강의 콘텐츠를 전달하는 방법이 제안되었다. 논문 제안 시스템에서 전체 강의 콘텐츠는 여러 개의 강의 모듈로 나눠진다. 학생은 강의를 수강하기 전 패턴인식 문항이라고 하는 선수 테스트 문항을 풀고, 시스템은 채점 결과에 따라서 여러 개의 강의 모듈들 중 해당 학생에게 가장 적절한 강의 콘텐츠를 선택해서 제공한다. 시스템이 학생에게 전달할 강의 모듈을 선택하는데 있어서 학생의 패턴인식 문항 답안과 강의 모듈들의 난이도가 반영된다. 강의 모듈들의 난이도는 패턴인식 문항을 풀었던 모든 학생들의 답안 채점 결과가 반영되므로 학생의 답안 채점이 진행될 때마다 따라 계속 변경된다. 논문 제안 시스템은 이렇게 학생들의 답안을 이용해서 해당 학생 집단의 상대적인 지식을 파악하고 각 강의 모듈들의 난이도를 지정한다. 논문에서 제안된 방법은 전체적인 강의 콘텐츠의 순서가 강의 진행에 상관이 없는 경우에만 개선 효과가 적용된다. 1단원의 내용을 알아야 2단원의 내용을 배울 수 있는 형식의 강의 콘텐츠에서는 논문의 제안 방법이 적용되지 않는다. 논문에서는 강의 순서가 중요하지 않은 과목들 중에서 영어 문법 강의를 바탕으로 제안 방법이 설명되었다. 제안된 내용이 학습 환경에 적절하게 적용 된다면 기초 지식이 충분하지 않은 학생은 기초 지식을 충분하게 배워서 보다 어려운 내용의 콘텐츠를 배울 기반을 마련하게 될 것이고, 해당 단원의 내용을 이미 알고 있는 학생은 알고 있는 내용을 다시 배우지 않는 방법으로 시간을 절약해서 보다 다양한 콘텐츠를 학습하게 되는 등 많은 개선 효과가 제공될 것이다.