• 제목/요약/키워드: Character Network Analysis

검색결과 104건 처리시간 0.031초

다중 기계학습 방법을 이용한 한국어 커뮤니티 기반 질의-응답 시스템 (A Korean Community-based Question Answering System Using Multiple Machine Learning Methods)

  • 권순재;김주애;강상우;서정연
    • 정보과학회 논문지
    • /
    • 제43권10호
    • /
    • pp.1085-1093
    • /
    • 2016
  • 커뮤니티 기반 질의 응답 시스템은 사용자 질의에 대한 정답을 인터넷 커뮤니티에 사용자들이 게시했던 문서 중에서 선택하여 제공하는 시스템이다. 기존 방법들은 질의 분석의 성능 향상을 위하여 목적 영역에 적합한 규칙을 구축하거나 일부 처리 과정에 기계 학습을 적용하였다. 하지만 기존 방법들은 적용 영역을 확장하거나 수정하는 경우 많은 비용이 소요되며 경우에 따라서는 시스템이 특정 영역에 과적합되는 경우가 발생한다. 본 논문에서는 커뮤니티 기반 질의-응답 시스템의 효과적인 처리를 위해서 시스템의 각 과정에 적합한 기계 학습 방법을 적용하여 전체 과정을 자동화하는 다중 기계학습 방법을 제안한다. 제안 시스템은 사용자 질의를 분석하는 부분과 정답 문서를 선택하는 부분으로 나눌 수 있다. 질의 분석 과정은 질의의 초점 구문을 분석하는 질의 핵심부 추출기와 질의의 주제를 분류하는 질의 유형 분류기로 구성하였으며, 전자는 조건부 무작위장을 사용하고 후자는 지지 벡터 기계를 사용한다. 정답 문서 선택에서는 유사도 측정에서 사용하는 가중치를 인공 신경망으로 학습한다. 또한 인터넷에 커뮤니티에 게시된 데이터는 형태소 분석 결과를 신뢰할 수 없는 경우가 많이 발생한다. 따라서 음절 자질을 사용하여 질의를 분석 단계에서 형태소 분석의 영향을 최소화하는 방법을 제안한다. 제안하는 시스템은 Mean Average Precision 기준으로 0.765, R-Precision 기준으로 0.872의 성능을 보여 기존 시스템보다 성능이 우수하다.

연결요소 분석에 기반한 인쇄체 한글 주소와 필기체 한글 주소의 구분 (Classification of Handwritten and Machine-printed Korean Address Image based on Connected Component Analysis)

  • 장승익;정선화;임길택;남윤석
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권10호
    • /
    • pp.904-911
    • /
    • 2003
  • 본 논문에서는 우편봉투 상에 기입된 인쇄체 한글 주소와 필기체 한글 주소를 효과적으로 구분할 수 있는 방법을 제안한다. 문자인식 모듈을 포함하는 각종 응용 시스템에서 입력 영상이 인쇄체인지 필기체인지 구분하는 것은 매우 중요하다. 이는 대부분의 경우 인쇄체 영상과 필기체 영상이 갖는 특징이 상이하여, 각 영상에서의 문자 및 문자열 분리 방법, 문자 인식 방법 둥이 매우 상이하게 개발되기 때문이다. 본 논문에서 제안한 구분 방법은 연결요소 추출 및 병합, 특징 추출, 영상 구분 순으로 수행된다. 연결요소 추출 및 병합 단계에서는 입력영상으로부터 연결요소를 추출한 후 일부 연결요소들에 대하여 병합을 시도하며, 특징 추출 단계에서는 병합결과 얻어진 연결요소들의 그룹들로부터 폭과 위치에 관련된 특징을 추출하고, 영상 구분 단계에서는 추출한 특징을 입력으로 제공받는 다충퍼셉트론을 사용하여 구분을 시도한다. 제안한 방법의 우수성을 증명하기 위해 실제 우편물로부터 추출된 3,147개의 한글 주소 영상을 사용하여 실험한 결과, 98.85%의 구분률을 보여주었다.

하이브리드 통계적 특징 모델과 신경망을 이용한 자동차 번호판 인식 (Recognition of License Plates Using a Hybrid Statistical Feature Model and Neural Networks)

  • 유신;정병준;강현철
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제36권12호
    • /
    • pp.1016-1023
    • /
    • 2009
  • 자동차 번호판 인식 시스템은 문자 추출, 특징 추출 등의 영상처리와 추출된 문자를 인식하는 인식기로 구성된다. 특징 추출은 문자 영역의 데이터 감소뿐만 아니라 인식 성능을 결정한다. 따라서 본 논문에서는 번호판 인식의 결과에 영향이 큰 숫자 인식, 특히 숫자의 특징 추출에 초점을 두었으며, 데이터의 군집성을 재배치하여 데이터 간의 최적의 산란도를 확보할 수 있는 통계적 특징의 혼합 모델을 제안하고, 이를 다층 퍼셉트론과 LVQ 신경망을 이용하여 유효성을 검증하였다. 제안된 통계적 특징 추출 방법은 번호판 영상이 갖는 정보를 가장 잘 유지하고, 잡음과 외부 환경에 강건하며 효과적인 방법임을 보여준다.

비대칭 다층 유전체 격자구조에 의한 GMR 현상의 분석 (Analysis of GMR Phenomenon by Asymmetric Multi-layered Dielectric Gratings)

  • 호광춘
    • 한국인터넷방송통신학회논문지
    • /
    • 제17권3호
    • /
    • pp.209-214
    • /
    • 2017
  • 비대칭 다층 유전체 격자구조에 입사된 평면파는 대칭 격자구조와 같이 공간 고조파들을 생성한다. 이 성분들 중에 특정 공간 고조파는 GMR 특성으로 알려진 강한 공진 산란 변화를 겪는다. 본 논문에서는 이러한 효과를 명확히 분석하기 위하여 고유치 문제에 기인한 정확한 등가전송선로 이론(RETT)을 사용하여 격자 영역 내부의 공진현상과 분산특성을 분석하였다. 그 결과, 산란 공진의 peak에서 격자구조에 의하여 발생한 반사 모드와 격자구조에서 전송되는 누설 모드가 거의 일치한다는 것을 알 수 있었다. 따라서 누설파의 자유 공명 특성과 관련된 GMR 효과가 비대칭 다층 유전체 격자구조에서도 발생한다는 것을 확인하고 일반화하였다. 전형적인 격자의 공진특성을 보여주는 정량적인 수치해석 결과가 주어졌으며 TE, TM 모드가 반사면에 수직 입사된 특수한 경우도 논의하였다.

Hough Transform과 부분 그래프 패턴을 이용한 한글 인식에 관한 연구 (A Study on the Hangul Recognition Using Hough Transform and Subgraph Pattern)

  • 구하성;박길철
    • 한국정보통신학회논문지
    • /
    • 제3권1호
    • /
    • pp.185-196
    • /
    • 1999
  • 본 논문에서는 부분 그래프 패턴과 신경망을 이용한 새로운 한글 오프라인 인식 시스템을 제안하였다. 문자를 입력으로 받아 세선화를 행한 후 위치에 관한 잡음 제거 기능을 갖는 균형화를 수행하고 인식단의 첫번째 단계에서 순환 성분을 추출하고 인식한다. 부블럭 HT 공간에서 끝점, 굴곡점, 분기점의 특징점을 추출하고 추출된 특징점 사이의 관계를 조사하여 부분 그래프 패턴을 구성한다. 종모음이 올 수 있는 구역을 할당하고 종모음 후보점을 추출하여 미리 조사된 부분 그래프 패턴 사전과 비교하여 종모음을 추출한다. 같은 방법으로 횡모음을 추출한 후 간단한 구조 해석적 방법으로 모음을 인식한다. 본 논문의 성능비교를 위하여 실험은 활자체의 경우 가장 많이 쓰이는 명조체와 고딕체 그리고 필기체를 대상으로 한다. 고딕체의 경우 인식율 98.9%, 명조체의 경우 인식율 98.2%, 필기체의 경우 92.5% 이었다. 다중 자형 인식을 위하여 필기체와 활자체의 구분 없이 구한 전체 시스템의 인식율은 94.8% 이었다.

  • PDF

비정상 문자 조합으로 구성된 스팸 메일의 탐지 방법 (An Approach to Detect Spam E-mail with Abnormal Character Composition)

  • 이호섭;조재익;정만현;문종섭
    • 정보보호학회논문지
    • /
    • 제18권6A호
    • /
    • pp.129-137
    • /
    • 2008
  • 인터넷의 활용도가 높아짐에 따라, 스팸메일이 전체 메일에서 차지하는 비중이 점점 커지게 되었다. 전체 인터넷 자원에서 필요에 의해 사용되는 메일의 기능보다, 주로 광고나 악성코드 등의 전파를 위한 목적으로 사용되는 메일의 비중이 점점 커지고 있으며, 이를 방지하기 위한 컴퓨터 및 네트워크, 인적자원의 소모가 매우 심각해지고 있다. 이를 해결하기 위해 스팸 메일 필터링에 대한 연구가 활발히 진행되어 왔으며, 현재는 문맥상의 의미는 없지만 가독상에서 의미를 해석할 수 있는 문장에 대한 연구가 활발히 이루어지고 있다. 이러한 방식의 메일은 기존의 어휘를 분석하거나 문서 분류 기법 등을 이용한 스팸 메일을 필터링 방법을 통해 분류하기 어렵다. 본 연구는 이와 같은 어려움을 해결하기 위해 메일의 제목에 대한 N-GRAM 색인화를 통해 베이지안 및 SVM 을 이용하여 스팸 메일을 필터링 하는 방법을 제안한다.

중고거래 어플리케이션 <당근마켓> 리뷰텍스트에 나타난 소비자의 인성 함축단어 텍스트마이닝 분석 (Analysis of Text Mining of Consumer's Personality Implication Words in Review of Used Transaction Application )

  • 정예린;주영애
    • 한국콘텐츠학회논문지
    • /
    • 제21권11호
    • /
    • pp.1-10
    • /
    • 2021
  • 본 연구는 중고거래 어플리케이션 <당근마켓>의 리뷰텍스트에 나타난 소비자의 인성 함축단어의 사용실태를 분석하였다. 데이터 수집은 2021년 5월로부터 과거 6개월간 서울과 경기권을 대상으로 하였다. 이는 웹 크롤러를 개발하여 무작위 추출 총 1368건을 수집 후, 최종 570건을 전처리하여 사용하였다. 결과는 다음과 같다. 첫째, 제품의 상거래 플랫폼임에도 리뷰텍스트의 48.2%는 소비자의 인성 관련 내용이었다. 둘째, 리뷰 텍스트는 긍정적 반응이 주를 이루며 이는 감사라는 키워드를 기반으로 텍스트 네트워크 구조를 형성하였다. 셋째, 소비자 인성을 함축하는 리뷰 텍스트는 소비자의 '대타적 인성'과' 대내적 인성'으로 그룹화되었고, 이는 플랫폼에서 통합적으로 작용하였다. 결론적으로 인성 관련 요인들이 플랫폼 거래 과정의 상호작용에서 중요한 역할을 함을 확인하였고, 앞으로 플랫폼의 서비스 품질에도 소비자의 인성이 경쟁력으로 작용할 것이므로, 이에 대해 다각도에서 연구되어야 할 것임을 제언하였다.

Three dimensional dynamic soil interaction analysis in time domain through the soft computing

  • Han, Bin;Sun, J.B.;Heidarzadeh, Milad;Jam, M.M. Nemati;Benjeddou, O.
    • Steel and Composite Structures
    • /
    • 제41권5호
    • /
    • pp.761-773
    • /
    • 2021
  • This study presents a 3D non-linear finite element (FE) assessment of dynamic soil-structure interaction (SSI). The numerical investigation has been performed on the time domain through a Finite Element (FE) system, while considering the nonlinear behavior of soil and the multi-directional nature of genuine seismic events. Later, the FE outcomes are analyzed to the recorded in-situ free-field and structural movements, emphasizing the numerical model's great result in duplicating the observed response. In this work, the soil response is simulated using an isotropic hardening elastic-plastic hysteretic model utilizing HSsmall. It is feasible to define the non-linear cycle response from small to large strain amplitudes through this model as well as for the shift in beginning stiffness with depth that happens during cyclic loading. One of the most difficult and unexpected tasks in resolving soil-structure interaction concerns is picking an appropriate ground motion predicted across an earthquake or assessing the geometrical abnormalities in the soil waves. Furthermore, an artificial neural network (ANN) has been utilized to properly forecast the non-linear behavior of soil and its multi-directional character, which demonstrated the accuracy of the ANN based on the RMSE and R2 values. The total result of this research demonstrates that complicated dynamic soil-structure interaction processes may be addressed directly by passing the significant simplifications of well-established substructure techniques.

고성능 네트워크에서 병렬 전송 기술을 이용한 전송률 극대화 메커니즘 (A Maximum Mechanism of Data Transfer Rate using Parallel Transmission Technology on High Performance Network)

  • 김영신;허의남
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제34권9호
    • /
    • pp.425-434
    • /
    • 2007
  • NGI나 Internet2와 같은 프로젝트로 인해 인터넷 백본 속도가 상당히 높아졌음에도 불구하고, 분산된 응용 프로그램들은 고성능의 네트워크를 제대로 활용하지 못하고 있다. 이러한 현상이 발생하는 원인으로 표준 전송 프로토콜(TCP)을 들 수 있다. TCP는 안전성/신뢰성을 보장하기 위해 설계되어 있으나, 이로 인해 발생될 수 있는 성능 저하에 관한 문제는 고려되지 않았다. 이러한 문제를 해결하고자 여러 기술들이 연구되고 있으며, 그 중 병렬 전송 기술은 응용레벨에서 다중 스트림을 이용하여 데이타를 전송하는 기술로써, 호환성 문제까지 해결하고 있다. 최근 병렬 전송 기술을 연구하는 연구자들은 최적의 병렬연결 개수의 범위를 찾는데 연구의 초점을 맞추고 있다. 그러나 이러한 연구들에서는 최적의 병렬연결 개수를 실험을 통해 경험적으로 결정하고 있으며, 데이타를 전송하는 호스트의 성능이나 전송 거리는 고려하지 않고 있다. 따라서 본 논문에서는 호스트의 성능과 병렬 전송과의 관계, 전송 거리와 병렬 전송 관계를 분석하고, 그 결과를 토대로 효율적이면서 최대 전송 성능을 확보할 수 있는 최적의 병렬연결 개수 결정 메커니즘을 논의하고자 한다.

통합과학 교과 역량에 대한 교사들의 인식 분석 (Analysis of Teachers' Perceptions on the Subject Competencies of Integrated Science)

  • 안유민;변태진
    • 한국과학교육학회지
    • /
    • 제40권2호
    • /
    • pp.97-111
    • /
    • 2020
  • 2015 개정 교육과정에서는 융복합적 사고력 신장을 위해 '통합과학'을 신설하고, 문이과 구분 없이 모든 학생이 배우도록 공통 과목으로 지정하였다. 또한 2015 개정 교육과정에서는 이전 교육과정과 차별화되는 특징으로 '역량'을 도입하였다. 2015 개정 교육과정에서 역량은 범교과적 성격의 핵심역량과 교과의 학문적 지식과 기능에 기반한 교과 역량으로 구분된다. 과학과 교과 역량에는 과학적 사고력, 과학적 탐구 능력, 과학적 문제 해결력, 과학적 의사소통 능력, 과학적 참여와 평생 학습 능력 5가지로 이루어져 있다. 하지만 교육과정 문서의 교과 역량에 대한 설명은 불충분하며, 역량에 대한 전문가들의 인식 역시 통일되어 있지 못한 실정이다. 이에 본 연구에서는 역량 기반 교육이 학교 현장에 제대로 적용되기 위해서는 과학 교사들이 역량에 대한 이해가 선행되어야 된다고 판단하여 고등학교 과학 교사들을 대상으로 과학과 교과 역량에 대한 인식을 조사하였다. 우선 통합과학 성취기준에 대한 이해가 높은 전문가 워킹 그룹 운영을 통해 통합과학의 성취기준과 교과 역량의 관계를 분석하였다. 그 다음으로 고등학교 과학 교사 31명에 대상으로 서술형 설문을 통해 5가지 교과 역량에 대한 인식을 알아보았다. 교사의 응답은 언어 네트워크 분석 기법을 통해 분석하였다. 분석 결과 과학적 탐구 능력, 과학적 의사소통 능력, 과학적 참여와 평생 학습 능력 3개 교과 역량은 교사들이 생각하는 바와 교육과정 문서에서 제시한 정의와 유사성이 높았으나, 과학적 사고력, 과학적 문제 해결력의 경우 교사들의 인식과 교육과정 문서상의 정의와 어느 정도 간극이 존재하였다. 또한 5개 역량에 대해 교사들의 인식을 종합적으로 분석한 결과를 보면 5개 교과 역량이 상호배타적이나 독립적이기 보다 연관성이 매우 높음을 알 수 있었다.