• 제목/요약/키워드: 규칙 생성과 평가

검색결과 196건 처리시간 0.033초

한국농수산대학 신입생 자기소개서의 텍스트 마이닝과 연관규칙 분석 (1) (Text Mining and Association Rules Analysis to a Self-Introduction Letter of Freshman at Korea National College of Agricultural and Fisheries (1))

  • 주진수;이소영;김종숙;신용광;박노복
    • 현장농수산연구지
    • /
    • 제22권1호
    • /
    • pp.113-129
    • /
    • 2020
  • 본 연구는 2020년 한농대 입학생의 비정형 텍스트인 자소서에서 의미 있는 정보 혹은 규칙을 추출하기 위하여 고교 재학 중 '학업 및 학습경험'과 '교내 활동'을 기술한 두 개 문항에 대하여 텍스트 마이닝에 의한 토픽 분석과 연관성 분석을 하였다. 모집 전형을 구분하지 않은 텍스트 마이닝 분석 결과에서 '학업 및 학습 경험' 항목과 관련된 주요 키워드는 '공부', '생각', '노력', '문제', '친구' 등의 순으로 많이 나타났으며, '교내 활동' 항목과 관련된 주요 키워드는 '활동', '생각', '친구', '동아리', '학교' 등의 순으로 빈도가 높게 나타났다. 그러나 도시 인재 전형과 농수산 인재 전형 신입생들의 키워드 빈도 순위는 두 항목 모두 전형 특성에 따른 약간의 차이를 나타냈다. 빈도 분석에 결과는 빈도수 상위 50위까지의 키워드를 워드 클라우드로 시각화하여 키워드를 알기 쉽게 표현하였다. 연관 분석은 apriori() 함수를 사용하였으며 적정한 계산을 위하여 support(지지도)와 confidence(신뢰도)의 기준값을 항목별로 설정하였다. 먼저 '학업' 항목에 대한 연관 규칙은 46개를 추출하였으며, 그 가운데 {공부} => {생각}, {성적} => {공부} 및 {과목} => {공부} 등의 규칙에서 높은 연관성을 볼 수 있었다. 이 규칙을 바탕으로 매개체 역할의 키워드를 평가하는 관계 중심성 평가와 노드에 연결된 edge의 수에 따라 중요도를 파악하는 연결 중심성 평가에서는 '생각', '공부', '노력', '시간' 등의 키워드가 중심적인 역할을 하는 정보를 획득하였다. 다음으로 '교내 활동' 항목에서는 45개의 연관 규칙을 생성하여 {활동} => {생각}, {동아리} => {활동} 등의 규칙에서 높은 연관성을 볼 수 있었으며, 관계 중심성 평가와 연결 중심성 평가에서는 '생각', '활동', '학교', '시간', '친구' 등의 키워드가 중심 키워드라는 결과를 얻었다. 다음 연구에서는 자소서의 나머지 두 개의 문항 '배려·나눔·협력·갈등관리' 항목과 한농대 '지원동기와 향후 진로계획' 항목을 분석한다. 분석에는 '키워드의 빈도'에 '문서 빈도의 역수'를 곱하여 주로 다량의 문서에서 핵심어를 추출하는 TF-IDF(Term Frequency-Inverse Document Frequency) 분석을 추가한다.

지도 생성과 위치 인식을 적용한 가정용 청소로봇의 경로 탐색 기법 (Path Planning Method of Home Vacuum Robot with Mapping and Localization)

  • 양시현;이정현;정덕원;민덕기
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2010년도 한국컴퓨터종합학술대회논문집 Vol.37 No.1(C)
    • /
    • pp.358-363
    • /
    • 2010
  • 본 논문은 가정용 청소로봇이 대중화가 이루어지면서 많은 종류의 청소로봇들이 개발되고 있지만 대부분의 청소로봇들이 외부 환경과 상호적으로 대응하지 못하고 무작위 경로 생성에 가까운 알고리즘들을 적용하고 있는 점에서 착안하였다. 목표로 하고 있는 경로 탐색 기법은 대부분의 가정용 청소로봇이 장착하고 있는 범퍼 센서를 사용하여 논리적인 가상의 지도를 생성하고 이 정보를 활용하여 청소로봇의 위치를 파악하고 최적의 청소 경로를 생성하는 방법이다. 사람이 진공청소기를 사용하여 청소를 하듯이 청소할 공간을 파악하고 일련의 규칙대로 청소하는 무의식의 프로세스를 청소로봇이 최대한 유사하게 작동하기 위해서는 벽뿐만 아니라 소파나 테이블과 같은 로봇의 움직임을 방해하는 각종 요소들을 모두 고려해야 한다. 그러므로 본 논문에서는 Occupancy Grid Map을 생성하여 로봇이 장애물의 위치를 파악하고 청소 경로를 탐색할 수 있도록 한다. 그리고 이러한 경로 탐색 기법을 적용하기 위해서 Monte-Carlo Localization 알고리즘을 사용하며 생성된 Occupancy Grid Map을 통하여 로봇이 자체적으로 위치를 파악할 수 있도록 한다. 청소로봇이 자체의 위치를 파악하게 되면 로봇의 크기와 비교하여 움직일 수 있는 공간과 움직이지 못하는 공간을 구별하여 이동 가능한 영역과는 별개로 청소를 위한 경로 탐색을 수행할 수 있다. 청소를 목적으로 하는 경로 탐색은 청소 영역을 최대화하면서 최적의 경로를 탐색하고 Localization을 통해 해당 경로를 유지하면서 이동할 수 있게 된다. 이러한 경로 탐색 기법을 제시하면서 기존의 청소로봇들과의 알고리즘 차원에서의 비교 및 그 성능 평가는 향후 연구에서 해결하도록 한다.

  • PDF

부유식 연직판의 규칙파 모델링을 위한 오픈폼 적용성 검토 (Investigation of Applicability of OpenFOAM for Regular Wave Modeling of Floating Vertical Plate)

  • 오상호;김건우
    • 한국해안·해양공학회논문집
    • /
    • 제29권6호
    • /
    • pp.382-388
    • /
    • 2017
  • 본 연구에서는 OpenFOAM 기반의 부유식 연직판의 파랑 저감 성능 평가 수치해석 모델링을 수행하였다. Waves2FOAM 라이브러리를 기반으로 내부조파에 의한 파랑 생성 및 스폰지층에 의한 소파 기능을 추가로 적용하였다. 이렇게 추가된 조파 및 소파 기능을 먼저 간단한 2차원 해석으로 검증한 후, Briggs et al.(2001)의 규칙파 실험자료 2가지에 대한 수치모델링을 수행하였다. 모델링 결과는 실험자료와 대체로 잘 일치하였으며, Briggs et al.(2001)에 수록된 WAMIT 수치해석 결과보다 더 좋은 결과를 나타내었다.

GMDH 방법에 의한 FPNN 일고리즘과 폐스처리공정에의 응용 (Fuzzy Polynomial Neural Network Algorithm using GMDH Mehtod and its Application to the Wastewater Treatment Process)

  • 오성권;황형수;안태천
    • 한국지능시스템학회논문지
    • /
    • 제7권2호
    • /
    • pp.96-105
    • /
    • 1997
  • 본 논문에서는 복잡한 비선형 시스템의 모델동정을 위해 퍼지모델링의 새로운 방법이 제안된다. 제안된 FPNN모델링은 공정시스템의 입출력 데이터로부터 GMDH방법과 퍼지구현규칙을 이용하여 시스템의 구조와 파라미터 동정을 구현한다. 퍼지구현규칙의 전반부 구조와 파라미터 동정을 위하여 GMDH 방법과 희귀다항식 퍼지추론 방법이 사용되고 최적 후반부 파라미터 동정을 위하여 최소자승법이 사용된다. 가스로 시계열데이타 및 하수처리시스템의 활성화의 공정 데이터가 제안한 FPNN 모델링의 성능을 평가하기 위해 상용된다. 제안된 방법이 기존의 다른 논문과 비교하여 더 높은 정확도를 가진 지능형 모델을 생성함을 보인다.

  • PDF

Interval Type-2 FCM based RBFNN의 도움으로 실현된 사례 및 에코 분류기 설계 : LSE와 WLSE의 비교연구 (Design of Event and Echo Classifier Realized with the Aid of Interval Type-2 FCM based RBFNN : Comparative Studies of LSE and WLSE)

  • 송찬석;오성권;김현기
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2015년도 제46회 하계학술대회
    • /
    • pp.1347-1348
    • /
    • 2015
  • 본 논문에서는 기상레이더 데이터에서 섞여있는 강수에코 및 비강수에코를 분류하기 위하여 Interval Type-2 FCM based RBFNN의 도움으로 사례 및 에코 분류기의 설계를 제안한다. 학습과 테스트 데이터는 현재 기상청에서 사용하는 UF radar data를 사용하였으며, 사례 분류기와 에코패턴 분류기의 데이터를 각각 생성한다. 전처리 과정인 사례 분류를 통하여 강수사례 혹은 비강수사례를 분류하여 강수사례일 경우 에코패턴분류를 진행하며, 비강수사례일 경우 데이터에 관측된 모든 반사도 값을 제거한다. 사례 및 에코 분류기는 Interval Type-2 FCM based RBFNN을 통하여 패턴분류를 진행하며, 패턴분류 성능을 확인한다. 또한 후반부 파라미터의 동정 시, 각 규칙에 파라미터를 전역적으로 구하는 LSE와 각 규칙에 대한 파라미터를 독립적으로 구하는 WSLE의 비교연구를 수행한다. 분류기의 성능을 확인하기 위하여 사례 분류 후 에코패턴분류의 결과는 현재 기상청에서 사용하고는 품질검사(QC) 데이터와 비교하여 평가하였다.

  • PDF

단순 RDF 메시지의 온톨로지 상호 운용성을 위한 변환 규칙들의 연쇄 조합 (Cascade Composition of Translation Rules for the Ontology Interoperability of Simple RDF Message)

  • 김재훈;박석
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제34권6호
    • /
    • pp.528-545
    • /
    • 2007
  • 최근 모바일과 유비쿼터스 컴퓨팅에서 보다 지능적인 다양한 서비스를 제공하고자 하는 비즈니스 전략과 함께 온톨로지 기술이 큰 관심이 되고 있다. 온톨로지를 이용하는 응용 도메인에서의 본질적 문제점은 모든 영역 구성원, 에이전트, 응용 프로그램이 온톨로지에서 정의된 동일 개념을 공유해야 하는 것이다. 하지만, 다양한 제조업자에 의해서 만들어지는 다양한 모바일 디바이스, 센싱 디바이스, 네트워크 구성요소, 다양한 통신 사업자, 다양한 서비스 제공업자 들이 모여 이루어지는 모바일과 유비쿼터스 컴퓨팅 환경에서는 서로 상이한 온톨로지가 공존할 가능성이 높다. 이러한 의미적 상호 운용성의 문제를 해결하고자 했던 다수의 연구가 있다. 이를 크게 분류하면, 맵핑, 합병, 변환에 의한 방법들이다. 본 연구에서는 이러한 방법들 중 OntoMorph와 같이 상이한 온톨로지 데이타들 간에 변환 규칙을 직접 작성하여 사용하는 방법에 초점을 맞춘다. 하지만 이러한 변환 규칙을 수작업으로 직접 작성하는 방법은, 그 자체도 어려울뿐더러 N개의 온톨로지가 존재할 경우 최악의 경우 $O(N^2)$의 변환 규칙 작성 복잡도를 갖는다. 따라서 본 논문에서는 이러한 복잡도를 개선하기 위한, 웹의 개방성에 근거한 연쇄 조합 변환 규칙 생성의 개념을 소개한다. 연구 성과는 변환 규칙의 변환의 신속성, 변환의 적합성, 변환 규칙 작성의 용이성 등의 중요한 평가 요소를 도출할 수 있었으며, 몇 가지 실험 및 기존 연구와의 비교 분석을 통하여 제안된 방법이 신속성과 정확성을 보장하면서 보다 높은 용이성을 가짐을 확인할 수 있었다.

퍼지 동정에 의한 교통경로선택 (Traffic Rout Choice by means of Fuzzy Identification)

  • 오성권;남궁문;안태천
    • 한국지능시스템학회논문지
    • /
    • 제6권2호
    • /
    • pp.81-89
    • /
    • 1996
  • 퍼지모델링의 설계 방법을 교통경로선택의 모델동정을 위하여 제안한다. 제안된 퍼지모델은 최적화이론, 퍼지구현규칙을 사용하여 ""IF..., THEN...""의 효율적인 형태로 시스템구조와 파라미터 동정을 시행한다. 이 논문에서 간략추론, 선형추론, 병형된 선형추론의 3가지종류의 퍼지모델링 방법을 제시한다. 이 퍼지추론 방법은 인간의 교통행동의 정확한 추정과 정밀한 묘사를 위해 교통경로선택 모델을 개발하기 위해 이용된다. 퍼지규칙의 전반부 구조와 파라미터를 동정하기 위해 개선된 컴플렉스법을 사용하고, 최적후반부 파라미터를 동정하기 위해 최소자승법이 사용된다. 교통경로선택 데이타가 제안된 퍼지모델 성능을 평가하기 위해 사옹된다. 제안된 방법이 기존의 다른 연구들 - 즉 BL, PS, FL, NN, FNNs 모델 등 - 보다 더 높은 정확도를 가진 퍼지모델을 생성함을 보인다. 생성함을 보인다.

  • PDF

종 분화 진화 알고리즘을 이용한 안정된 베이지안 네트워크 앙상블 구축 (Construction of Robust Bayesian Network Ensemble using a Speciated Evolutionary Algorithm)

  • 유지오;김경중;조성배
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권12호
    • /
    • pp.1569-1580
    • /
    • 2004
  • 베이지안 네트워크는 불확실한 상황을 모델링하기 위한 확률 기반의 모델로서 확실한 수학적 토대를 가지고 있다. 베이지안 네트워크의 구조론 자동 학습하기 위한 연구가 많이 있었고, 최근에는 진화 알고리즘을 이용한 연구가 많이 진행되고 있다. 그러나 대부분은 마지막 세대의 가장 좋은 개체만을 이용하고 있다. 시스템이 요구하는 다양한 요구 조건을 하나의 적합도 평가 수식으로 나타내기 어렵기 때문에, 마지막 세대의 가장 좋은 개체는 종종 편향되거나 변화하는 환경에 덜 적응적일 수 있다. 본 논문에서는 적합도 공유 방법으로 다양한 베이지안 네트워크를 생성하고, 이를 베이즈 규칙을 통해 결합하여 변화하는 환경에 적응적인 추론 모델을 구축할 수 있는 방법을 제안한다. 성능 평가를 위해 ASIA와 ALARM 네트워크에서 인공적으로 생성한 데이타를 이용한 구조 학습 및 추론 실험을 수행하였다. 다양한 조건에서 학습된 네트워크를 실험한 결과, 제안한 방법이 변화하는 환경에서 더욱 강건하고 적응적인 모델을 생성할 수 있음을 알 수 있었다.

임베디드 시스템에 적합한 한국어 복합명사 분해 (Korean Compound Nouns Decomposition Suitable for Embedded Systems)

  • 최민석;김창현;천민아;박호민;남궁영;윤호;김재훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.316-320
    • /
    • 2018
  • 복합명사는 둘 이상의 말이 결합된 명사를 말하며 문장에서 하나의 단어로 간주된다, 그러나 맞춤법 및 띄어쓰기 검사나 정보검색의 색인어 추출, 기계번역의 미등록어 추정 등의 분야에서는 복합명사를 구성하는 개별 단어를 확인할 필요가 있다. 이 과정을 복합명사 분해라고 한다. 복합명사를 분해하는 방법으로 크게 규칙 기반 방법, 통계 기반 방법 등이 있으며 본 논문에서는 규칙을 기반으로 최소한의 통계 정보를 이용하는 방법을 제안한다. 본 논문은 4개의 분해 규칙을 적용하여 분해 후보를 생성하고 분해 후보들 중에 우선순위를 정하여 최적 후보를 선택하는 방법을 제안한다. 기본 단어(명사)로 트라이(trie)를 구축하고 구축된 트라이를 이용하여 양방향 최장일치를 적용하고 음절 쌍의 통계정보를 이용해서 모호성을 제거한다. 성능을 평가하기 위해 70,000여 개의 명사 사전과 음절 쌍 통계정보를 구축하였고, 이를 바탕으로 복합명사를 분해하였으며, 분해 정확도는 단어 구성비를 반영하면 96.63%이다. 제안된 복합명사 분해 방법은 최소한의 데이터를 이용하여 복합명사 분해를 수행하였으며 트라이 자료구조를 사용해서 사전의 크기를 줄이고 사전의 검색 속도를 개선하였다. 그 결과로 임베디드 시스템과 같은 소형 기기의 환경에 적합한 복합명사 분해 시스템을 구현할 수 있었다.

  • PDF

변형된 FP-Tree를 기반한 상품 추천 시스템 (The Goods Recommendation System based on modified FP-Tree Algorithm)

  • 김종희;정순기
    • 한국컴퓨터정보학회논문지
    • /
    • 제15권11호
    • /
    • pp.205-213
    • /
    • 2010
  • 연관규칙 마이닝 기법 중에 하나인 FP-트리 알고리즘을 이용하는 추천시스템이 시도되고 있다. 본 논문에서는 트랜�Ъ� 데이터베이스로부터 빈발 2-항목집합만을 추출하여 연관규칙을 생성하는 변형된 FP-알고리즘을 사용하는 추천시스템을 제안하였다. 제안된 추천시스템은 전처리 모듈, 학습 모듈, 추천 모듈 및 평가 모듈로 구성되었다. 제안된 추천시스템의 실험을 통하여 상품 추천의정확률과 재현율과 F-Measure와 성공률과 추천실행시간을 수행하였으며, 순차패턴 마이닝 기법을 사용하는 추천시스템과의 성능을 비교분석 하였다. 순차패턴 마이닝기법을 사용하는 추천시스템과 학습 성능, 추천 성능을 비교한 결과 학습 성능은 5배 이상 향상되었으며, 추천 성능은 20%이상 향상 되었다. 결론적으로, 순차패턴 추천시스템과 같은 데이터를 가지고 실험하여 추천시스템 성능의 타당성에는 보다 나은 시스템임을 입증 하였다.