• 제목/요약/키워드: 문헌 클러스터링

검색결과 54건 처리시간 0.026초

음렬 탐색을 위한 주제소절 자동분류에 관한 연구 (A Study on the Musical Theme Clustering for Searching Note Sequences)

  • 심지영;김태수
    • 정보관리학회지
    • /
    • 제19권3호
    • /
    • pp.5-30
    • /
    • 2002
  • 본 연구는 음악의 내용에 해당하는 음렬 패턴을 대상으로 분류자질을 선정하고 이를 기준으로 음렬간 유사도를 측정한 후 음렬간 군집을 형성하였다. 이는 내용기반음악검색 시스템에서 유사한 음렬을 검색 결과로 제시함으로써 이용자 탐색을 용이하게 하기 위함이다. 실험문헌집단으로는 $\ulcorner$A Dictionary of Musical Themes$\lrcorner$에 수록된 주제소절의 kern 형식 파일을 사용하였으며, 음렬 처리도구로는 Humdrum Toolkit version 1.0을 사용하였다. 음렬의 분절 여부와 시작 위치에 따른 네 가지 형태의 유사도 행렬을 대상으로 계층적 클러스터링 기법을 사용하여 유사한 음렬간 군집을 형성하였다. 이들 결과에 대한 평가는 외적 기준이 되는 수작업 분류표가 있는 경우 WACS 척도를 사용하였고, 음렬 내 임의의 위치에서부터 시작한 음렬을 대상으로 한 경우, 클러스터링 결과로부터 얻어낸 군집 내 공통 자질 패턴 분포를 통해 내적 기준을 마련하여 평가하였다. 평가 결과에 의하면 음렬의 시작 위치와 무관하게 분절한 자질을 사용하여 클러스터링한 결과가 그렇지 않은 것에 비해 뚜렷한 차이를 보이며 높게 나타났다.

패스파인더 네트워크 분석에 의한 ASIST Proceedings 인용흐름 연구 (Citation Flow of the ASIST Proceeding Using Pathfinder Network Analysis)

  • 김희정
    • 정보관리학회지
    • /
    • 제25권2호
    • /
    • pp.157-166
    • /
    • 2008
  • 본 연구에서는 ASIST 프로시딩을 인용한 저널들을 중심으로 패스파인더 네트워크 분석을 수행함으로써, ASIST 프로시딩의 지식이 어떠한 주제영역을 중심으로 네트워크 구조를 형성하고 있는지를 확인하는 데에 그 목적이 있다. 이를 위하여 Scopus 데이터베이스에서 검색한 240개의 문헌을 대상으로 완전연결 클러스터링 기법을 통하여 16개 클러스터를 도출하였으며, MDS 및 패스파인더 네트워크 분석을 통하여 지식 네트워크를 매핑하였다. 지금까지 대부분의 경우 학술지를 대상으로 수행되어 온 네트워크 분석을 프로시딩을 대상으로 분석을 시도하였으며, 분석결과 ASIST 프로시딩은 정보추구행태 및 탐색과 인터페이스, 계량서지학 및 지식관리 주제영역의 논문이 타 문헌에 활발하게 소비되고 있음을 확인할 수 있었다.

기술과학 분야 학술문헌에 대한 학습집합 반자동 구축 및 자동 분류 통합 연구 (Semi-automatic Construction of Learning Set and Integration of Automatic Classification for Academic Literature in Technical Sciences)

  • 김선우;고건우;최원준;정희석;윤화묵;최성필
    • 정보관리학회지
    • /
    • 제35권4호
    • /
    • pp.141-164
    • /
    • 2018
  • 최근 학술문헌의 양이 급증하고, 융복합적인 연구가 활발히 이뤄지면서 연구자들은 선행 연구에 대한 동향 분석에 어려움을 겪고 있다. 이를 해결하기 위해 우선적으로 학술논문 단위의 분류 정보가 필요하지만 국내에는 이러한 정보가 제공되는 학술 데이터베이스가 존재하지 않는다. 이에 본 연구에서는 국내 학술문헌에 대해 다중 분류가 가능한 자동 분류 시스템을 제안한다. 먼저 한국어로 기술된 기술과학 분야의 학술문헌을 수집하고 K-Means 클러스터링 기법을 활용하여 DDC 600번 대의 중분류에 맞게 매핑하여 다중 분류가 가능한 학습집합을 구축하였다. 학습집합 구축 결과, 메타데이터가 존재하지 않는 값을 제외한 총 63,915건의 한국어 기술과학 분야의 자동 분류 학습집합이 구축되었다. 이를 활용하여 심층학습 기반의 학술문헌 자동 분류 엔진을 구현하고 학습하였다. 객관적인 검증을 위해 수작업 구축한 실험집합을 통한 실험 결과, 다중 분류에 대해 78.32%의 정확도와 72.45%의 F1 성능을 얻었다.

정보 Granules에 의한 퍼지 관계 기반 퍼지 추론 시스템의 최적 설계 (Optimal Design of Fuzzy Relation-based Fuzzy Inference Systems with Information Granulation)

  • 박건준;김현기;오성권
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2004년도 추계학술대회 학술발표 논문집 제14권 제2호
    • /
    • pp.467-470
    • /
    • 2004
  • 퍼지모델은 주로 경험적 방법에 의해 추출되기 때문에 보다 구체적이고 체계적인 방법에 의한 동정 및 최적화 될 필요성이 요구된다. 일반적으로, 정보 granules는 근접성, 유사성 또는 기능성 등에 인하여 서로 결합되는 요소(특히, 수치 데이터)의 실체이다. 본 논문에서는 비선형 시스템의 퍼지모델을 위해 정보 granules에 의한 퍼지 관계 기반 퍼지 추론 시스템을 최적 설계한다. 제안된 퍼지 모델은 정보 데이터의 특성을 살리기 위해 HCtl 클러스터링 방법에 의한 중심값을 이용하여 모든 입력변수가 상호 관계한 전반부/후반부 구조 및 파라미터 동정을 시행한다. 두 가지 형태의 퍼지 추론 방법은 간략 추론과 선형추론에 의해 수행되고 삼각형 멤버쉽 함수를 사용한다. 구축된 정보 granule 기반 퍼지 모델은 유전자 알고리즘을 이용하여 전반부 파라미터를 최적으로 동정한다. 그리고 학습 및 테스트 데이터의 성능 결과의 상호균형을 얻기 위한 하중값을 가진 성능지수를 사용하여 근사화와 예측성능의 향상을 꾀하며, 기존 문헌과의 성능비교를 통해 제안된 퍼지 모델을 평가한다.

  • PDF

정보 Granules에 의한 퍼지 관계 기반 퍼지 추론 시스템의 최적 설계 (Optimal Design of Fuzzy Relation-based Fuzzy Inference Systems with Information Granulation)

  • 박건준;안태천;오성권;김현기
    • 한국지능시스템학회논문지
    • /
    • 제15권1호
    • /
    • pp.81-86
    • /
    • 2005
  • 본 연구에서는 복잡하고 비선형 시스템을 모델 동정하기 위해 정보 granules에 기반한 퍼지 추론 시스템의 새로운 범주를 소개한다. 비공식적으로 말하면, 정보 granules는 근접성, 유사성 또는 기능성 등에 인하여 서로 결합되는 대상(특히, 수치 데이터)의 연결된 모임으로 간주된다. HCM 클러스터링에 의한 정보 granulation은 퍼지 규칙의 전반부 및 후반부에서 사용되는 멤버쉽 함수의 포기 정점과 다항식함수의 초기 값과 같은 퍼지 모델의 초기 파라미터를 결정하는데 도움을 준다. 그리고 포기 파라미터는 유전자 알고리즘과 최소자승법에 의해 효과적으로 동조된다. 또한, 퍼지 모델의 성능사이의 상호균형을 얻기 위하여 하중값을 가진 합성 목적함수를 사용하여 근사화와 예측성능의 향상을 꾀한다. 제안된 모델은 수치적인 예제를 가지고 평가하고, 문헌에서 나타난 기존의 퍼지 모델의 성능과 대조된다.

클러스터링 기법을 이용한 이륜차 사고의 특징 분류 (Classification of Characteristics in Two-Wheeler Accidents Using Clustering Techniques)

  • 허원진;강진호;이소현
    • 지식경영연구
    • /
    • 제25권1호
    • /
    • pp.217-233
    • /
    • 2024
  • 최근 배달문화의 확산으로 이륜차 수요가 증가하면서 이륜차 운행도 함께 증가하고 있다. 이륜차 운행은 혼잡한 교통상황이나 경제적으로 효율적이지만 이륜차 난폭 운전과 명확하게 정립되지 않은 이륜차에 대한 교통 법규로 이륜차 사고는 새로운 사회문제로 나타나고 있다. 이륜차는 차체 특성 상 치사율이 높기 때문에 이륜차 사고가 발생하면 그 심각성 및 위험이 크다. 그러므로, 이륜차 사고에 대한 특성을 분석함으로써 이륜차 사고의 특성을 제대로 파악하는 것이 필요하다. 그리하여, 본 연구에서는 이륜차 사고 데이터를 기반으로 K-prototypes 알고리즘을 이용하여 이륜차 사고의 특성을 분류하였다. 그 결과, 이륜차 사고 특성에 따라 4개의 군집으로 분류되었다. 각 군집마다 사고발생 도로, 주요 위반법규, 사고 유형, 사고 발생 시간 등에서 다른 특성을 나타내었다. 이를 기반으로 이륜차 사고 예방을 위한 구체적인 방안을 제안한다. 각 사고 특성에 따른 단속 방법 및 규율을 개정함으로써 수도권 지역의 이륜차 사고 발생을 최소화하고 궁극적으로는 도로 안전성 향상에 기여한다. 더불어, 머신러닝 기법을 도시교통 및 안전 분야에 적용함으로써 관련 문헌확장에도 기여한다.

정보검색 성능 향상을 위한 단어 중의성 해소 모형에 관한 연구 (Improving the Retrieval Effectiveness by Incorporating Word Sense Disambiguation Process)

  • 정영미;이용구
    • 정보관리학회지
    • /
    • 제22권2호
    • /
    • pp.125-145
    • /
    • 2005
  • 이 연구에서는 문헌 및 질의의 내용을 대표하는 주제어의 중의성 해소를 위해 대표적인 지도학습 모형인 나이브 베이즈 분류기와 비지도학습 모형인 EM 알고리즘을 각각 적용하여 검색 실험을 수행한 다음 주제어의 중의성 해소를 통해 검색 성능의 향상을 가져올 수 있는지를 평가하였다. 실험문헌 집단은 약 12만 건에 달하는 한국어 신문기사로 구성하였으며, 중의성 해소 대상 단어로는 한국어 동형이의어 9개를 선정하였다. 검색 실험에는 각 중의성 단어를 포함하는 18개의 질의를 사용하였다. 중의성 해소 실험 결과 나이브 베이즈 분류기는 최적의 조건에서 평균 $92\%$의 정확률을 보였으며, EM 알고리즘은 최적의 조건에서 평균 $67\%$ 수준의 클러스터링 성능을 보였다. 중의성 해소 알고리즘을 통합한 의미기반 검색에서는 나이브 베이즈 분류기 통합 검색이 약 $39.6\%$의 정확률을 보였고, EM 알고리즘 통합 검색이 약 $36\%$의 정확률을 보였다. 중의성 해소 모형을 적용하지 않은 베이스라인 검색의 정확률 $37\%$와 비교하면 나이브 베이즈 통합 검색은 약 $7.4\%$의 성능 향상률을 보인 반면 EM 알고리즘 통합 검색은 약 $3\%$의 성능 저하율을 보였다.

지적 구조의 규명을 위한 네트워크 형성 방식에 관한 연구 (A Study on the Network Generation Methods for Examining the Intellectual Structure of Knowledge Domains)

  • 이재윤
    • 한국문헌정보학회지
    • /
    • 제40권2호
    • /
    • pp.333-355
    • /
    • 2006
  • 이 연구에서는 지적 구조 분석을 위해서 계량서지적 자료를 시각적으로 표현하는 다양한 네트워크 형성 방식에 대해서 사례와 함께 각각의 특성을 살펴보았다. 기준값 절단 방식, 최근접이웃 그래프, 최소비용 신장트리, 패스파인더 네트워크의 네 가지 네트워크 형성 방식 중에서 전체 구조와 세부 구조의 표현 능력이 모두 뛰어난 패스파인더 네트워크 알고리즘이 최근 가장 활발히 응용되고 있다. 최근접이웃 그래프는 아직까지 계량서지적 분석에 응용된 사례는 없으나 간단한 알고리즘과 클러스터링 능력 등과 같은 지적 구조 규명에 도움이 될 수 있는 몇 가지 장점을 갖추고 있는 것으로 확인되었다. 다차원척도나 군집분석과 달리 네트워크를 이용한 시각화에서는 입력자료의 전처리에 따라서 생성된 지적 구조의 차이가 큰 것으로 나타났다. 이 연구에서 고찰한 여러 네트워크 형성 방식을 적절히 활용함으로써 국내의 지적 구조 규명 연구를 활성화할 수 있을 것이라 기대된다.

태그 질의 확장 기능에 기반한 비디오 검색 시스템의 효율성에 대한 실험적 연구 (An Experimental Study Investigating the Retrieval Effectiveness of a Video Retrieval System Using Tag Query Expansion)

  • 김현희
    • 한국문헌정보학회지
    • /
    • 제44권4호
    • /
    • pp.75-94
    • /
    • 2010
  • 본 연구는 폭소노미가 비디오 자료를 색인하고 브라우징 하는데 얼마나 유용한지 살펴본 후, 동등어, 동의어 및 관련어를 활용한 질의 확장을 통해서 수행되는 폭소노미 태그 통제가 비디오 검색에 얼마나 효율적인지 조사해 보았다. 이를 위해서, 태그들을 태그 간의 동등 및 연관 관계에 기초하여 클러스터링하고 이러한 정보를 질의 확장에 적용시킨 실험 시스템을 설계, 구현하고 이러한 제안된 시스템이 정보검색 과정에서 폭소노미의 효율성을 얼마나 개선시킬 수 있는지에 대해서 실험을 통해서 확인해 보았다. 실험 결과, 질의 확장을 통해서 태그 통제를 한 제안된 시스템은 태그 통제를 전혀 하지 않은 시스템과 비교하여, 재현율은 증가하였으나 정확률은 전혀 차이가 없는 것으로 나타났다. 본 연구 결과는 폭소노미를 디지털 비디오 도서관의 소셜 메타데이터로 적용하기 위한 하나의 방안이 될 것으로 생각된다.

정보공유공간의 품질 측정지표 개발에 관한 탐색적 연구 (An Exploratory Study of Developing a Measurement Tool for the Quality of Information Commons)

  • 박지홍;기선아
    • 한국문헌정보학회지
    • /
    • 제46권4호
    • /
    • pp.5-25
    • /
    • 2012
  • 본 연구는 정보공유공간의 품질 측정지표 개발을 위한 설문항목 개발을 목적으로 하였다. 정보공유공간은 도서관 이용자들이 다양한 교육, 연구, 문화 활동을 경험할 수 있는 물리적, 기술적, 지적 공간으로, 최근 도서관 이용자간의 지식 공유와 상호관계를 장려하기 위하여 인기를 얻고 있다. 또한 정보공유공간은 협업활동, 학습, 휴식을 위한 공간을 제공하는데, 이러한 장점과 유용성에도 불구하고 명확히 정보공유공간의 품질에 대한 측정도구가 없다. 여기에서는 도서관 이용자의 정보공유공간에 관한 인식과 정보공유공간에 대한 인지된 품질에 영향을 미치는 요소들을 추출하기 위하여 심층면담, 선행연구 대조 및 사전조사를 수행하였다. 선행연구와 설문 초기 아이템은 분류와 클러스터링을 통하여 데이터 내의 주요 개념이 도출되었다. 그 후 사전조사를 통하여 예비 설문문항의 타당도가 검증되었다. 연구의 의의는 도서관 서비스 품질평가에 대한 연구의 영역을 확장시키고 이용의도를 고려한 새로운 평가 체계를 제시한 점이다.