• 제목/요약/키워드: 퍼지용어

검색결과 55건 처리시간 0.041초

비음수 행렬 분해와 퍼지 관계를 이용한 문서군집 (Document Clustering using Non-negative Matrix Factorization and Fuzzy Relationship)

  • 박선;김경준
    • 한국항행학회논문지
    • /
    • 제14권2호
    • /
    • pp.239-246
    • /
    • 2010
  • 본 논문은 비음수 행렬 분해와 퍼지 관계를 이용한 새로운 문서군집 방법을 제안한다. 제안된 방법은 비음수 행렬 분해된 의미특징을 이용하여 군집 레이블과 군집의 대표 용어들을 선택함으로서 문서군집의 내부구조를 더 잘 표현할 수 있으며, 퍼지 관계 값을 이용한 군집은 문서군집에 유사하지 않은 문서를 더 잘 구분함으로써 문서군집의 성능을 높일 수 있다. 실험결과 제안방법을 적용한 문서군집방법이 다른 문서군집 방법에 비하여 좋은 성능을 보인다.

의미 특징과 퍼지를 이용한 문서군집 (Document Clustering using Semantic Features and Fuzzy)

  • 박선;김철원;안동언
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 춘계학술발표대회
    • /
    • pp.293-295
    • /
    • 2010
  • 본 논문은 문서의 의미특징과 퍼지를 이용한 새로운 문서군집 방법을 제안한다. 제안된 방법은 비음수 행렬 분해된 의미특징을 이용하여 군집 레이블과 군집의 대표 용어들을 선택함으로서 문서군집의 내부구조를 더 잘 표현할 수 있으며, 퍼지를 이용한 군집은 문서군집에 유사하지 않은 문서를 더 잘 구분함으로써 문서군집의 성능을 높일 수 있다. 실험결과 제안방법을 적용한 문서군집방법이 다른 문서군집 방법에 비하여 좋은 성능을 보인다.

퍼지관계곱을 이용한 내용기반 정크메일 분류 모델 (A Junk Mail Checking Model using Fuzzy Relational Products)

  • 박정선;김창민;김용기
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권10호
    • /
    • pp.726-735
    • /
    • 2002
  • 인터넷의 발전을 기반으로 전자메일 서비스는 기존 우편 기능을 대체하여 현재의 대표적인 정보 전달 수단으로 자리잡고 있다. 전자메일 사용자의 확산에 따라 많은 기업들은 전자메일을 통한 개인별 카탈로그 보급 식의 광고에 투자를 하게 되었는데, 이는 개인별 취향을 고려한 광고가 가능하다는 잇점을 가진다. 그러나 전자메일 사용자들은 인터넷상에 개인 전자메일 주소가 노출됨에 의해서 많은 정크메일(junk mail)을 수신하게 되었는데, 정크메일이란 기업의 광고 선전물과 같이 수신을 원하지 않는 전자메일을 의미한다. 정크메일의 증가에 따라 정크메일을 분류하는 수단이 필요하게 되었는데, 현재까지는 사용자가 입력한 송신자의 전자메일 주소 또는 도메인 주소를 등록하여 차단하거나 제목에 특정 단어를 포함한 메일을 완전히 삭제하여 버리는 기술수준에 머무르고 있다. 본 논문에서는 퍼지관계곱을 기반으로 메일의 내용에 의미적으로 접근하여 정크메일을 추출하는 정크메일 분류 모델을 제안한다. 이는 퍼지관계곱 연산을 이용하여 미리 정의한 정크용어들과 사용자에게 수신되는 전자메일 내의 용어들 간 의미적 포함관계를 분석하고 그를 통해 전자메일의 정크도(degree of junk)를 추출한다. 각 전자메일별로 추출된 정크도는 사용자가 부여하는 정크 기준치(SVJ, Standard Value of Junk)를 기준으로 정크메일과 비정크메일로 분류한다. 제안된 기법은 사용자가 특정 개수의 동일한 전자메일에 대해 느끼는 정크도를 기준으로 분류한 정크메일 수를 비교하여 그 효용성을 증명하였다.

클러스터링 기법을 이용한 개별문서의 지식구조 자동 생성에 관한 연구 (Automatic Generation of the Local Level Knowledge Structure of a Single Document Using Clustering Methods)

  • 한승희;정영미
    • 정보관리학회지
    • /
    • 제21권3호
    • /
    • pp.251-267
    • /
    • 2004
  • 이 연구에서는 전통적인 인쇄매체 환경에서 지식에 대해 지역적인 접근법을 제공하는 권말색인과 목차의 기능에 착안하여 용어 클러스터링 실험과 클러스터 대표어 선정 실험을 통해 개별문서의 지식구조 자동 생성 기법을 제안하였다. 자동 생성된 지식구조가 갖는 기능성을 평가하여 정보 검색 환경에서의 적용 가능성을 확인하였다. 용어 클러스터링 실험에서는 워드 기법의 성능이 중복 분류를 허용하는 퍼지 K-means 클러스터링 기법에 비해 높았으며, 클러스터 대표어 선정 기법으로는 단락빈도를 이용한 경우가 가장 좋은 성능을 나타냈다. 또한, 이용자 태스크를 기반으로 하여 최종적으로 생성된 지식구조의 기능성을 평가한 결과, 이 연구에서 자동 생성된 지식구조가 인쇄매체 환경에서의 권말색인과 목차가 갖는 기능을 어느 정도 수행한다는 것을 입증하였다.

유즈넷 뉴스 그룹 결정 방법을 활용한 성능평가 (Performance Analysis by utilizing a Determination Method of Usenet News Groups)

  • 김종완;김희재;김병익
    • 한국산업정보학회:학술대회논문집
    • /
    • 한국산업정보학회 2004년도 춘계학술대회 21세기 IT산업의 발전 전망
    • /
    • pp.67-72
    • /
    • 2004
  • 않은 양의 유즈넷 뉴스 중에서 사용자가 찾고자 하는 정확한 정보를 빠른 시간 안에 검색하고, 원하는 정보만 필터링 하는 것은 중요하다. 그러나 뉴스 문서는 이메일과 달라서 미리 자신에게 맞는 뉴스그룹을 등록해 주어야만 정보를 얻을 수 있다. 본 연구에서는 다양한 뉴스그룹들 중에서 사용자의 취향과 유사한 뉴스그룹들을 코호넨 신경망을 이용하여 추천해주는 방법을 제시한다. 신경망을 학습시키기 위한 뉴스 문서의 키워드들을 선택하기 위해 예제 문서들로부터 후보 용어들을 추출하고 퍼지 추론을 적용하여 대표 용어들을 선택한다. 하지만 신경망의 학습 패턴을 관찰해 보면, 많은 부분이 비어있는 희소성 문제를 발견할 수 있다. 이에 본 연구에서는 통계적인 결정계수를 도입하여 불필요한 차원을 제거한 후 신경망을 학습시키는 새로운 방법을 제안한다. 제안된 방법은 모든 차원을 활용할 때 보다 클러스터내 거리와 클러스터간 거리의 척도를 이용한 클러스터 중첩도 면에서 우수한 분류 성능을 보여줌을 확인하였다.

  • PDF

통계적 결정계수를 이용한 유즈넷 뉴스 필터링 (Usenet News Filtering by Using Statistical Coefficient of Determination)

  • 김종완;김희재;김병만
    • 한국산업정보학회:학술대회논문집
    • /
    • 한국산업정보학회 2003년도 추계공동학술대회
    • /
    • pp.747-752
    • /
    • 2003
  • 많은 양의 유즈넷 뉴스 중에서 사용자가 찾고자 하는 정확한 정보를 빠른 시간 안에 검색하고, 원하는 정보만 필터링 하는 것은 중요하다. 그러나 뉴스 문서는 이메일과 달라서 미리 자신에게 맞는 뉴스그룹을 등록해 주어야만 정보를 얻을 수 있다. 본 연구에서는 다양한 뉴스그룹들 중에서 사용자와 취향이 가장 유사한 뉴스그룹을 분류하여 뉴스 문서의 키워드들을 선택하기 위해 예제 문서들로부터 후보 용어들을 추출하고 퍼지 추론을 적용하여 대표용어들을 선택한다. 이에 본 연구에서는 통계적인 결정계수를 도입하여 불필요한 차원을 제거한 후 신경망을 학습시키는 새로운 방법을 제안한다. 제안된 방법은 모든 차원을 활용할 때 보다 클러스터간 거리와 표준편차, 클러스터간 거리의 척도 면에서 우수한 분류 성능을 보여줌을 확인하였다.

  • PDF

퍼지 함수에 의한 질의어 확장과 문서 분류 알고리즘 (An Algorithm of Documents Classification and Query Extension using Fuzzy Function)

  • 은희주;하얀;김용성
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제28권3호
    • /
    • pp.272-284
    • /
    • 2001
  • 웹 기반 검색 시스템에서사용자의 관심이 많은 문서를 선별하여 제공하기 위해 프로파일이나 시소러스에 관한 연구가 이루어지고 있다. 그러나, 프로파일이나 시소러스를 구축하고 유지보수 하는데 많은 시간과 노력이 필요하다. 특히 구축된 시소러스에 대해 구조화 및 적합성의 문제가 있다. 따라서, 이러한 문제점을 극복하고자 본 논문에서는 문서에서 추출한 용어 빈도를 문서에서 용어의 중요 정도로 사상시키기 위해 시그모이드 멤버 쉽 함수를 적용한다. 또한, 이 중요 정도에 따라 질의어를 확장하고 의미적으로 연결된 문서를 동일한 문서 집단으로 분류할 수 있는 알고리즘을 제안하여 사용자의 선호도가 반영된 문서를 선별하고 제공하고자 한다.

  • PDF

문제 은행에서 연상학습을 지원하는 퍼지 검색 시스템 (A Fuzzy Retrieval System to Facilitate Associated Learning in Problem Banks)

  • 최재훈;김지숙;조기환
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권4호
    • /
    • pp.278-288
    • /
    • 2002
  • 본 논문에서는 사용자 질의가 가지는 특정한 의미로부터 개념적으로 서로 연관된 문제들을 문제 은행에서 검색해 줌으로써 학습자의 연상학습을 지원할 수 있는 퍼지 검색 시스템을 설계하고 구현하였다. 특히, 연상학습의 특성인 검색의 일정한 정확률과 높은 재현율을 유지하기 위해 이 검색 시스템은 퍼지 시소러스를 이용하였다. 여기서, 도메인 종속적인 개념들 사이의 관계를 퍼지 정도로 표현하는 시소러스는 질의에 기술된 탐색어와 문제를 대표하는 색인어 사이의 용어 불일치 문제를 해결해 줌으로써 연상학습에 적합한 검색 성능을 나타낼 수 있게 한다. 따라서, 본 논문에서는 퍼지 시소러스를 이용한 문제검색 시스템의 연상학습에 대한 적합성을 검색의 정확률과 재현율을 통해 평가하였다.

Expert Systems as a Search Intermediary

  • 문성빈
    • 정보관리연구
    • /
    • 제24권4호
    • /
    • pp.43-57
    • /
    • 1993
  • 본 논문은 인공지능(artificial intelligence) 및 전문가 시스템(expert system)의 기본 개념과 이에 적용되고 있는 특정한 기술인 퍼지 이론(fuzzy logic)을 논하고 있으며, 지난 몇 년 동안 탐색 중개인으로서의 전문가 시스템을 조사해 보았다. 이러한 전문가 시스템은 1) 특정한 데이터베이스에 관련된 질문서 작성을 도와주며, 2) 탐색용어나 데이터베이스 선정에 관한 결정을 보조하고, 3) 탐색중에 있는 이용자에게 조언(助言)을 해주고 있다. 또한 전문가 시스템을 개발하는 에 있어 어려움 및 제한점(制限點)을 논의하고 있다.

  • PDF

멀티미디어시대의 가전기술

  • 최한종
    • 전기의세계
    • /
    • 제46권7호
    • /
    • pp.82-83
    • /
    • 1997
  • 멀티미디어의 물결이 가전 분야에도 퍼지고 있다. 기존 아날로그 기술들이 디지탈화되고, 새로운 디지탈 기술들이 접목되면서, 서서히 가전과 컴퓨터의 경계선이 허물어지고 있는 것이다. AVCC(Audio & Video, Computer & Communication의 합성어)라는 말은 이제 흔하게 듣는 용어가 되었다. TV등의 AV 제품과 컴퓨터, 전화 등의 정보통신기기가 결합된 정보가전(Information Appliances) 시대가 개막된 것이다. 이러한 멀티미디어 가전제품이 21세기를 주도할 것으로 예상되면서 세계 전자업체들이 사활을 걸고 치열한 개발 및 시장 주도 경쟁을 벌이고 있는 상황이다. 기존의 가전업체 뿐만이 아니라 새로운 시장을 찾고 있는 PC 및 통신 업계에서도 가전시장의 진입을 강력히 추진하고 있다.

  • PDF