• Title/Summary/Keyword: 사용자 분류

검색결과 2,292건 처리시간 0.031초

WordNet과 HTML 태그를 활용한 특정영역 정보의 웹 문서 분류 (Web Document Clustering for Specific Subject Information Using WordNet and HTML Tags)

  • 조은휘;변영태
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2002년도 춘계학술대회
    • /
    • pp.28-32
    • /
    • 2002
  • 웹 상의 많은 정보들 속에서 사용자가 원하는 정보를 찾아내는 일은 쉽지 않다. 사용자가 의도하는 양질의 정보 제공을 위해 특정 영역과 관련한 정보 제공 시스템이 .개발되고 있다. 이전 시스템은 특정 영역 관련 지식베이스를 토대로 하여 웹 문서를 수집해 놓고, 사용자에게 정보를 제공한다. 본 논문에서는 전문 사이트 내에 문서간의 유사성을 토대로 하여 동물 영역에 대한 효과적인 문서 클러스타링(clustering)에 관해 실험하였다. 기존의 방법에서는 문서의 분류나 질의어와 관련한 문서 선택이나 순위 결정이 주로 텀(term)을 바탕으로 하고 있다. 본 논문에서는 각 문서 내의 텀 뿐만 아니라 HTML 태그(tag), 지식베이스에 WordNet의 계층구조를 적용한 data를 활용하고, SVD(Singular Value Decomposition)를 사용하여 문서간의 관계를 밝혀내어 문서 분류 및 수집에 이용하였다. 특정 영역의 전문 문서를 많이 제공하는 사이트에 적용하여 좋은 결과를 볼 수 있었다.

  • PDF

데이터 전처리를 통한 사용자 제스처 인식률 증가 방안 (A study on the increase of user gesture recognition rate using data preprocessing)

  • 김준헌;송병후;신동렬
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2017년도 제56차 하계학술대회논문집 25권2호
    • /
    • pp.13-16
    • /
    • 2017
  • 제스처 인식은 HCI(Human-Computer Interaction) 및 HRI(Human-Robot Interaction) 분야에서 활발히 연구되고 있는 기술이며, 제스처 데이터의 특징을 추출해내고 그에 따른 분류를 통하여 사용자의 제스처를 정확히 판별하는 것이 중요한 과제로 자리 잡았다. 본 논문에서는 EMG(Electromyography) 센서로 측정한 사용자의 손 제스처 데이터를 분석하는 방안에 대하여 서술한다. 수집된 데이터의 노이즈를 제거하고 데이터의 특징을 극대화시키기 위하여 연속적인 데이터로 변환하는 전처리 과정을 거쳐 이를 머신 러닝 알고리즘을 사용하여 분류하였다. 이 때, 기존의 raw 데이터와 전처리 과정을 거친 데이터의 성능을 decision-tree 알고리즘을 통하여 비교하였다.

  • PDF

객체 추출 및 객체별 그룹핑을 이용한 영상검색 결과의 단계적 서비스 방안 (A Scheme for Progressive Service of Retrieved Images based on Object Extraction and Grouping)

  • 박창민;김성영;김민환
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2002년도 춘계학술발표논문집(상)
    • /
    • pp.180-185
    • /
    • 2002
  • 본 논문에서는 키워드를 입력해 검색된 영상들을 유사한 특징을 갖는 소수의 그룹으로 그룹핑하고 각 그룹을 대표하는 대표영상을 추출하여 우선적으로 사용자에게 보여주고 필요에 따라 나머지 영상들을 단계적으로 서비스할 수 있는 방안을 제시한다. 영상 그룹핑을 위한 각 영상의 특징은 영상에 포함된 중심 객체를 사용하여 추출한다. 이를 위해 검색 키워드는 객체와 연관성이 있는 단어로 제한하여 영상을 검색하며 검색된 영상으로부터 중심 객체를 추출할 수 있는 객체 추출 방법을 활용하였다. 각 영상으로부터 추출된 중심 객체에 대한 특징 벡터는 칼라 분포를 이용한다. 영상 그룹핑은 칼라분포로 표현되는 특징공간에서의 밀집도를 조사하여 높은 밀도로 모여있는 영역별로 추출하여 동일한 그룹으로 분류하였다. 대표 영상은 분류된 그룹에서 가장 밀집도가 높은 영상으로 선택된다. 한편, 얼굴이 포함된 영상은 사전에 따로 분류하고 얼굴 크기 및 얼굴 수에 따라 영상을 그룹핑하여 각 그룹에 대한 대표 영상을 선정한다. 본 연구에서 제안한 방법은 사용자에게 모든 검색 결과를 일괄적으로 보여주는 것에 비해 보다 빠른 시간 내에 사용자가 원하는 영상을 편리하면서도 효과적으로 확인할 수 있는 방법을 제공해 줄 수 있을 것으로 기대한다.

  • PDF

USN 환경에서 Agent 기술을 이용한 Sensor Data 분류에 관한 연구 (A Study on Sensor Data Classification Using Agent Technology In USN Environment)

  • 조성진;정환묵
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2006년도 추계학술대회 학술발표 논문집 제16권 제2호
    • /
    • pp.69-72
    • /
    • 2006
  • 급격한 정보화 산업의 발달로 인하여 혁신적인 기술 진화와 함께 이에 기반한 새로운 환경적, 기술적 패러다임이 변화되고 있다. 공간 간 융합과 조화를 극대화 시키고 공간속에서의 충돌과 문제점을 최소화시키기 위한 유비쿼터스 공간의 출현이다. USN에서 많은 수의 작고 다양하고 이질적인 센서 데이터 들이 발생하고 있다. 센서 데이터베이스 시스템에서 수많은 데이터들을 융합하기 위하여 에이전트 기술을 이용하고, 방대하고 애매모호한 데이터를 퍼지이론을 적용하여 데이터를 분류하여 적절한 장소에서 사용자의 욕구에 알맞은 정보를 제공함으로써 효율성과 융통성을 지원하는 방법을 제안한다. 본 논문에서는 이러한 애매모호한 데이터를 적절하게 분류함으로써 시간과 비용을 절약하고 빠른 응답을 사용자에게 전달할 수 있으며 유효적절한 서비스를 사용자의 기호에 맞게 제공함으로써 공간과 사물에 주어진 센서 데이터를 효율적으로 관리 할 수 있는 방법을 제안한다.

  • PDF

사용자 응답의 적절성 분류를 위한 대화 시스템 구성 (Configuring a dialogue system for classifying the appropriateness of user responses)

  • 정찬영;이근배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.644-649
    • /
    • 2022
  • 대화 시스템은 훈련 중 보지 못한 데이터를 입력받았을 경우 오작동의 가능성이 높으며, 특히 상용화 시에는 작은 오작동이라도 치명적인 결과를 낳을 수 있다. 따라서 시스템의 안정성을 확보하기 위해 우리는 대화 시스템에 사용자 입력의 적절성을 분류하는 기능을 탑재하였다. 해당 기능을 훈련시키기 위해서 우리는 슬롯-밸류쌍에서 슬롯을 교체하는 방법과 밸류를 교체하는 방법을 나누어 제시하였다. 슬롯을 무작위로 교체할 경우 발생하는 노이즈를 완화시키기 위해 새로운 추출 방법을 제시하였으며, 밸류를 교체할 때도 이 때 훈련시킨 모델을 이용하여 위음성의 가능성을 최소화하였다. 또한 전후방 철자 교정 모듈을 도입하여 사용자의 실수로 인한 모델의 오작동도 방지하고자 하였다. 우리는 다른 방법론과의 비교 실험과 절제 실험을 통해 각각의 방법론의 효용성을 입증하였다.

  • PDF

트래픽 관찰을 통한 인터넷 서비스 소비성향의 식별 (Identification of User Behaviors Consuming Internet Services by Traffic Observation)

  • 이택;인호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 추계학술발표대회
    • /
    • pp.449-450
    • /
    • 2009
  • 사용자의 인터넷 소비성향을 파악하고 그에 적응적인 인프라 리소스를 제공하는 일은 네트워크 설계/관리자나 인터넷 서비스 공급자(ISP)들에게는 주요 관심사이다. 이러한 분석은 한정된 네트워크 자원을 보다 적절한 지점에 효율적인 방식으로 투자하도록 도와준다. 본 논문은 각종 인터넷 서비스를 활용하는 사용자들의 서비스(각종 인터넷 어플리케이션) 소비성향을 네트워크 트래픽 관찰만으로 파악할 수 있는 성향분류 척도를 제안한다. 아울러 베이지안 분류기를 사용하여 제안 척도를 활용한 사용자 성향 분류 방법을 함께 제시한다.

모션헤드셋의 동작분류기를 위한 사용자 머리동작 분석 (Analysis of User Head Motion for Motion Classifier of Motion Headset)

  • 신춘성;이영호
    • 사물인터넷융복합논문지
    • /
    • 제2권2호
    • /
    • pp.1-6
    • /
    • 2016
  • 최근 다양한 형태의 착용형 컴퓨터가 연구되고 있다. 본 논문에서는 사용자가 음악을 들으며 사용할 수 있는 모션헤드셋의 동작분류기 제작을 위해 머리 움직임 정보의 특징을 분석한다. 모션헤드셋 프로토타입은 스마트폰과 블루투스 통신 방법을 이용하여 음악을 수신받으며, 가속도센서가 측정한 동작정보를 스마트폰으로 전송한다. 그리고 스마트폰에서는 모션 분류기를 통해 머리의 움직임을 분류한다. 실험을 위해 프로토타입을 제작하였다. 사용자 머리의 '위', '아래', '왼쪽', 그리고 '오른쪽' 머리 움직임을 베이지안 분류기를 이용하여 분류하였다. 그 결과 '위'와 '아래'의 머리 움직임의 경우 x, z축의 가속도 센서값이 큰 변화가 있었다. 추후에 사용성 평가를 통해 동작 분류기를 제작할 수 있는 적합한 변수를 찾아 낼 계획이다.

온라인 토론의 댓글 응답 구조를 이용한 사용자 특성 분석 (User Characterization from Replying Comment Structures in Online Discussion)

  • 김성환;탁해성;조환규
    • 한국콘텐츠학회논문지
    • /
    • 제18권11호
    • /
    • pp.135-145
    • /
    • 2018
  • 온라인 커뮤니티에서는 사용자들이 댓글을 이용하여 다양한 주제에 대한 의견과 감정을 교환한다. 댓글을 통한 의사소통은 신속하고 편리하지만 때로는 이러한 무게감이 덜한 특성이 사용자로 하여금 무례하고 공격적인 언사를 쉽게 행하도록 만들어 분쟁을 쉽게 유발하기도 한다. 따라서 이러한 분쟁을 미리 예측하고 대응하기 위하여 사용자들의 특성을 미리 파악하고 분류하는 작업이 중요하다. 본 논문에서는 이러한 사용자의 특성이 해당 사용자들이 참여한 발제글을 나타내는 댓글트리의 구조적인 특징에 나타난다는 가정을 바탕으로 댓글트리 구조를 서술하기 위한 여러 가지 정량적인 지표를 제안한다. 제안하는 정량 지표들의 분포를 통하여 발제글 작성자 및 댓글 작성자에 따른 지표의 분포를 살펴보고, 추가적으로 관리자에 의하여 경고를 받은 사용자들을 분류하는 실험을 통하여 제안하는 구조적 지표의 효과성을 보인다.

비음수 행렬 분해와 동적 분류 체계를 사용한 자동 이메일 다원 분류 (Automatic Email Multi-category Classification Using Dynamic Category Hierarchy and Non-negative Matrix Factorization)

  • 박선;안동언
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권5호
    • /
    • pp.378-385
    • /
    • 2010
  • 이메일 사용의 증가로 수신 메일을 효율적이면서 정확하게 분류할 필요성이 점차 늘고 있다. 현재의 이메일 분류는 SVM, 베이지안 분류자, 규칙 기반 분류자 등을 이용하여 스팸 메일을 필터링하기 위한 이원 분류가 주를 이루고 있다. 그러나 이러한 지도 학습 방법들은 적합한 이메일을 인식하기 위하여서 사용자가 규칙이나 색인어 목록을 작성해야 한다. 비지도 학습 방법으로 군집을 이용한 다원 분류 방법은 메일의 분류 주제를 설정해주어야 한다. 본 논문에서는 비음수 행렬 분해(NMF, Non-negative Matrix Factorization)를 기반으로 한 자동 분류 주제 생성 방법과, 동적 분류 체계(DCH, Dynamic Category Hierarchy) 방법을 이용한 분류 주제 내에 이메일을 재구성하는 방법을 결합한 새로운 이메일 다원 분류 방법을 제안한다. 이 방법은 수신되는 이메일을 자동으로 다원 분류하여 대량의 메일을 효율적으로 관리할 수 있으며, 사용자가 분류 결과를 만족하지 못하면 분류 주제 내의 이메일을 동적으로 재구성하여 분류의 정확률을 높인다.

데이터 마이닝 기술을 적용한 사용자 선호 스팸 대응 온톨로지 구축 (Constructing User Preferred Anti-Spam Ontology using Data Mining Technique)

  • 김종완;김희재;강신재
    • 한국지능시스템학회논문지
    • /
    • 제17권2호
    • /
    • pp.160-166
    • /
    • 2007
  • 사용자마다 임의의 메일에 대한 반응은 자신의 취향에 따라 다를 수 있다. 본 논문에서는 사용자 선호 온톨로지를 구축함으로서 스팸 메일을 줄이고자 한다. 사용자의 행동양식을 기술하는 온톨로지를 정의하기 위하여, 사용자들의 선호도 정보와 그들의 이메일에 대한 반응을 연구하기 위한 연관성 분류 마이닝 방법을 적용했다. 생성된 분류 규칙은 정형화된 온톨로지 언어로 표현된다. 사용자 선호 온톨로지는 어떤 메일이 느팸 또는 비스팸 인지를 의미있는 양식으로 설명할 수 있다. 또한 사용자들의 온톨로지에 대한 이해력 향상을 위해 논리합성에 기반한 새로운 규칙 최적화 절차를 제안하여 불필요한 규칙들을 제거한다.