• 제목/요약/키워드: 의미 데이터 선별

검색결과 52건 처리시간 0.027초

Web 로그분석과 e-CRM

  • 이성백
    • 한국전자거래학회:학술대회논문집
    • /
    • 한국전자거래학회 2001년도 e-Biz World Conference
    • /
    • pp.129-147
    • /
    • 2001
  • eCRM은 온라인 상에서 수집한 고객 데이터를 저장 및 분석하여 가치 있는 고객을 선별하고 회사의 역량을 가치 있는 고객을 획득, 유지하는 일에 투자하는 프로세스를 말합니다. 기존의 CRM과 목적은 같으나 채널이 오프라인에서 온라인으로 진화하였다는 점이 다릅니다. 채널이 온라인으로 진화하였다는 점이 의미하는 바는 무엇일까요?(중략)

  • PDF

이메일에 포함된 감성정보 관련 메타데이터 추출에 관한 연구 (Recognizing Emotional Content of Emails as a byproduct of Natural Language Processing-based Metadata Extraction)

  • 백우진
    • 정보관리학회지
    • /
    • 제23권2호
    • /
    • pp.167-183
    • /
    • 2006
  • 본 연구는 이메일에 나타난 감성정보 메타데이터 추출에 있어 자연언어처리에 기반한 방식을 적용하였다. 투자분석가와 고객 사이에 주고받은 이메일을 통하여 개인화 정보를 추출하였다. 개인화란 이용자에게 개인적으로 의미 있는 방식으로 콘텐츠를 제공함으로써 온라인 상에서 관계를 생성하고, 성장시키고, 지속시키는 것을 의미한다. 전자상거래나 온라인 상의 비즈니스 경우, 본 연구는 대량의 정보에서 개인에게 의미 있는 정보를 선별하여 개인화 서비스에 활용할 수 있도록, 이메일이나 토론게시판 게시물, 채팅기록 등의 텍스트를 자연언어처리 기법에 의하여 자동적으로 메타데이터를 추출할 수 있는 시스템을 구현하였다. 구현된 시스템은 온라인 비즈니스와 같이 커뮤니케이션이 중요하고, 상호 교환되는 메시지의 의도나 상대방의 감정을 파악하는 것이 중요한 경우에 그러한 감성정보 관련 메타데이터를 자동으로 추출하는 시도를 했다는 점에서 연구의 가치를 찾을 수 있다.

시맨틱 웹 개념을 도입한 지능형 무선 PICS 환경 구현 방안

  • 이원복;정인정
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2005년도 공동추계학술대회
    • /
    • pp.309-314
    • /
    • 2005
  • $PICS^{1}$는 터넷 내용물을 선별적으로 볼 수 있게 해주는 기반구조로서, 선별 소프트웨어와 등급 서비스들 간에 효과적으로 동작할 수 있게 도와주는 기술규격이다. 또한 시맨틱 $PICS^{1}$은 팀 버너스 리가 창안한 차세대 웹 기술로서 온롤로지를 기반으로 웹 데이터를 기계가 인식하고 자원의 공유와 재사용이 가능하다는 장점을 가진다. 본 논문에서는 시맨틱 웹 개념을 도입한 지능형 무선 PICS 환경을 구현함으로서 개선된 무선 웹 서비스 환경을 제안한다. 그리고 사전 연구를 통해 구현된 무선 PICS 환경을 초석으로 온톨로지 기술언어인 RDF를 사용하여 지능형 PICS 환경을 구현한다. 끝으로 일반 웹에 시맨틱 웹 개념을 도입할 때 유념해야 할 스키마의 처리를 고려하고 PICS 환경에서 중심이 되는 PICS 레이블, PICS 규칙을 RDF 로 기술하여 데이터의 의미를 명확하게 하고 관리 능력을 향상시킨다.

  • PDF

데이터 마이닝을 이용한 신인성검사 판정 연구 - 복무적합도검사를 중심으로 - (A Study on Assessment of Personality Test using Data Mining)

  • 박영길;인호;김능회;이정빈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 추계학술발표대회
    • /
    • pp.1373-1376
    • /
    • 2012
  • 복무적합도 검사는 정신질환이나 사고가능성이 있는 병사를 감별하고, 입대 후 적응문제로 조기 전역할 수 있는 집단을 예측하는 신인성검사 중 하나로, 현재 군에서 징병 및 입영단계에 실시하는 인성검사이다. 이는 전체 검사대상자를 상대로 정신과적 문제 식별을 위한 개별면담이 불가능하기 때문에 위 검사를 통해 대상자를 효율적으로 선별하기 위함이다. 본 연구는 데이터 마이닝을 통해 복무적합도 검사의 판정을 예측 할 수 있을지 확인하고자 하였다. 이를 위해 데이터 마이닝의 기법 중 회귀분석의 로지스틱 회귀분석 기법이 복무적합도검사 판정에 우수한 성능을 보임을 확인하였고, 로지스틱 회귀분석의 추정된 회귀계수를 이용하여 만든 반응확률에 대한 예측 모형식은 높은 정분류율을 보였고 평가 결과 통계적으로 의미가 있음을 증명하였다. 따라서 본 연구 결과를 활용하면 소수의 문항으로 복무적합도 검사 이전의 선별용 검사 개발이나 자가 진단용 검사 개발로 활용이 가능 할 것으로 기대한다.

인간 지식을 이용한 경험적 의사결정트리의 설계 (Design of Heuristic Decision Tree (HDT) Using Human Knowledge)

  • 윤태복;이지형
    • 한국지능시스템학회논문지
    • /
    • 제19권4호
    • /
    • pp.525-531
    • /
    • 2009
  • 데이터 마이닝(Data Mining)은 수집된 데이터로 부터 감춰진 패턴을 찾는 작업이다. 여기에서 수집된 데이터는 예측 및 추천을 위한 기반 정보로 중요한 역할을 하며, 분석 결과의 성능을 향상시키기 위해 잘못된(Missing value) 데이터를 선별하는 과정을 필요로 한다. 수집한 데이터에서 의도하지 못한 데이터를 선별하기 위한 기존의 방법은 주로 통계적이거나 단순 거리(Distance)에 기반을 둔 방법을 이용하였다. 하지만 환경 및 데이터의 특성을 고려하지 못하여, 의미 있는 데이터도 함께 분석에서 제외 될 수 있는 문제점을 가지고 있다. 본 논문은 인간의 경험적 지식을 수집된 데이터와 비교하여 가중치로 변환하고, 의사결정트리(Decision Tree)의 생성에 이용한다. 생성된 트리는 인간의 지식이 반영되어 기존의 분석 방법보다 신뢰성이 높다고 할 수 있으며, 실험을 통하여 제안하는 방법의 유효성을 확인하였다.

원격 모니터링을 위한 FFT서버 시스템 (FFT server system for Remote Monitoring System)

  • 송근영;박세현;이정환
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2003년도 추계종합학술대회
    • /
    • pp.192-195
    • /
    • 2003
  • 본 논문에서는 FFT(Fast Fourier Transform)를 수행하며 이를 원격지에 전송할 수 있는 원격 모니터링 시스템을 위한 FFT서버 시스템 구축에 대하여 기술하고자 한다. 실시간으로 얻어지는 데이터를 동시에 FFT분석을 하여 이를 원격지에 전송할 수 있다. 그리고 방대한 양의 데이터의 처리와 전송과정에서 발생하는 시간적, 자원적 손실을 줄일 수 있도록 데이터를 선별하여 분석한다. 제안된 시스템은 실시간 계측 데이터에서 의미있는 데이터를 추출하고, FFT를 통해 1차 처리 후 네트워크를 통해 이를 목적지에 전달한다. 이로 인해 네트워크 자원의 보다 효율적인 사용과 감시 대상의 다양한 각도에서의 분석에 도움이 될 것으로 기대한다.

  • PDF

스키마간 연관성을 이용한 테이블 군집화 기법 (Table Clustering Using Inter-schema Association)

  • 조순이;이도헌
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.85-87
    • /
    • 2001
  • 업무 데이터 분석을 통한 종합적인 의사결정을 지원할 수 있도록 데이터웨어하우스, OLAP, 데이터마이닝을 적용하려는 기업의 요구가 많아졌다. 그래서 기초 데이터의 이해, 선별, 수집, 가공, 정제가 매우 중요한 과정이나 테이블명 및 속성명이 표준화되어있지 않고 코드나 시스템 카탈로그와 같은 기본 데이터는 부정확하고 부족하다. 본 논문에서는 거의 스키마 정보에만 의존하여 테이블의 의미적 연관성에 근거한 유사한 특성을 가진 집단끼리 분류하는 대략적인 군집분석 방법을 제안한다. 질의 수행시 사용자가 설정한 임계 거리에 ㄸ라 관련된 군집만 검색함으로써 신속한 응답시간을 보장하고, 분석시점에서 다양한 질의에 유연하게 대처할 수 있다는 장점이 있다. 또한 실제 데이터에 본 연구를 적용하여 산출한 군집결과와 사람이 매뉴얼하게 그룹핑한 군집결과와 비교한다.

  • PDF

통합 상관된 특징 집합을 이용한 림프종 데이터의 분류 (Classification of Lymphoma Dataset with Combinatorially Correlated Feature Set)

  • 박찬호;조성배
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 춘계학술발표논문집 (상)
    • /
    • pp.321-324
    • /
    • 2003
  • 근래, DNA microarray와 관련된 기술의 발달은 한번에 수천 개 이상의 유전자발현데이터를 얻을 수 있게 해주었고, 많은 연구기관에서 이를 이용한 질병 분류에 관하여 연구를 진행하고 있다. 하지만 수천 개의 유전자 모두가 암에 관계된 것은 아니기 때문에, 관련 유전자의 선별 작업을 먼저 수행하는 것이 필요하며, 이를 위하여 통계기반 방법, 정보이론기반 방법 등 다양한 방법이 사용되고 있다. 본 논문에서는 의미 있는 유전자를 선택하는 방법으로서, 일반적인 순위-기반 방법이 양의 상관관계만 이용한다는 점을 보완하여, 유전자와 학습데이터 사이의 음의 상관관계까지도 고려한 방법을 제시하였다. 제안한 방법의 성능을 검증하고자 잘 알려진 암 관련 유전자발현데이터이인 림프종 데이터에 대하여, MLP와 KNN을 이용한 분류를 해 보았다. 실험 걸과 총합 상관관계를 가지는 특징 집합이 일반적인 순위-기반 방식의 특징 집합에 비하여 높은 분류 인식률을 보여주었다.

  • PDF

JATS와 출판용 XML DTD를 이용한 학술지와 논문 메타데이터 요소 개발에 관한 연구 (A Study on Metadata Elements for Journal and Articles Using JATS and Publishing XML DTD)

  • 이용구
    • 한국도서관정보학회지
    • /
    • 제46권2호
    • /
    • pp.367-392
    • /
    • 2015
  • 학술지와 학술지에 실린 논문의 메타데이터는 학술정보를 검색하는데 있어 매우 중요한 수단이 된다. 이 연구에서는 도서관계의 주요 목록 규칙, 논문 관련 미국 표준인 JATS, 해외의 유명 출판사의 출판용 XML DTD를 분석하여 학술지와 논문이 가지는 메타데이터의 기술요소를 파악하고자 하였다. 이들을 비교분석한 결과, 총 50개의 메타데이터 요소를 추출하였다. 학술지 관련 요소는 10개, 권/호는 7개, 논문은 22개, 그리고 저자 관련해서는 11개이다. 메타데이터의 선별적인 선택이 가능하도록 7개의 필수요소, 9개의 해당시 필수요소, 34개의 재량요소로 구분하여 제시하였다. 이 연구는 실제 사용되는 XML DTD를 이용하여 메타데이터 요소를 선별하였다는데 의미가 있다.

효과적인 의사결정을 위한 다중레이블 기반 속성선택 방법에 관한 연구: 감성 분석을 중심으로 (Exploring the Performance of Multi-Label Feature Selection for Effective Decision-Making: Focusing on Sentiment Analysis)

  • 원종윤;이건창
    • 경영정보학연구
    • /
    • 제25권1호
    • /
    • pp.47-73
    • /
    • 2023
  • 본 연구는 인공지능 기법 중 다중레이블 속성선택 방법을 적용하여 복잡한 경영환경에서 의사결정의 효과성을 증대시키는 방안을 설명한다. 인공지능 기반의 의사결정 시스템은 의사결정자의 선택과 판단을 돕거나, 대신하는 중요한 역할을 한다. 더욱이 최근 인공지능을 중심으로 한 비즈니스 의사결정은 기업의 성장 동력으로 평가받는데, 이를 위해서는 효과적인 의사결정 방법이 수반되어야 한다. 이에 본 연구는 의미 있는 속성값을 선별하는 CFS-BR(이진연관성 접근 기반의 상관관계 속성선택 모델)을 제안하여, 효과적인 의사결정을 지원하는 것을 돕는다. 예시데이터와 실증데이터의 분석 결과, CFS-BR은 유의미한 속성을 최상우선선별 알고리즘 기반으로 최상의 조합을 선별하므로 효율적 의사결정을 지원할 수 있고, 기존의 다중 레이블 속성선택 방법과 비교하였을 때 정확도가 높은 것으로 보아 효과적인 의사결정을 증대시키는 데 유용하다.