• 제목/요약/키워드: 패턴정보

검색결과 6,519건 처리시간 0.044초

시계열 데이터로부터 경향성을 이용한 순차패턴의 탐색 (Rule discovery for sequential patterns of trend from Time-Series)

  • 오용생;남도원;장지숙;이동하;이전영
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2000년도 추계정기학술대회:지능형기술과 CRM
    • /
    • pp.325-332
    • /
    • 2000
  • 데이터마이닝 분야에서 시계얼 데이터(time-series data)내에서 숨어 있는 순차패턴의 발견은 상품(Items)이나 어떤 사건(Event)과 같이 데이터의 특징이 명확한 대상에 대한 연구는 많이 되어왔으나 수치 값을 가지는 시계열 데이터에서 이들 내부에 숨어 있는 패턴을 발견하는 것은 최근에 관심을 가지게 되었다. 우리는 시계열 데이터를 시간적 변화에 따라 값의 변화 경향(Trend)이 같은 데이터 그룹을 패턴 요소인 벡터 (Vestor)로 표현하여 이들을 이용해서 흥미로운 패턴들을 발견한다. 이와 같은 벡터적인 표현으로 우리는 벡터들 간의 포함관계를 적용해 모든 가능한 형태의 패턴 발견을 목적으로 한다. 또한 경향성을 가진 패턴 요소를 사건(Event)과 같이 취급함으로써 다양한 종류의 시계열 데이터가 동시에 발생될 때 이들 상호간에 연관된 시간적 패턴을 찾을 수 있다. 따라서 이 연구에서 제안하는 경향성을 기초로 한 순차패턴의 탐식은 기업내부의 판매실적의 변화 패턴이나, 고객의 구매 행동분석에 적용이 가능하리라 여겨진다

  • PDF

장거리 의존 문제를 해결하기 위한 표층 텍스트 패턴의 확장 (Expansion of Surface Text Patterns for Long-Distance Dependency)

  • 이미연;차정원;박승수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2004년도 제16회 한글.언어.인지 한술대회
    • /
    • pp.138-144
    • /
    • 2004
  • 본 논문에서는 질의 응답 시스템에서 정답 추출을 위해 사용되는 표층 텍스트 패턴을 장거리 의존 문제에도 적용 가능하도록 확장하는 방법을 제안한다. 기존의 패턴 추출 시스템들의 패턴을 구성하고 있는 단어들간의 연속성과 불연속성에 대한 정보를 나타내도록 패턴 형태를 확장함으로써 장거리 의존 문제를 해결한다. 본 논문에서 제안한 형태의 패턴을 TREC-10의 질의를 이용해서 웹 데이터로 실험하여 정확도와 TREC의 평가 기준인 MRR을 사용해서 기존 시스템들과 성능을 비교했다.

  • PDF

퀀터티가 있는 순차 패턴을 찾는 효율적인 알고리즘 (An Efficient Algorithm for Mining Sequential Patterns with Quantities)

  • 임종화;심규석;김철연
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (A)
    • /
    • pp.569-571
    • /
    • 2003
  • 순차 패턴을 찾는 것은 데이타 마이닝 응용분야에서 중요한 문제이다. 기존의 순차 패턴 마이닝 알고리즘들은 아이템으로만 이루어진 순차 패턴만을 찾아 주었다. 하지만 아이템과 관련된 퀀터티 정보가 더욱 유용한 정보를 제공해 주는 경우가 많이 있다. 본 논문에서는 퀀터티가 있는 순차 패턴을 찾는 알고리즘을 소개한다. 기존 알고리즘을 초보적으로 확장한 알고리즘은 탐색 공간을 모두 다 검색하여 결과를 얻는 방법을 사용하기 때문에 결과적으로 나쁜 성능을 나타내었다. 이러한 단점을 없애기 위해 여과 과정과 샘플링 기반 알고리즘을 사용하여 검색해야 하는 후보 패턴의 수를 줄여줌으로써 알고리즘의 성능을 개선하였다. 실험 결과는 새로운 방법들이 초보적인 확장을 한 기존 알고리즘보다 훨씬 더 좋은 성능을 나타냄을 보여주었다.

  • PDF

사용자 타이핑 패턴 인식 기법 (User typing pattern recognizing technology)

  • 유경탁;최재현
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2014년도 추계학술대회
    • /
    • pp.141-142
    • /
    • 2014
  • 최근 개인정보 유출 사건으로 이를 이용한 2차적 피해에 대한 우려가 높아지고 있다. 아이디와 패스워드 같은 정보가 유출되더라도 추가적인 피해를 막기 위한 대책이 필요하다. 본 논문은 똑같은 단어를 타이핑 하더라도 사용자 마다 다른 패턴을 분석, 추출하여 로그인 시스템에 적용하는 기법을 제시한다. 즉 타인이 본인의 패스워드를 알아내 입력하더라도 다른 타이핑 패턴으로 인해 접근을 막는 시스템이다. 이를 위해 개인의 타이핑 패턴을 추출하는 알고리즘을 개발하고 이것을 바탕으로 적정 수준의 일치성을 가지는 패턴을 찾아내는데 이용할 수 있다.

  • PDF

시멘틱 기반 행위 패턴 유사도 측정 기법 (Semantic based Activity Pattern Similarity Measure)

  • 김건희;박기성;이영구
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 추계학술발표대회
    • /
    • pp.1196-1198
    • /
    • 2013
  • 행위 패턴은 사람의 행위들이 수행되는 양식으로 성향, 습관, 건강상태 등에 따라 다르게 나타나는 생활양식이다. 헬스케어, 마케팅, 정책 결정 등과 같은 다양한 분야에서 사람의 행위패턴을 활용하고 있다. 행위 패턴을 분석하기 위한 방법으로 행위 패턴들을 비교하는 연구가 진행되고 있다. 기존의 행위 패턴 비교 기법은 구조적 정보만을 반영하여 정확도가 저하되는 문제점이 발생한다. 본 논문에서는 두 행위 그래프를 효과적으로 유사도를 정확하게 비교하기 위하여 구조적 정보와 행위 간의 의미적 유사성을 동시에 반영한다. 실험을 통하여 기존의 기법보다 약 4% 정확도가 향상됨을 보인다.

자동 생성한 구문패턴과 의미망을 이용한 복합명사 생성 (Generation of Compound Nouns Using Automatic Constructed Syntactic Patterns and Semantic Network)

  • 임지희;최호섭;옥철영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 춘계학술발표대회
    • /
    • pp.655-658
    • /
    • 2004
  • 본 논문은 구문패턴과 의미망을 이용하여 복합명사를 생성하는 방법을 제안하고, 제안된 방법으로 설계 구현된 시스템, 복합명사 생성기(Compound Nouns Generator : CNG)를 제시한다. 복합명사에 관한 연구는 형태적, 구문적, 의미적인 관점에서의 분석과 생성에 이르기까지 폭넓게 진행되고 있다. 본 논문에서는, 사전에 등재된 표제어만을 복합명사로 인정하고, 나머지는 1차적으로 명사 연결구로 파악한다. 그리고 이것을 다시 신형 복합명사와 명사 연결구로 파악함으로써, 복합명사에 대한 명확한 기준을 제시하여 자연언어처리, 정보검색 등에서 효율성을 높이고자 하였다. 본 논문에서 제안한 시스템은 복합명사 확장을 위해 구문패턴을 자동 생성함으로써 시스템의 융통성을 향상시키고, 구문패턴과 의미망을 통해 생성된 복합명사와 명사 연결구의 말뭉치상의 빈도정보를 이용함으로써 고빈도의 명사 연결구가 복합명사로서 굳어질 수 있는 가능성을 보여주기도 한다. 또한, 구문패턴과 의미망을 통해 생성된 명사 연결구를 비교하여 생성된 신형 복합명사는 구문패턴에 의해 뜻풀이가 자동으로 생성된다.

  • PDF

상황이론을 이용한 정보흐름에 대한 패턴인식을 위한 ontology 모델링 (Ontology Modeling for Pattern Recognition of Information Flow Using Situation Theory)

  • 임영문
    • 산업경영시스템학회지
    • /
    • 제28권4호
    • /
    • pp.63-68
    • /
    • 2005
  • 주어진 시스템에서 정보와 정보흐름에 대한 패턴인식을 하기 위해서는, 정보를 내포하고 있는 문맥이 내용에 따라서 다른 단어나 다른 정보를 추론하여 원래의미를 전달함에 있어 오도할 수 있기 때문에, 문맥의 분해에서 정보 조각의 묶음 형태로 전환하는 작업에서부터 연구는 시작되어야만 한다. 많은 연구자들이 정보의 저장, 재표현, 부호화, 검색 등에 관해 효과적인 방법론을 찾고자 노력해 오고 있다. 유사한 노력의 일환으로 본 논문에서는 군이론과 상황이론을 응용해서 정보 및 정보흐름의 패턴인식에 관한 새로운 모델링 기법을 제안하고자 한다. 정보처리에 관련된 선행연구와 비교해서, 본 연구에서 제안하는 방법은 수학이론인 군이론과 상황이론에서 사용되고 있는 개념과 정의를 사용하였다는 점에서 매우 새로운 접근방법이라 할 수 있다. 본 논문에서는 정보흐름의 패턴인식을 위한 모델링 기법으로 Abelian Pattern Semi-Group을 제시하는데 이러한 접근방법은 최근 중요한 연구 분야가 되고 있는 유비쿼터스 컴퓨팅 환경에서도 활용될 수 있을 것이다.

패턴정보저장소를 이용한 인덱스 순서관계정보모델 설계 및 구현 (Design and Implement Index Sequence Relation Information Model Using Pattern-In Repository)

  • 선수균
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 춘계학술발표대회
    • /
    • pp.597-600
    • /
    • 2004
  • 최근에는 웹 환경에 적합한 개방형과 컴포넌트들을 효율적으로 분류하고 추출하는 방법이 연구되고 있다. 본 논문은 개발환경에서 생성되는 산출물들 중 디자인패턴을 통합 관리하고, 추출, 검색하여 관리해 주는 인덱스순서관계정보모델을 설계 구현한다. 이 제안의 장점은 "인덱스 순서관계정보"로 클래스들 사이의 관련된 여러 관계정보를 UML 설계방법에 적응할 수 있는 구조로 변형할 수 있다. 두 번째 장점은 개발자가 인덱스 순서관계 정보에서 제공하는 정보를 가지고 관계정보를 쉽게 파악할 수 있으며, 디자인 패턴을 쉽게 추출함으로서 개발자는 설계정보에 쉽게 적용할 수 있다. 따라서 본 논문에서는 검색시간과 추출의 효율성을 입증하기 위해 시뮬레이션을 실시하여 향상된 기능을 입증하였다. 이 모델은 급변하는 소프트웨어 산업에 능동적으로 대체와 소프트웨어 개발에 시간을 단축함으로써 현존하는 다양한 디자인 패턴들을 최소한의 코드 수정을 통하여 재설계 함으로써 소프트웨어 개발 경제성을 높이는 데 있다.

  • PDF

사용자 생성 로그를 이용한 웹 분석시스템 설계 및 구현 (Design and Implementation of Web Analyzing System based on User Create Log)

  • 고영대;이언배
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 추계학술발표대회
    • /
    • pp.264-267
    • /
    • 2007
  • 인터넷 사이트가 증가하면서 서비스 제공자는 사용자의 요구나 행동패턴을 파악하기 위하여 웹 마이닝 기법을 활용한다. 하지만 서버에 저장된 웹 로그 정보를 활용한 마이닝 기법은 전처리 과정에 많은 노력이 필요하고 사용자의 행동패턴이나 요구를 정확하게 파악하는데 한계가 있다. 이를 극복하기 위해 본 논문에서는 사용자 생성 로그정보를 이용한 방법을 제안한다. 제안 방법은 기존 서버에 저장되는 로그파일이 아닌 사용자의 행동에 의해 웹 페이지가 로딩될 때 마다 웹 마이닝에 필요한 정보를 수집하여 DB 에 저장하는 방법을 사용하였다. 이때 기존 로그파일에 로딩시간과 조회시간, 파라메타 정보를 추가하여 보다 사실적으로 사용자의 행동패턴을 파악하고자 하였다. 이렇게 생성된 로그파일을 기 등록된 메뉴정보, 쿼리정보와 조합하면 웹 마이닝에 필수적인 데이터정제, 사용자식별, 세션식별, 트랜잭션 식별등 전처리 과정의 효율성을 향상시키고 사용자의 행동패턴파악을 위한 정보 수집을 용이하게 해준다.

웹 마이닝 시스템 설계 및 유용한 접근 패턴 정의 (Design of the web data mining system and definition of useful access patterns)

  • 김종달;김성민;남도원;이동하;이전영
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2000년도 춘계정기학술대회 e-Business를 위한 지능형 정보기술 / 한국지능정보시스템학회
    • /
    • pp.283-291
    • /
    • 2000
  • 인터넷 서비스 제공자들이 관심을 가지고 있는 것 중 하나는 인터넷 사용자들의 서비스 이용 패턴과 경향을 분석하는 것이다. 이를 통해 매출 증대와 실제 경영에 도움이 되는 사용자의 특성을 이해할 수 있기 때문이다. 이와 관련된 기본적인 접근방법은 사용자가 웹 서버에 접근했을 때 서버에 남는 웹 로그를 분석하여 사용자 패턴을 분석하는 것이다. 웹 로그 분석에 전형저인 통계기법이 사용되고 있다. 그러나 단순 통계 기법만으로는 알려지지 않는 데이터들 사이에 숨겨진 유용한 정보를 찾는 데에는 한계가 있다. 최근에는 이러한 한계를 극복하기 위해 데이터 마이닝 기술을 이용한 새로운 접근 방법이 시도되고 있다. 그러나 실제로 웹 로그에서부터 데이터 마이닝 기술을 이용하는 데에는 전처리 과정의 어려움과 실제 유용한 패턴을 어떻게 정의하는 가가 어려운 문제이다. 본 연구에서는 로(raw) 데이터인 웹 로그에서 유용한 패턴을 찾기 위한 전처리 과정을 알아보고, 웹 마이닝 시스템에 적합한 트랜잭션의 데이터 구조를 제시한다. 그리고 정의된 데이터 구조를 통한 패턴 발견 과정인 웹 사이트의 개념계층을 이용한 통계 기법과 연관규칙(Association Rules) 탐사에 대해 알아본다. 마지막으로 정의된 데이터 구조를 통한 새로운 유용한 패턴을 정의한ㄷ.

  • PDF