• 제목/요약/키워드: 사용자 키워드학습

검색결과 84건 처리시간 0.031초

지능형 에이전트를 이용한 유.무선 뉴스 검색 시스템 (Wire and Wireless News Retrieval System using Intelligent Agent)

  • 한선미;우진운
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (3)
    • /
    • pp.628-630
    • /
    • 2001
  • 오늘날 인터넷이 보편화되면서 정보 검색 및 뉴스 검색들이 일반화되고 있지만 엄청난 정보의 양과 다양성 등으로 인해 사용자들은 오히려 정보 검색의 어려움을 호소하고 있다 이에 본 논문에서는 사용자 편의의 뉴스 검색과 사용자의 요구와 취향이 반영될 수 있도록 BPN(Back Propagation Neural Network)의 학습 기능을 가진 지능형 에이전트를 이용하여 뉴스 기사를 필터링하는 뉴스 검색 시스템을 제안한다. 이 시스템은 여러 신문사의 기사를 수집 및 통합하여 그 날의 주요 기사들을 데이터베이스에 저장하는 수집 에이전트, 사용자가 입력만 키워드를 이용하여 BPN 기법으로 학습시키는 훈련 에이전트 등으로 구성되어 있다. 또한 정보 통신 기술의 눈부신 발달로 투선 인터넷이 급속히 보급되는 현실을 감안하여 무선으로도 이러한 서비스를 제공할 수 있도록 시스템을 구성하였다.

  • PDF

심층적 의미 매칭을 이용한 cQA 시스템 질문 검색 (Question Retrieval using Deep Semantic Matching for Community Question Answering)

  • 김선훈;장헌석;강인호
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2017년도 제29회 한글및한국어정보처리학술대회
    • /
    • pp.116-121
    • /
    • 2017
  • cQA(Community-based Question Answering) 시스템은 온라인 커뮤니티를 통해 사용자들이 질문을 남기고 답변을 작성할 수 있도록 만들어진 시스템이다. 신규 질문이 인입되면, 기존에 축적된 cQA 저장소에서 해당 질문과 가장 유사한 질문을 검색하고, 그 질문에 대한 답변을 신규 질문에 대한 답변으로 대체할 수 있다. 하지만, 키워드 매칭을 사용하는 전통적인 검색 방식으로는 문장에 내재된 의미들을 이용할 수 없다는 한계가 있다. 이를 극복하기 위해서는 의미적으로 동일한 문장들로 학습이 되어야 하지만, 이러한 데이터를 대량으로 확보하기에는 어려움이 있다. 본 논문에서는 질문이 제목과 내용으로 분리되어 있는 대량의 cQA 셋에서, 질문 제목과 내용을 의미 벡터 공간으로 사상하고 두 벡터의 상대적 거리가 가깝게 되도록 학습함으로써 의사(pseudo) 유사 의미의 성질을 내재화 하였다. 또한, 질문 제목과 내용의 의미 벡터 표현(representation)을 위하여, semi-training word embedding과 CNN(Convolutional Neural Network)을 이용한 딥러닝 기법을 제안하였다. 유사 질문 검색 실험 결과, 제안 모델을 이용한 검색이 키워드 매칭 기반 검색보다 좋은 성능을 보였다.

  • PDF

데이터셋 생성을 위한 이미지 URI 및 메타데이터 수집 크롤러 (For creating a Dataset Image URI and Metadata Collection Web Crawler)

  • 박준홍;김석진;정연욱;이동욱;정영주;서동만
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 추계학술발표대회
    • /
    • pp.1082-1084
    • /
    • 2019
  • 인공지능 학습에 대한 관심이 증가하면서 학습에 필요한 데이터셋 구축에 필요한 많은 양의 데이터가 필요하다. 데이터셋 구축에 필요한 데이터들을 효과적으로 수집하기 위한 키워드 기반 웹크롤러를 제안한다. 구글 검색 API 를 기반으로 웹 크롤러를 설계하였으며 사용자가 입력한 키워드를 바탕으로 이미지의 URI 와 메타데이터를 지속적으로 수집하는 크롤러이다. 수집한 URI 와 메타데이터는 데이터베이스를 통해 관리한다. 향후 다른 검색 API 에서도 동작하고 다중 쓰레드를 활용하여 크롤링하는 속도를 높일 예정이다.

베이지안 네트워크와 멀티 레이어 퍼셉트론을 이용한 모바일 스팸 문자 메시지 필터링 방법 (A Method for Spam SMS Filtering Using Bayesian Network and Multi Layer Perceptron)

  • 홍승범;김문현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 추계학술발표대회
    • /
    • pp.283-286
    • /
    • 2011
  • 스팸 메시지는 불특정 다수에게 보내지는 광고성 메시지로서 최근 들어 그 양이 증가하고 있는 추세이다. 본 논문에서는 모바일 환경에서의 스팸 메시지 필터링을 위한 시스템을 제안하며 기존 환경에서 자주 사용되었던 키워드 기반 필터링 시스템의 단점을 해결하고자 고안되었다. 베이지안 네트워크를 통해 스팸 메시지들의 패턴을 추출하고 추출된 패턴을 멀티 레이어 퍼셉트론을 이용해 학습하여 메시지들을 분류한다. 이 시스템을 통해 약 93.5%의 필터링 정확도률을 얻었으며 키워드 선택 대신 스팸 메시지를 선택해 학습시킴으로서 사용하기 쉽고 사용자에 맞는 시스템을 구성할 수 있었다.

색인 구조를 고려한 안전한 검색가능암호기술에 관한 연구 (A Study on Secure Searchable Encryption Considering Index Stucture)

  • 이선호;이임영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 추계학술발표대회
    • /
    • pp.738-739
    • /
    • 2013
  • 네트워크 및 컴퓨팅 기술의 발달로 데이터를 위탁 저장하고 이를 언제어디서든 다양한 단말로 처리할 수 있는 클라우드 스토리지 서비스가 활성화되고 있다. 하지만, 위탁 저장된 민감한 정보가 암호화 없이 저장된다면 서버에 저장된 데이터를 데이터 소유주의 동의 없이 공격자 및 비윤리적인 서버관리자가 열람할 수 있어 저장된 데이터의 암호화 및 이를 검색하는 검색 가능한 암호시스템(Searchable Encryption System)이 등장하게 되었다. 기존의 검색가능 암호 시스템은 같은 키워드를 검색하기 위해 생성된 트랩도어가 동일한 형태를 가지게 되어 공격자가 검색 쿼리를 통해 사용자가 어떤 데이터를 저장하고 검색하는지 학습이 가능하다. 본 논문은 사용자가 같은 키워드를 검색하더라도 매번 다른 트랩도어가 생성되도록 하여 비윤리적인 서버관리자가 검색 쿼리를 통해 검색 내용 및 데이터를 유추할 수 없도록 하는 일회용 트랩도어를 이용한 검색가능 암호 시스템을 제안한다.

e-learning 컨텐츠 품질이 사용자 만족에 미치는 영향

  • 박성택;이승준;김영기
    • 한국디지털정책학회:학술대회논문집
    • /
    • 한국디지털정책학회 2006년도 추계학술대회
    • /
    • pp.421-431
    • /
    • 2006
  • 지식정보사회의 핵심 키워드인 e-learning은 많은 발전을 하고 있다. e-learning은 오프라인 교육에 비해 시간과 공간의 제약을 받지 아니하고, 비용이 저렴하며 반복 학습과 개인화된 서비스가 가능하다는 장점이 있는 반면에 아직도 파급 효과는 크지 못한 실정이다. 또한 국가적인 차원에서 많은 지원을 하고 있고 시장의 급속한 성장과 확산에 비해, 중${\cdot}$고생들을 대상으로 하는 e-learning사이트의 컨텐츠 품질에 대한 연구는 미비한 실정이다. 이에 본 연구에서는 중${\cdot}$고생 시절에e-learning의 경험이 있는 대학생들을 중심으로 실증연구를 수행하였다.

  • PDF

동사사전를 이용한 의미 기반 정보 검색 시스템의 설계 (Design of An Information Retrieval System using Verb Dictionary)

  • 이용훈;이상범
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2009년도 추계학술발표논문집
    • /
    • pp.177-180
    • /
    • 2009
  • 본 논문에서는 문장에서 동사를 파악하여 명사간의 의미를 부여하는 자동학습 온톨로지 기반 정보 검색 시스템을 제안한다. 정보의 양이 무한히 증가하고 있으며 웹의 발전에 따라 적합한 정보를 찾아내야 하는 효율적인 정보 검색 시스템의 필요성이 증대되고 있다. 단순히 키워드의 가중치에 따른 검색의 순위화는 사용자의 의미를 이해하지 못한 검색 결과로서 사용자로 하여금 결과를 다시 한번 직접 검색해야 하는 불편함을 제공하고 있다. 이러한 문제점을 해결하기 위해서 문장에서 동사를 파악하여 명사 간의 의미를 부여하고 문서 내에서 단어 간의 의미를 파악하여 검색의 질을 개선하는 방법을 논의한다. 또한, 문서에서 단어의 관계를 스스로 학습 가능하여 구축되는 자동학습 온톨로지 기반의 정보 검색 시스템을 제안한다.

  • PDF

유즈넷 뉴스 그룹 결정 방법을 활용한 성능평가 (Performance Analysis by utilizing a Determination Method of Usenet News Groups)

  • 김종완;김희재;김병익
    • 한국산업정보학회:학술대회논문집
    • /
    • 한국산업정보학회 2004년도 춘계학술대회 21세기 IT산업의 발전 전망
    • /
    • pp.67-72
    • /
    • 2004
  • 않은 양의 유즈넷 뉴스 중에서 사용자가 찾고자 하는 정확한 정보를 빠른 시간 안에 검색하고, 원하는 정보만 필터링 하는 것은 중요하다. 그러나 뉴스 문서는 이메일과 달라서 미리 자신에게 맞는 뉴스그룹을 등록해 주어야만 정보를 얻을 수 있다. 본 연구에서는 다양한 뉴스그룹들 중에서 사용자의 취향과 유사한 뉴스그룹들을 코호넨 신경망을 이용하여 추천해주는 방법을 제시한다. 신경망을 학습시키기 위한 뉴스 문서의 키워드들을 선택하기 위해 예제 문서들로부터 후보 용어들을 추출하고 퍼지 추론을 적용하여 대표 용어들을 선택한다. 하지만 신경망의 학습 패턴을 관찰해 보면, 많은 부분이 비어있는 희소성 문제를 발견할 수 있다. 이에 본 연구에서는 통계적인 결정계수를 도입하여 불필요한 차원을 제거한 후 신경망을 학습시키는 새로운 방법을 제안한다. 제안된 방법은 모든 차원을 활용할 때 보다 클러스터내 거리와 클러스터간 거리의 척도를 이용한 클러스터 중첩도 면에서 우수한 분류 성능을 보여줌을 확인하였다.

  • PDF

일회용 트랩도어를 이용한 검색 가능한 암호 시스템에 관한 연구 (A Study on Searchable Encryption System using One-Time Trapdoor)

  • 이선호;이임영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 춘계학술발표대회
    • /
    • pp.618-620
    • /
    • 2013
  • 네트워크 및 컴퓨팅 기술의 발달로 데이터를 위탁 저장하고 이를 언제어디서든 다양한 단말로 처리 할 수 있는 클라우드컴퓨팅서비스가 활성화되고 있다. 특히 클라우드컴퓨팅 서비스 중 DaaS가 널리 사용되고 있다. 하지만, 위탁 저장된 데이터베이스에 신체 정보라던가 개인의 민감한 정보가 암호화 없이 저장된다면 서버에 저장된 데이터를 데이터 소유주의 동의 없이 공격자 및 비윤리적인 서버관리자가 열람할 수 있다는 보안 문제점이 있어 위탁 저장된 데이터베이스의 암호화가 필요하다. 하지만 기존에 사용되고 있는 암호화 알고리즘으로 암호화된 데이터를 안전하게 검색하기 위해선 암호화 데이터를 전부 데이터 소유자의 단말기에 내려 받고 전부 복호화해서 검색해야 하기에 데이터를 위탁 저장하는 의미가 퇴색된다. 이와 같은 문제를 해결하기위해 검색 가능한 암호시스템(Searchable Encryption System)이 등장하게 되었다. 하지만 기존의 검색가능 암호 시스템은 같은 키워드를 검색하기위해 생성된 트랩도어가 동일한 형태를 가지게 된다. 수많은 검색 쿼리들이 위탁저장소에 전송되며, 저장소의 관리자는 쿼리를 통해 키워드를 유추하고, 쿼리를 통해 사용자가 어떤 데이터를 저장하고 검색하는지 학습이 가능하기 때문이다. 따라서 본 논문은 동일한 사용자가 같은 키워드를 검색하더라도 매번 다른 트랩도어가 생성되도록 하여 비윤리적인 서버관리자가 검색 쿼리를 통해 검색 내용 및 데이터를 유추할 수 없도록 하는 일회용 트랩도어를 이용한 검색가능 암호 시스템을 제안한다.

웹 사용자의 선호도 추출을 위한 지능모델 설계 및 평가 (Design & Evaluation of an Intelligent Model for Extracting the Web User' Preference)

  • 김광남;윤희병;김화수
    • 한국지능시스템학회논문지
    • /
    • 제15권4호
    • /
    • pp.443-450
    • /
    • 2005
  • 본 논문에서는 웹 사용자의 선호도를 추출하기 위한 지능적 모델을 제안하고 이에 대한 평가결과를 제시한다. 이를 위해 현재 정보검색엔진의 문제점을 분석하고, 선호도 가중치를 학습기에 반영한다. 이것은 키워드에 의한 단어별 빈도수에 의존하지 않고 지능적으로 사용자의 행동유형을 학습하게 함으로써 질의에 대한 결과집합을 사용자의 의도에 맞게 제공하는 메커니즘이다. 다음으로 선호도 유행성에 대한 개념과 고려요소를 제안하며, 선호도 추출 알고리즘과 이에 대한 예를 제시한다. 또한 행동유형 추출을 위한 지능모델을 설계하고 HTML 색인과 선호도 결정 지능학습과정을 제안한다. 마지막으로 선호도를 적용한 후의 문서 랭킹 측정결과를 비교함으로써 본 논문에서 제안한 모델의 타당성을 검증한다.