• 제목/요약/키워드: User's Keyword learning

검색결과 14건 처리시간 0.025초

동물 영역 지식 기반의 지능형 정보 에이전트 (A Knowledge-Based Intelligent Information Agent for Animal Domain)

  • 이용현;오정욱;변영태
    • 인지과학
    • /
    • 제10권1호
    • /
    • pp.67-78
    • /
    • 1999
  • 네트워크의 기술 발달로 웹상의 정보 제공자가 증가함에 따라 정보 사용자가 필요한 정보를 신속하고 정확하게 획득하기는 것이 더욱 어려워졌다. 이를 위해서 키워드 정합 방식의 검색 엔진이 많이 개발 보급되고 있으나 여전히 많은 부담이 사용자에게 주어지고 있는 상황이다. 이러한 문제를 해결하기 위해서 본 논문에서는 특정 영역인 동문 분야에 대한 지식 베이스를 기반으로 사용자의 의도에 보다 적합하고 해당 영역에 적절한 형태로 사용자 질이를 가공하고, 대용량의 다양한 정보로부터 사용자가 필요로 하는 정보를 제공하는 일을 해주는 지능적인 정보검색 대리자, 정보 에이전트(HIIA-la : Hongik Information Agent)를 제안한다. HIIA-la는 온톨로지 형태에 접근한 동물 관련 지식 베이스를 가지고 있으며, 이를 기반으로 사용자 또는 다른 에이전트 시스템의 정보 요청에 대해 필요한 정보를 제공할 뿐만 아니라, 관련 웹 문서 정보도 제공된다. 효율적인 웹 문서의 제공을 위하여 방대한 양의 웹 문서를 대상으로 동물 영역에 관련된 문서를 저장·색인하는 웹DB를 가지고 있다. 또한 사용자의 의도를 좀더 명확하게 표현할 수 있도록 유연한 연사자로의 질의 확장을 하였으며, 축적된 처리 결과와 사용자의 피드백 정보를 통해 학습을 하게 된다. 본 논문에서는 이와 같이 요소들을 포함하는 HIIA-la를 구현하고, 실험을 통해 시스템의 효율성을 보인다.

  • PDF

빅데이터 환경에서 기계학습 알고리즘 응용을 통한 보안 성향 분석 기법 (Security tendency analysis techniques through machine learning algorithms applications in big data environments)

  • 최도현;박중오
    • 디지털융복합연구
    • /
    • 제13권9호
    • /
    • pp.269-276
    • /
    • 2015
  • 최근 빅데이터 관련 산업 활성화에 따라 글로벌 보안 업체들은 지능적인 보안 위협 모니터링과 예방을 위해 분석 데이터의 범위를 정형/비정형 데이터로 확대하고, 보안 예방을 목적으로 사용자의 성향 분석 기법을 활용하려는 추세이다. 이는 기존 정형 데이터(기존 수치화 가능한 자료)의 분석 결과에서 추론할 수 있는 정보의 범위가 한정적이기 때문이다. 본 논문은 빅데이터 환경에서 기계학습 알고리즘($Na{\ddot{i}}ve$ Bayes, Decision Tree, K-nearest neighbor, Apriori)을 효율적으로 응용하여 보안 성향(목적 별 항목 분류, 긍정 부정 판단, 핵심 키워드 연관성 분석)을 분석하는데 활용한다. 성능 분석 결과 보안 성향 판단을 위한 보안항목 및 특정 지표를 정형/비정형 데이터에서 추출할 수 있음을 확인하였다.

역사객체 기반의 기계학습 기법을 활용한 웹 문서의 시간정보 추출 방안 제안 (A Proposal of Methods for Extracting Temporal Information of History-related Web Document based on Historical Objects Using Machine Learning Techniques)

  • 이준;권용진
    • 인터넷정보학회논문지
    • /
    • 제16권4호
    • /
    • pp.39-50
    • /
    • 2015
  • 최근 검색엔진을 통한 정보검색 과정에서 특정 시구간 상황에 대응하는 문서를 검색하고자 하는 경우가 있다. 예를 들면, 임진왜란 이전의 시대적 상황과 관련된 문서를 검색하기 위해, 키워드 '임진왜란'으로 검색하면 시간에 관계없이 임진왜란 당시나 전후의 모든 문서가 검색되어 추가적인 작업이 요구된다. 또한, 역사관련 문서의 경우는 문서내용에 대응하는 시간 정보가 문서 생성시간과 일치하지 않는 경우가 대부분이다. 만약 웹 문서의 내용에 대응하는 시간 정보를 추출 할 수 있다면 효과적인 정보검색은 물론 다양한 응용에 적용 가능할 것이다. 따라서 본 논문은 문서 내용에 대응하는 시간정보 추출을 목적으로, 조선시대를 대상으로 한 역사문헌을 활용하여 조선시대 역사관련 문서의 시간추출에 대한 연구를 진행한다. 역사 문헌과 웹으로부터 수집된 역사관련 문서를 바탕으로 역사객체를 정의하고, 이를 기반으로 다양한 기계학습 기법을 활용하여 웹 문서의 시간정보 추출에 대한 가능성을 확인한다. 또한 기계학습 과정에 있어서 객체의 유사도에 기반 한 여과과정을 제안하고 이를 적용한 효율적인 시간정보 추출 및 정확도 향상에 대한 결과를 비교 분석한다.

등급에 따른 웹 유해 문서 분류 기술 (A Distinction Technology for Harmful Web Documents by Rates)

  • 김영수;남택용;원동호
    • 정보처리학회논문지C
    • /
    • 제13C권7호
    • /
    • pp.859-864
    • /
    • 2006
  • 웹의 개방성은 사람들로 하여금 언제, 어디서든 손쉽게 유용한 정보를 획득할 수 있게끔 하였다. 하지만 인터넷은 유용한 정보의 손쉬운 활용이라는 순기능과 더불어 사회적으로 통제를 필요로 하는 유해한 정보 역시 인터넷을 이용하는 이용자들에게 무차별적으로 제공함으로써 역기능을 발생시키고 있다. 성인 컨텐츠 같은 정보들은 모든 사용자들, 특히 청소년들에게 악영향을 미칠 수 있다. 또한, 변태적인 성인 사이트들이 담고 있는 컨텐츠들은 성인들의 정신 건강에도 해를 미치게 된다. 한편, 인터넷은 전 세계적으로 연결된 개방망이므로 유해정보 제공자를 각국의 법적, 제도적 장치를 이용하여 규제하는데 한계가 있다. 또한, 유해 사이트, 유해성 스팸 메일, P2P 등 다양한 경로를 통해 유해 정보를 접할 수 있기 때문에, 어떤 시스템에 특화된 유해정보 분류기술을 개발하는 것은 바람직하지 않다. 따라서, 유해정보의 내용 자체에 기반하여 유해 여부를 자동으로 판별할 수 있는 유해정보 판별 핵심 기술의 연구 및 개발의 중요성이 점차 부각되고 있다. 이에 본 논문에서는 내용 기반 기술을 이용한 효율적인 유해 웹 문서 텍스트 판별 시스템을 제시한다.