통합 검색 | Korea Science

Lifelong Machine Learning 기반 스팸 메시지 필터링 방법 (A Method for Spam Message Filtering Based on Lifelong Machine Learning)

안연선;정옥란
- 전기전자학회논문지
- /
- 제23권4호
- /
- pp.1393-1399
- /
- 2019
인터넷의 급속한 성장으로 데이터의 송수신의 편리성과 비용이 들지 않는다는 장점 때문에 매일 수백만 건의 무차별적인 광고성 스팸 문자와 메일이 발송되고 있다. 아직은 스팸 단어나 스팸 번호를 차단하는 방법을 주로 사용하지만, 기계 학습이 떠오름에 따라 스팸을 필터링하는 방법에 대해 다양한 방식으로 활발히 연구되고 있다. 그러나 스팸에서만 등장하는 단어나 패턴은 스팸 필터링 시스템에 의해 걸러지지 않기 위해 지속적으로 변화하고 있기 때문에, 기존 기계 학습 메커니즘으로는 새로운 단어와 패턴을 감지, 적응할 수 없다. 최근 이러한 기존 기계 학습의 한계점을 극복하기 위해 기존의 지식을 활용하여 새로운 지식을 지속적으로 학습하도록 하는 Lifelong Learning(이하 LL)의 개념이 대두되었다. 본 논문에서는 문서 분류에 가장 많이 사용되는 나이브 베이즈와 Lifelong Machine Learning(이하 LLML)의 앙상블 기법을 이용한 스팸 메시지 필터링 방법을 제안한다. 우리는 기존 스팸 필터링 시스템에 가장 많이 사용되는 나이브 베이즈와, LLML 모델 중 ELLA를 적용하여 LL의 성능을 검증한다.
https://doi.org/10.7471/ikeee.2019.23.4.1393 인용 PDF KSCI

메타 태그를 이용한 자동 웹페이지 분류 시스템 (An Automatic Web Page Classification System Using Meta-Tag)

김상일;김화성
- 한국통신학회논문지
- /
- 제38B권4호
- /
- pp.291-297
- /
- 2013
최근 월드 와이드 웹(World Wide Web)의 사용이 폭발적으로 증가함에 따라 다양한 정보를 포함하고 있는 웹 페이지들의 양도 엄청나게 증가 하였다. 따라서 웹상에 존재 하고 있는 웹페이지들에 대한 접근을 용이하게 하고, 그룹화를 통한 검색을 가능하게 하기 위해 웹 페이지 분류의 필요성이 대두 되고 있다. 웹 페이지 분류는 기존의 웹 상에 산재 되어 있는 웹페이지들을 비슷한 문서 유형 또는 같은 키워드를 사용하는 문서들의 묶음으로 구분하는 작업을 의미하며, 웹 페이지 분류 기술은 웹페이지 검색, 그룹 검색, 메일 필터링 등의 분야에 응용될 수 있는 기술이다. 하지만 웹상에 존재하는 웹페이지들을 사람이 수동적으로 분류하는 방법으로는 현재 월드 와이드 웹에 존재하는 엄청난 양의 웹페이지들을 처리할 수 없으며, 자동적인 분류 방법 역시 서로 다른 형태로 작성된 웹페이지들을 정확하게 분류할 수 없다는 문제로 인해 한계를 보이고 있다. 본 논문에서는 서로 다른 형태로 작성된 웹 문서들에 대한 부정확한 분류 문제를 해결하기위해 웹페이지에 존재하는 메타 정보를 획득하여 자동적으로 분류하는 메타 태그기반의 자동화된 웹페이지 분류 시스템을 제안하였다.
https://doi.org/10.7840/kics.2013.38B.4.291 인용 PDF KSCI

로그 히스토리 분석을 사용한 웹 포렌식 알고리즘 연구 (A Study of Web Forensics Algorithm that used Log History Analysis)

정정기;박대우
- 한국컴퓨터정보학회논문지
- /
- 제12권1호
- /
- pp.117-126
- /
- 2007
수많은 로그 히스토리의 자료에서 컴퓨터 사이버범죄에 대한 증거자료로 채택되기 위한 기술적인 웹 포렌식 자료의 추출에 사용되는 웹 포렌식 알고리즘은 필수적인 요소이다. 본 논문에서는 웹 포렌식 알고리즘을 제안하고 설계하여, 실제 기업의 웹 서버 시스템에 제안한 알고리즘을 구현해 본다. 그리고 웹 로그 히스토리 정보에 대한 무결성이나 정보출처에 대한 인증을 적용한 웹 발신 로깅 시스템 구성실험을 한다. 회사의 이메일, 웹메일, HTTP(웹게시판, 블로그 등), FTP, Telnet 및 메신저(MSN, NateOn, Yahoo, DaumTouch, BuddyBuddy, MsLee, AOL, SoftMe)의 서버에서 웹 로그 히스토리 분석을 위해 사용한 웹 포렌식 알고리즘과 플로우를 설계하고 코딩을 통한 구현을 한다. 구현 결과 웹 포렌식을 통한 컴퓨터 사이버범죄에 대한 학문적 기술적 발전에 기여하고자 하는데 본 논문의 목적이 있다.
PDF

등급에 따른 웹 유해 문서 분류 기술 (A Distinction Technology for Harmful Web Documents by Rates)

김영수;남택용;원동호
- 정보처리학회논문지C
- /
- 제13C권7호
- /
- pp.859-864
- /
- 2006
웹의 개방성은 사람들로 하여금 언제, 어디서든 손쉽게 유용한 정보를 획득할 수 있게끔 하였다. 하지만 인터넷은 유용한 정보의 손쉬운 활용이라는 순기능과 더불어 사회적으로 통제를 필요로 하는 유해한 정보 역시 인터넷을 이용하는 이용자들에게 무차별적으로 제공함으로써 역기능을 발생시키고 있다. 성인 컨텐츠 같은 정보들은 모든 사용자들, 특히 청소년들에게 악영향을 미칠 수 있다. 또한, 변태적인 성인 사이트들이 담고 있는 컨텐츠들은 성인들의 정신 건강에도 해를 미치게 된다. 한편, 인터넷은 전 세계적으로 연결된 개방망이므로 유해정보 제공자를 각국의 법적, 제도적 장치를 이용하여 규제하는데 한계가 있다. 또한, 유해 사이트, 유해성 스팸 메일, P2P 등 다양한 경로를 통해 유해 정보를 접할 수 있기 때문에, 어떤 시스템에 특화된 유해정보 분류기술을 개발하는 것은 바람직하지 않다. 따라서, 유해정보의 내용 자체에 기반하여 유해 여부를 자동으로 판별할 수 있는 유해정보 판별 핵심 기술의 연구 및 개발의 중요성이 점차 부각되고 있다. 이에 본 논문에서는 내용 기반 기술을 이용한 효율적인 유해 웹 문서 텍스트 판별 시스템을 제시한다.
https://doi.org/10.3745/KIPSTC.2006.13C.7.859 인용 PDF KSCI

사용자 지식을 반영한 메일 폴더 추천 방법론 (Folder Recommendation Based on User Knowledge)

류미;박주석;김재경
- 지능정보연구
- /
- 제10권3호
- /
- pp.133-146
- /
- 2004
네트워크 기술의 발달로 인하여 사용자가 접하게 되는 정보의 종류와 양이 급속하게 증가되고 있으며, 이로 인해 사용자는 자신이 필요로 하는 정보를 찾아내어 관리하는데 많은 시간과 노력을 소비하고 있다. 이에 본 연구에서는 대표적인 추천기법 중에 하나인 내용기반 추천(Content-based Recommendation)과 사용자 지식에 의해 정의된 키워드 유사성(Keyword Affinity)을 이용하여 사용자가 보다 적은 비용으로 자신의 정보를 효율적으로 관리할 수 있도록 지원하는 방법론을 제시한다. 즉, 사용자의 선호도가 자주 변하거나 새로운 내용이 지속적으로 생성되는 환경에서는 추천의 성능이 떨어지고, 사용자의 선호도가 충분히 축적되기까지 정확한 추천이 어려운 내용기반 추천의 한계점을 사용자 지식에 의해 정의된 키워드 유사성을 응용하여 해결한다. 본 연구는 수시로 새로운 정보가 생성되고 삭제되는 개인 이메일 환경을 그 대상으로 하며, 사용자의 효율적인 이메일 관리를 위한 폴더 추천을 지원한다. 또한 실험을 통해 기존에 연구되었던 폴더 추천 방법론과 성능을 비교함으로써 본 연구에서 제시하는 방법론을 검증하였다.
PDF

자동문서분류를 위한 텐서공간모델 기반 심층 신경망 (A Tensor Space Model based Deep Neural Network for Automated Text Classification)

임푸름;김한준
- 데이타베이스연구회지:데이타베이스연구
- /
- 제34권3호
- /
- pp.3-13
- /
- 2018
자동문서분류(Text Classification)는 주어진 텍스트 문서를 이에 적합한 카테고리로 분류하는 텍스트 마이닝 기술 중의 하나로서 스팸메일 탐지, 뉴스분류, 자동응답, 감성분석, 쳇봇 등 다양한 분야에 활용되고 있다. 일반적으로 자동문서분류 시스템은 기계학습 알고리즘을 활용하며, 이 중에서 텍스트 데이터에 적합한 알고리즘인 나이브베이즈(Naive Bayes), 지지벡터머신(Support Vector Machine) 등이 합리적 수준의 성능을 보이는 것으로 알려져 있다. 최근 딥러닝 기술의 발전에 따라 자동문서분류 시스템의 성능을 개선하기 위해 순환신경망(Recurrent Neural Network)과 콘볼루션 신경망(Convolutional Neural Network)을 적용하는 연구가 소개되고 있다. 그러나 이러한 최신 기법들이 아직 완벽한 수준의 문서분류에는 미치지 못하고 있다. 본 논문은 그 이유가 텍스트 데이터가 단어 차원 중심의 벡터로 표현되어 텍스트에 내재한 의미 정보를 훼손하는데 주목하고, 선행 연구에서 그 효능이 검증된 시멘틱 텐서공간모델에 기반하여 심층 신경망 아키텍처를 제안하고 이를 활용한 문서분류기의 성능이 대폭 상승함을 보인다.

상품에 대한 공급자 검색 문제 해결하기 위한 지능형 상품 에이전트 개발

채상용;김경필;김우주;김창욱
- 한국지능정보시스템학회:학술대회논문집
- /
- 한국지능정보시스템학회 2005년도 공동추계학술대회
- /
- pp.475-480
- /
- 2005
인터넷상에 존재하는 수 많은 웹 페이지들에는 정형화되지 않은 각종 정보들이 이종의 형태로 산재되어 있다. 현재의 검색 기술을 통하여 필요한 정보를 찾아내는 것은 시간과 비용이 많이 소요되는 비효율적인 방법으로 이뤄지고 있다. 이러한 상황에서 사용자가 원하는 정보를 검색 및 추출해내어 정형화시키는 것은 매우 중요하다. 전자상거래의 폭발적 성장에도 불구하고 전자상거래 표준 활용 및 적용이 미비하여 e- Procurement, e-Marketplace, on-Line Shopping Mall 등에서 소비자가 원하는 상품 정보를 손쉽게 획득하지 못하고 있다. 이는 공급자에게는 보다 많은 매출의 기회를 구매자에게는 보다 좋은 자재 및 상품을 저렴한 가격에 소싱 할 수 있는 기회를 제공하지 못하는 문제점이 발생한다. 본 연구에서 제안하고자 하는 지능형 상품 에이전트는 소비자가 구매하고자 하는 특정 상품에 대한 공급자 검색 문제를 해결하기 위하여, 시스템 내부 정보의 확장 및 지식화 뿐만 아니라 웹 상의 다양한 상품 정보를 자동적으로 수집 및 가공하여 저장하는 역할을 수행한다. 이러한 연구를 위해서 사용한 기술은 우선 database 의 schema 를 읽어 들일 수 있는 DB schema reader, 인터넷 웹 페이지(웹문서)를 방문해서 다양한 정보들의 URL을 수집하는 일을 하는 Meta Search Engine 과 Focused Crawler, 그리고 다른 형태의 데이터 구조를 특정 목적에 따라 표준화된 형태로 바꾸는 Wrapper가 있다. 이러한 기술들을 연동하여 필요한 정보들을 추출 공급자 검색 문제를 해결하고자 하는 것이 연구의 목적이다. 정보추출은 사용자의 관심사에 적합한 문서들로부터 어떤 구체적인 사실이나 관계를 정확히 추출하는 작업을 가리킨다.앞으로 e-메일, 매신저, 전자결재, 지식관리시스템, 인터넷 방송 시스템의 기반 구조 역할을 할 수 있다. 현재 오픈웨어에 적용하기 위한 P2P 기반의 지능형 BPM(Business Process Management)에 관한 연구와 X인터넷 기술을 이용한 RIA (Rich Internet Application) 기반 웹인터페이스 연구를 진행하고 있다.태도와 유아의 창의성간에는 상관이 없는 것으로 나타났고, 일반 유아의 아버지 양육태도와 유아의 창의성간의 상관에서는 아버지 양육태도의 성취-비성취 요인에서와 창의성제목의 추상성요인에서 상관이 있는 것으로 나타났다. 따라서 창의성이 높은 아동의 아버지의 양육태도는 일반 유아의 아버지와 보다 더 애정적이며 자율성이 높지만 창의성이 높은 아동의 집단내에서 창의성에 특별한 영향을 더 미치는 아버지의 양육방식은 발견되지 않았다. 반면 일반 유아의 경우 아버지의 성취지향성이 낮을 때 자녀의 창의성을 향상시킬 수 있는 것으로 나타났다. 이상에서 자녀의 창의성을 향상시키는 중요한 양육차원은 애정성이나 비성취지향성으로 나타나고 있어 정서적인 측면의 지원인 것으로 밝혀졌다.징에서 나타나는 AD-SR맥락의 반성적 탐구가 자주 나타났다. 반성적 탐구 척도 두 그룹을 비교 했을 때 CON 상호작용의 특징이 낮게 나타나는 N그룹이 양적으로 그리고 내용적으로 더 의미 있는 반성적 탐구를 했다용을 지원하는 홈페이지를 만들어 자료 제공 사이트에 대한 메타 자료를 데이터베이스화했으며 이를 통해 학생들이 원하는 실시간 자료를 검색하여 찾을 수 있고 홈페이지를 방분했을 때 이해하기 어려운 그래프나 각 홈페이지가 제공하는 자료들에 대한 처리 방법을 도움말로 제공받을 수 있게 했다. 실시간 자료들을 이용한 학습은 학생들의 학습 의욕과 탐구 능력을 향상시켰으
PDF

자가 생성 지도 학습 알고리즘을 이용한 컨테이너 식별자 인식

김재용;박충식;김광백
- 한국지능정보시스템학회:학술대회논문집
- /
- 한국지능정보시스템학회 2005년도 공동추계학술대회
- /
- pp.500-506
- /
- 2005
본 논문에서는 자가 생성 지도 학습 알고리즘을 이용한 운송 컨테이너 식별자 인식 시스템을 제안한다. 일반적으로 운송 컨테이너의 식별자들은 글자의 색이 검정색 또는 흰색으로 이루어져 있는 특정이 있다. 이러한 특성을 고려하여 원 컨테이너 영상에 대해 검은색과 흰색을 제외하고는 모든 부분을 잡음으로 처리하기 위해 퍼지 추론 방법을 이용하여 식별자 영역과 바탕영역을 구별한다. 식별자 영역으로 구분 된 영역은 그대로 두고, 바탕 영역으로 구분된 영역 은 전체 영상의 평균 픽셀 값으로 대체시킨다. 그리고 Sobel 마스크를 이용하여 에지를 검출하고, 추출된 에지를 이용하여 수직 블록과 수평 블록을 검출 하여 컨테이너의 식별자 영역을 추출하고 이진화한다. 이진화 된 식별자 영역에 대해 검정색의 빈도수를 이용하여 흰바탕과 민바탕을 구분하고 4 방향 윤곽선 추적 알고리즘을 적용하여 개별 식별자를 추출 한다. 개별 식별자 인식을 위해 자가 생성 지도 학습 알고리즘을 제안하여 개별 식별자 인식에 적용한다. 제안된 자가 생성 지도 학습 알고리즘은 입력층과 은닉층 사이의 구조를 ART-l을 개선하여 적용하고 은닉층과 출력층 사이에는 일반화된 델타 학습 방법과 Delta-bar-Delta 알고리즘을 적용하여 학습 및 인식 성능을 개선한다. 실제 80 개의 컨테이너 영상을 대상으로 실험한 결과, 제안된 식별자 추출 방법이 이전의 개별 추출 방법보다 추출률이 개선되었고 FCM 기반 자가 생성 지도 학습 알고리즘보다 제안된 자가 생성 지도 학습 알고리즘이 컨테이너 식별자의 학습 및 인식에 있어서 개선된 것을 확인하였다.색 문제를 해결하고자 하는 것이 연구의 목적이다. 정보추출은 사용자의 관심사에 적합한 문서들로부터 어떤 구체적인 사실이나 관계를 정확히 추출하는 작업을 가리킨다.앞으로 e-메일, 매신저, 전자결재, 지식관리시스템, 인터넷 방송 시스템의 기반 구조 역할을 할 수 있다. 현재 오픈웨어에 적용하기 위한 P2P 기반의 지능형 BPM(Business Process Management)에 관한 연구와 X인터넷 기술을 이용한 RIA (Rich Internet Application) 기반 웹인터페이스 연구를 진행하고 있다.태도와 유아의 창의성간에는 상관이 없는 것으로 나타났고, 일반 유아의 아버지 양육태도와 유아의 창의성간의 상관에서는 아버지 양육태도의 성취-비성취 요인에서와 창의성제목의 추상성요인에서 상관이 있는 것으로 나타났다. 따라서 창의성이 높은 아동의 아버지의 양육태도는 일반 유아의 아버지와 보다 더 애정적이며 자율성이 높지만 창의성이 높은 아동의 집단내에서 창의성에 특별한 영향을 더 미치는 아버지의 양육방식은 발견되지 않았다. 반면 일반 유아의 경우 아버지의 성취지향성이 낮을 때 자녀의 창의성을 향상시킬 수 있는 것으로 나타났다. 이상에서 자녀의 창의성을 향상시키는 중요한 양육차원은 애정성이나 비성취지향성으로 나타나고 있어 정서적인 측면의 지원인 것으로 밝혀졌다.징에서 나타나는 AD-SR맥락의 반성적 탐구가 자주 나타났다. 반성적 탐구 척도 두 그룹을 비교 했을 때 CON 상호작용의 특징이 낮게 나타나는 N그룹이 양적으로 그리고 내용적으로 더 의미 있는 반성적 탐구를 했다용을 지원하는 홈페이지를 만들어 자료
PDF

동기/비동기 기반의 통합 E-코칭 시스템 설계 및 구현 (Design and Implementation of Integrated E-Coaching system Based on Synchronous and Asynchronous)

김도연;김도현
- 한국인터넷방송통신학회논문지
- /
- 제15권4호
- /
- pp.1-7
- /
- 2015
지금까지 대부분의 코칭은 대면 중심으로 이루어졌으나, 인터넷을 활용한 e-코칭으로 확장이 시도되고 있다. 현재 e-코칭은 대면 코칭을 위한 보조 역할을 수행하고 있다. 따라서 코치와 피코치 간의 수평적 관계에서 언제 어디서나 소통할 수 있는 e-코칭 시스템의 개발이 요구되고 있다. 기존의 e-코칭은 전자문서, 비디오 채팅, 문자 채팅, 전화 등의 네 가지 형태가 일반적이다. 대부분의 e-코칭 방식은 접근성이 용이하나, 비디오 채팅은 우수한 가시성을 제공하나 동기방식을 요구한다. 이에 반해 전자 메일은 비동기 방식이며, 문서 작성 중심이다. 본 논문에서는 동기와 비동기를 지원하는 통합 e-코칭 시스템을 설계하고 구현한다. 제안한 e-코칭 시스템은 비동기 방식의 전자 메일과 동기 방식의 P2P(Peer to Peer) 비디오 채팅과 그룹 문자 채팅을 지원한다. 이를 통해 비동기와 동시적인 방법을 함께 지원하여 개인 혹은 그룹 간의 규칙적, 비공식적 코칭이 가능할 수 있다.
https://doi.org/10.7236/JIIBC.2015.15.4.1 인용 PDF KSCI

이미지와 텍스트 메시지의 통합 사용자 뷰를 제공하는 전자 우편 시스템 (E-mail System Providing Integrated User's View for the Message containing Image and Text)

독고세준;이택균;이형우;윤성현;이성환;김창헌;김태윤
- 한국정보처리학회논문지
- /
- 제4권2호
- /
- pp.563-572
- /
- 1997
전자 우편은 인터넷 정보 전달 서비스로서 널리 사용되고 있다. 멀티미디어 기술의 급속한 발전으로 최근 인터넷 정보 서비스는 대부분 멀티미디어를 지원하고 있다 아. 따라서 멀티미디어 메시지를 지원하는 전자 우편 시스템이 요구된다. 그러나RFC 821/822 의SMTP (Simple Mail Transfer protocol)를 사용하는 인터넷 메일 서비스를 전달할 수 있는 정보가 7bit ASCII텍스트만으로 제한되어 있다. 또한 한 라인의 길이에도 제한이 있어서 사용자 요구를 충족하기에 부족하다. MIME(Multipurpose Internet Mail EXtensions)은 RFC 822를 수정, 보완한 것으로서, 메시지를 구성하는 데이타의 종류와 크기의 제한을 해결하여 멀티미디어 데이타를 전송하기 위해 제안되었다. 본 연구에서는 MIME의 표준을 따라 정보 전송 상의 제약을 해결한 전자 우편 시스템을 설계 및 구현하였다. HTML( Hyper Text Markup Language)구문을 적용하여 서로 다른 미디어로 구성된 메시지를 통합 적으로 보여줌으로써 정보 전달의 명확성을 향상시켰다. 별도의 응용 프로그램이 필요치 않고, 사용자 편의를 더욱 증가시킨 시스템을 구성하였다. 앞으로도 동화상 및 음성 정보 등을 지원할 수 있도록 보완하여, 통합 사용자 뷰를 제공하는 완전한 멀티미디어 전자 우편 시서템을 개발하고자 한다.
PDF

검색결과 323건 처리시간 0.027초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)