• 제목/요약/키워드: 가중치 결정

검색결과 1,042건 처리시간 0.024초

듀얼 SMS 스팸 필터링: 그래프 기반 자질 가중치 기법 (Dual SMS SPAM Filtering: A Graph-based Feature Weighting Method)

  • 황재원;고영중
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2014년도 제26회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.95-99
    • /
    • 2014
  • 본 논문에서는 최근 급속히 증가하여 사회적 이슈가 되고 있는 SMS 스팸 필터링을 위한 듀얼 SMS 스팸필터링 기법을 제안한다. 지속적으로 증가하고 새롭게 변형되는 SMS 문자 필터링을 위해서는 패턴 및 스팸 단어 사전을 통한 필터링은 많은 수작업을 요구하여 부적합하다. 그리하여 기계 학습을 이용한 자동화 시스템 구축이 요구되고 있으며, 효과적인 기계 학습을 위해서는 자질 선택과 자질의 가중치 책정 방법이 중요하다. 하지만 SMS 문자 특성상 문장들이 짧기 때문에 출현하는 자질의 수가 적어 분류의 어려움을 겪게 된다. 이 같은 문제를 개선하기 위하여 본 논문에서는 슬라이딩 윈도우 기반 N-gram 확장을 통해 자질을 확장하고, 확장된 자질로 그래프를 구축하여 얕은 구조적 특징을 표현한다. 학습 데이터에 출현한 N-gram 자질을 정점(Vertex)으로, 자질의 출현 빈도를 그래프의 간선(Edge)의 가중치로 설정하여 햄(HAM)과 스팸(SPAM) 그래프를 각각 구성한다. 이렇게 구성된 그래프를 바탕으로 노드의 중요도와 간선의 가중치를 활용하여 최종적인 자질의 가중치를 결정한다. 입력 문자가 도착하면 스팸과 햄의 그래프를 각각 이용하여 입력 문자의 2개의 자질 벡터(Vector)를 생성한다. 생성된 자질 벡터를 지지 벡터 기계(Support Vector Machine)를 이용하여 각 SVM 확률 값(Probability Score)을 얻어 스팸 여부를 결정한다. 3가지의 실험환경에서 바이그램 자질과 이진 가중치를 사용한 기본 시스템보다 F1-Score의 약 최대 2.7%, 최소 0.5%까지 향상되었으며, 결과적으로 평균 약 1.35%의 성능 향상을 얻을 수 있었다.

  • PDF

곤충 발자국 인식을 위한 기여도 기반의 퍼지 가중치 결정 방법 (A Fuzzy Weights Decision Method based on Degree of Contribution for Recognition of Insect Footprints)

  • 신복숙;차의영;우영운
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권12호
    • /
    • pp.55-62
    • /
    • 2009
  • 이 논문에서는 개체를 명확하게 분류하기 어려운 곤충 발자국 영상으로부터 개체를 인식하기 위해서 추출된 특징값 성분들의 기여도를 측정하고, 서로 관계된 기여도에 따라 가중치를 조정하는 퍼지 가중치 결정 방법을 제안한다. 곤충은 몸의 크기가 작아서 발자국은 작은 점의 형태로 나타난다. 그리고 다른 생물체의 발자국과 달리, 규칙적인 형상을 정의하기 어렵고 발자국 데이터와 구분이 분명하지 않는 노이즈와 혼재하기 때문에 개체를 판단하는데 많은 어려움이 있다. 이런 이유로 추출된 곤충 발자국 특징값은 명확하게 구분되는 특징성분 영역과 그렇지 않는 성분을 함께 가지게 된다. 이중 어떤 성분이 다른 성분과 비교하여 다른 클래스와 구분하기에 충분한 변별력을 가질 경우, 개체를 분류하도록 높은 가중치를 할당한다. 산출된 가중치는 퍼지함수에 의해서 출력신호를 결정하고 우세한 출력신호에 의해서 개체를 판단할수 있다. 제안한 기여도 퍼지 가중치 결정 방법을 이용하여 발자국영상의 인식 실험을 수행하고 실험 결과를 제시하였다.

대학교수 종합평가의 평가내용요소별 가중치

  • 권기욱
    • 대학교육
    • /
    • 통권76호
    • /
    • pp.83-89
    • /
    • 1995
  • 교수종합평가는 교육.연구.봉사 영역 모두를 대상으로 해야 한다. 어느 한 영역의 평가결과가 우수하면, 다른 영역의 결과는 그렇지 못할 수도 있다. 모든 영역에서 평가결과가 우수한 경우는 드물다. 그리고 교수종합평가의 평가영역 및 평가요소별 가중치는 개인의 가치에 따라 차이가 있을 수 있다. 교수의 종합평가나 중점평가에 적용될 가중치는 특정 개인의 주장만을 반영하기보다 많은 사람이 합의한 결정에 근거하여 설정되어야 한다. 여기에서는 보다 많은 대학과 다양한 학문계열의 교수들을 표집하여 객관적인 입장에서 평가영역 및 평가항목의 가중치를 규명하였다. 그 결과로 도출된 가중치는 대학교수들의 평가에 적용되어 평가결과의 타당성을 제고할 수 있을 것이다.

  • PDF

구간값 퍼지집합에서 규칙 가중치를 고려한 분류방법 (The Method of Classification Considering Rule Weights in the Interval-Valued Fuzzy Sets)

  • 손창식;정환묵
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2006년도 춘계학술대회 학술발표 논문집 제16권 제1호
    • /
    • pp.85-89
    • /
    • 2006
  • 구간값 퍼지집합은 일반적인 퍼지집합보다 언어적인 의사결정 절차에서 매핑의 정확성과 계산의 효율성이 뛰어나고, 규칙의 가중치는 패턴 분류문제에서 분류 경계를 효율적으로 조정할 수 있다는 장점을 가지고 있다. 따라서 본 논문에서는 퍼지규칙 기반 분류방법을 구간값 퍼지규칙 기반 분류방법으로 확장하고 규칙의 가중치를 고려한 분류방법을 제안한다. 모의실험에서는 일반 퍼지집합에서 규칙 가중치를 고려한 분류방법과 구간값 퍼지집합에서 규칙 가중치를 고려한 분류방법을 비교하였다.

  • PDF

수자원 계획수립을 위한 다기준의사결정기법의 적용: 2. 가중치와 평가치에 대한 민감도 분석 (Application of Multi-criteria Decision Making Techniques for Water Resources Planning: 2. Sensitivity Analysis of Weighting and Performance Values)

  • 정은성
    • 한국수자원학회논문집
    • /
    • 제45권4호
    • /
    • pp.383-391
    • /
    • 2012
  • 본 연구는 다기준 의사결정 문제에서 항상 발생하는 가중치와 대안들의 평가치에 대한 불확실성을 최소화하기 위해 민감도 분석을 수행하는 절차를 제시하였다. 제기되는 가중치에 대한 불확실성을 극복하기 위해 일반적으로 순위가 뒤바뀔 수 있는 가장 민감한 평가기준의 결정과 대안의 효과 측정자료의 결정이 있다. 본 연구는 유량확보와 수질개선을 위한 수자원 계획수립을 위해가중합계법을 이용한 문제에 두 경우의 민감도분석을 모두수행하였다. 이 과정에서 결정계수와 민감도 계수를 산정하여 이용하였다. 본 연구에서 제시한 민감도 분석 과정은 향후 수자원 계획 수립에 폭넓게 활용될 수 있다.

네트워크구조 의사결정기법을 이용한 LCA 환경영향평가 (Environmental Impact Assessment in LCA Using Analytic Network Process)

  • 강희정
    • 에너지공학
    • /
    • 제8권4호
    • /
    • pp.612-620
    • /
    • 1999
  • 환경영향평가는 전과정평가(Life Cycle Assessment : LCA)의 인벤토리 분석과정에서 규명된 환경부하의 값으로 표현하고 상대적인 중용도를 측정하는 단계이다. 이러한 가중치를 측정하므로서 개별제품 또는 기술에 대한 환경부하의 영향을 평가하는데 이용될 수 있다. 본 연구에서는 환경영향평가에 대한 분석에서 환경부하의 상대적인 중요도 혹은 가중치를 산출하기 위하여 일반적으로 이용되는 계층적 의사결정모형(Hierarchical decision model)의 한계인 요인들간의 독립성을 극복할 수 있는 즉, 의사결정요인간 상호영향력을 가지는 네트워크 구조(Network decision model)에서도 사용될 수 있는 의사 결정모형( Analytic Network Process : ANP)을 도입한다. ANP로부터 얻어지는 각 의사결정요인의 가중치는 환경부하의 수준을 결정하는데 용이하게 이용할 수 있다.

  • PDF

퍼지 의사결정에 기반한 멀티에이전트의 효율적인 조정 방안 (Effective Coordination Method of Multi-Agent Based on Fuzzy Decision Making)

  • 류경현;정환묵
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2006년도 추계학술대회 학술발표 논문집 제16권 제2호
    • /
    • pp.247-250
    • /
    • 2006
  • 급속도로 변화하는 환경에 적응하기 위해서 환경의 변화에 대한 요구와 신속한 응답능력을 향상시키고, 에이전트간 의사결정의 지속시간을 줄이기 위하여 에이전트간 효율적인 조정에 관련된 의사결정을 하기위한 대안(alternative)결정과 사용자의 선호도를 어떻게 유도할 수 있는가라는 문제가 요구된다. 본 논문에서는 사회적(Pareto) 최적성이라는 관점에서 의사결정의 행동을 효과적으로 시뮬레이트하기 우해 퍼지 의사결정에 기반한 멀티에이전트의 효율적인 조정방안을 제안한다. 또한 제안하는 방법에서는 가중치를 사용하여 각 속성이 멀티에이전트와 관련하여 최적의 대안을 생성하고, 퍼지 의사결정에 기반한 멀티에이전트의 의사결정방법에 기존의 방법보다 가중치를 사용한 방법이 높은 신뢰도를 가지면서 더 빠른 의사결정을 한다는 것을 확인하였다.

  • PDF

시간 가중치 엔트로피를 이용한 결정 트리 생성 알고리즘 (ID3 Algorithm Improved with Time-weighted Entropy)

  • 동립권;이지형
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.625-627
    • /
    • 2005
  • 결정 트리(Decision Tree)는 주어진 데이터의 경향을 학습하는 데 사용되는 대표적인 방식이다. 이것은 주어진 데이터를 구조화하기 위하여 데이터의 속성과 정보의 엔트로피에 기반을 둔 정보획득량을 이용한다. 본 논문에서는 유비쿼터스 환경에서 사용자 프로파일 정보처럼 시간에 따라 그 경향이 변하는 데이터에 유용하게 적용할 수 있는 시간 가중치 엔트로피를 정의한다. 그리고 ID3 알고리즘을 기반으로 새롭게 제안하는 시간 가중치 엔트로피를 이용하는 향상된 ID3 알고리즘을 쓰고 사용자의 경향을 분석한다. 본 논문에서 제안하는 엔트로피를 이용하는 방식은 데이터들의 시간에 관한 영향을 고려해서 기준방식보다 분석결과가 더욱 유리하다. 두 방식의 비교 테스트 결과를 보면 시간 가중치 엔트로피를 이용하는 알고리즘은 기존의 ID3 알고리즘보다 구성된 트리의 구조가 매우 간단하고 유리하다.

  • PDF

가중치 정보를 이용한 한국어 동사의 의미 중의성 해소 (Word Sense Disambiguation of Korean Verbs Using Weight Information from Context)

  • 임수종;박영자;송만석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1998년도 제10회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.425-429
    • /
    • 1998
  • 본 논문은 문맥에서 추출한 가중치 정보를 이용한 한국어 동사의 의미 중의성 해소 모델을 제안한다. 중의성이 있는 단어가 쓰인 문장에서 그 단어의 의미 결정에 영향을 주는 단어들로 의미 결정자 벡터를 구성하고, 사전에서 그 단어의 의미 항목에 쓰인 단어들로 의미 항목 벡터를 구성한다. 목적 단어의 의미는 두 벡터간의 유사도 계산에 의해 결정된다. 벡터간의 유사도 계산은 사전에서 추출된 공기 관계와 목적 단어가 속한 문장에서 추출한 거리와 품사정보에 기반한 가중치 정보를 이용하여 이루어진다. 4개의 한국어 동사에 대해 내부실험과 외부실험을 하였다. 내부 실험은 84%의 정확률과 baseline을 기준으로 50%의 성능향상, 외부 실험은 75%의 정확률과 baseline을 기준으로 40 %의 성능향상을 보인다.

  • PDF

AHP를 이용한 CMS 평가방법에 관한 연구

  • 고일상;김병주;이철승
    • 한국정보기술응용학회:학술대회논문집
    • /
    • 한국정보기술응용학회 2002년도 추계공동학술대회 정보환경 변화에 따른 신정보기술 패러다임
    • /
    • pp.440-449
    • /
    • 2002
  • 본 연구는 최근 그 시장규모와 수요가 급격히 증가하고 있는 CMS의 평가방법론을 개발하기 위한 목적으로, CMS와 IT솔루션 평가이론에 대하여 고찰하여, CMS의 평가항목을 크게 '솔루션 특성', '공급벤더 역량', '구매업체 환경적합성'의 대항목으로 분류하고, '컨텐츠 관리기능', '비즈니스지원기능', '기술성', '경제성', '벤더수준', '서비스', '사후관리', '정보화계획적합성', '정보화설비적합성', '조직/인적자원적 합성'의 총 10가지 세부항목을 정의하였다. 또한 AHP 기법을 통하여 각 평가항목의 가중치를 결정하고, 과거 단순가중치법을 이용하여 도입된 CMS구매과정에 대한 사례연구를 실시하였다. 결과적으로 각 솔루션의 순위는 똑같이 결정되었으나, 과거 단순가중치법에 의해 산출된 각 솔루션의 득점비율과 본 사례연구를 통하여 도출된 상대적 선호도는 수치상 큰 차이가 존재하였다. 그 차이는 평가항목과 방법상의 차이에 의한 당연한 결과이지만, 솔루션의 선정이라는 중차대한 의사결정문제를 해결함에 있어, 보다 객관적이고 과학적인 방법론을 이용하여야 함을 시사하고 있다.

  • PDF