• 제목/요약/키워드: Importance Weights

검색결과 325건 처리시간 0.022초

점진적 특징 가중치 기법을 이용한 나이브 베이즈 문서분류기의 성능 개선 (Improving Naïve Bayes Text Classifiers with Incremental Feature Weighting)

  • 김한준;장재영
    • 정보처리학회논문지B
    • /
    • 제15B권5호
    • /
    • pp.457-464
    • /
    • 2008
  • 실제 운용 환경에서 자동문서분류시스템의 성공을 위해서 충분하지 못한 학습문서의 문제와 특징 공간들에 대한 사전지식이 없는 상황을 해결하는 것이 관건이다. 이런 맥락에서 많은 자동문서분류 시스템의 구축을 위해 나이브 베이즈 문서분류 알고리즘을 사용한다. 이는 기존 학습된 분류모델과 특징 공간을 점진적으로 갱신함으로써 분류모델을 향상시키는 것이 매우 용이하기 때문이다. 본 논문에서는 특징 가중치를 이용하여 문서분류기의 성능을 향상시키는 기법을 제안한다. 기본 아이디어는 문서분류 모델의 인자로서 특징들의 분포뿐만 아니라 각 특징들의 중요도를 반영하는 것이다. 속성 선택을 미리 수행하여 학습모델을 만드는 것이 아니라, 속성 중요도를 나이브 베이즈 학습 모델에 포함시킴으로써 보다 정확한 모델을 생성할 수 있다. 또한 동적 환경에서 점진적인 특징 가중치 부여를 위해 기존의 특징 갱신 기법을 확장한 알고리즘도 제안한다. 본 논문에서 제안된 기법을 평가하기 위해서 Reuters-21578과 20Newsgroup 문서집합 이용한 실험을 실시하여, 제안된 기법이 전통적인 나이브 베이즈 분류기의 성능을 크게 향상시킴을 증명한다.

교통약자의 이동편의를 위한 최적경로 탐색 기법 (Optimized Path Finding Algorithm for Walking Convenience of the People with Reduced Mobility)

  • 문미경;이영민;유기윤;김지영
    • 한국측량학회지
    • /
    • 제34권3호
    • /
    • pp.273-282
    • /
    • 2016
  • 최근 교통약자의 이동권에 대한 관심이 증가하고 있으나 대부분 제도적 시설 공급측면에 치중되어 일시적 이동상의 불편함만을 해소할 뿐이며 실제 교통약자에게 향상된 이동편의를 제공하지 못하고 있다. 따라서 본 연구에서는 교통약자의 보행에 영향을 미치는 경사로, 계단과 같은 물리적 장애 요소들을 고려하여 교통약자 유형별 최적경로를 탐색하는 기법을 제안함으로써 교통약자의 이동편의를 직접적으로 향상시키고자 한다. 선행연구 및 관련 제도를 분석하여 교통약자의 보행에 방해가 되는 보행장애요소를 선정하고 계층적의사결정법(Analytic Hierarchy Process; AHP)을 이용하여 각 보행장애요소의 상대적 중요도를 산정하였으며 마지막으로 퍼지 시스템을 통하여 교통약자의 보행에 방해되는 정도를 나타내는 링크별 보행방해도를 도출한다. 보행방해도를 바탕으로 거리 요소를 포함한 보행 경로비용을 계산하고 이 값이 최소가 되는 경로를 다익스트라 알고리듬을 통해 탐색함으로써 교통약자 유형별 최적 경로를 제공한다. 본 연구에서 제안한 기법을 적용하여 도출된 19개 경로를 대상으로 실제 현장 실험을 통하여 각 경로에 대한 만족도 설문조사를 수행하였고 이를 통해 실제 교통약자의 이동에 편의를 향상하는 유의미한 경로가 도출되었음을 확인하였다. 본 연구에서 제안한 최적경로 탐색 기법이 내비게이션 서비스에 적용된다면 교통약자의 이동복지향상을 도모할 수 있을 것으로 보인다.

통합 ELECTRE-CRITIC-ISM법 기반 해양사고 발생건수를 이용한 해사법원 설치 우선순위 평가에 관한 연구 (A Study on Evaluation of the Priority Orders for the Establishment of Maritime Courts Using Maritime Casualties Counts Based on Integrated ELECTRE-CRITIC-ISM)

  • 장운재
    • 해양환경안전학회지
    • /
    • 제26권6호
    • /
    • pp.624-633
    • /
    • 2020
  • 최근 인천, 부산 등 지자체를 중심으로 해사법원의 설치에 대해 논의 중이다. 본 연구의 목적은 통합 ELECTRE-CRITIC-ISM기법 기반 해양사고 발생건수를 이용하여 해사법원의 설치 우선순위 평가 모델을 개발하고, 우리나라 해사법원의 설치에 적용하여 유용성을 확인하기 위한 것이다. 이를 위해 먼저 31개의 무역항 중에서 해양사고 데이터가 통합 관리되는 9개의 무역항을 제외한 22개의 무역항을 대상으로 6개의 고등법원 관할에 매칭하였다. 두번째는 CRITIC법은 평가항목인 5년간의 해양사고 발생건수에 대하여 중요도를 산정하고 ELECTRE법과 결합하기 위해 이용되었다. 마지막으로 ELECTRE&ISM법은 해양사고 발생건수의 변동 폭을 고려한 고등법원 간 선호도 및 비선호도를 분석하고 우선순위를 평가하기 위해 이용되었다. 해양사고 발생건수의 변동 폭을 중간으로 고려하여 최종순위를 평가한 결과 부산고등법원이 1위, 광주고등법원은 2위, 서울고등법원 3위, 대전 및 대구고등법원은 4위, 수원고등법원은 6위로 우선순위가 높게 나타났다. 따라서 부산고등법원에 해사법원의 우선설치가 필요하다.

Genetic and Phenotypic Parameter Estimates of Body Weight at Different Ages and Yearling Fleece Weight in Markhoz Goats

  • Rashidi, A.;Sheikahmadi, M.;Rostamzadeh, J.;Shrestha, J.N.B.
    • Asian-Australasian Journal of Animal Sciences
    • /
    • 제21권10호
    • /
    • pp.1395-1403
    • /
    • 2008
  • The objective of the present study was to estimate genetic parameters for economic traits in Markhoz goats. Data collected from 1993 to 2006 by the Markhoz goat Performance Testing Station in Sanandaj, Iran, were analyzed. The traits recorded as body weight performance at birth (BW), weaning (WW), six month (6MW), nine month (9MW), yearling (YW) and yearling fleece weight (YFW) were investigated. Least square analyses were used for estimation of environmental effects. Genetic parameters were estimated with single and multi trait analysis using restricted maximum likelihood (REML) procedures, under animal models. By ignoring or including maternal additive genetic effects and maternal permanent environmental effects, five different models were fitted for each trait. The effects of sex, type of birth, age of dam and year of birth on the all body weights were significant (p<0.01), but had no effects on YFW except year of birth. Age of kids had significant influences on WW and 6MW (p<0.01). A log likelihood ratio test was carried out for choosing the most suitable model for each trait. Total heritability estimates for YFW and growth traits varied from 0.16 for YFW and WW to 0.41 for YW. For all traits, maternal heritability was lower than direct heritability, ranging from 0.06 for BW to 0.01 for 6MW and 9MW. The magnitude of $c^2$ was more substantial for BW than the others, and relative importance was reduced from 0.12 for BW to 0.04 for 9MW. The direct additive genetic correlations estimates were positive and varied from 0.21 between BW-YW to 0.96 between WW-6MW. Direct additive genetic correlations between YFW and body weight traits were positive and ranged from 0.14 between BW-YFW to 0.67 between 6MW-YFW. For all traits, the corresponding estimates for phenotypic correlation were positive and lower than genetic correlations. The maternal additive genetic correlations between various traits were varied and ranged from -0.19 between 9MW-YFW to 0.96 between 6MW-9MW. The estimates of the maternal permanent environmental correlations between various traits were positive and ranged from 0.33 between WW-YFW to 0.93 between WW-6MW. Also, the environmental correlations between various traits ranged from 0.01 between BW-YFW and WW-YFW to 0.70 between 9MW-YW. Estimates of genetic parameters for various traits in this study confirm that selection should be applied on WW for genetic improvement in Markhoz goats.

굼벨 분포 모델을 이용한 표절 프로그램 자동 탐색 및 추적 (Automated Detecting and Tracing for Plagiarized Programs using Gumbel Distribution Model)

  • 지정훈;우균;조환규
    • 정보처리학회논문지A
    • /
    • 제16A권6호
    • /
    • pp.453-462
    • /
    • 2009
  • 소프트웨어의 지적 재산권 보호 및 인증에 대한 관심과 중요성이 커지면서 소프트웨어에 대한 표절 탐색 및 보호, 판단에 대한 연구가 활발 하게 진행되고 있다. 지금까지 표절에 대한 연구는 주로 속성 계산, 토큰 패턴, 프로그램 파스트리, 유사도 측정 알고리즘 등을 이용해 두 프로 그램을 비교하는데 초점을 두었다. 이와 더불어, 표절과 협동(collaboration)을 구분하는 것은 표절연구에서 매우 중요하다. 본 논문에서는 극단 치 분포 확률 모델을 이용한 소스코드 클러스터링을 위한 알고리즘을 제안한다. 본 논문에서는 먼저 두 프로그램 먼저 두 프로그램 $P_a$$P_b$ 의 유사도를 측정하는 비대칭거리측정함수 pdist($P_a$, $P_b$)를 제안하고, 모든 소스코드 쌍에 대해 pdist($P_a$, $P_b$)를 통해 측정된 유사도를 간선무게로 하는 표절방 향그래프(PDG)를 생성한다. 그리고 본 논문에서는 표절방향그래프를 굼벨거리그래프(GDG)로 변환한다. pdist($P_a$, $P_b$) 점수 분포는 극단치 확률 분포로 잘 알려진 굼벨분포(Gumbel distribution)와 매우 유사하다. 또한, 본 논문에서는 의사표절(pseudo- plagiarism)을 새롭게 정의한다. 의사표절은 프로그램의 강한 기능적 제약사항으로 인해 발생하는 가상 표절의 한 종류이다. 본 논문에서는 ICPC(International Collegiate Programming Contest)와 KOI(Korean Olympiad for Informatics) 대회에 제출된 18개 프로그램 그룹의 700개 이상의 소스코드에 대해 실험을 진행하였다. 실험결과 프로그램 그룹에 포함된 표절 프로그램들을 찾았으며, 소스코드 클러스터링 알고리즘은 의사표절과 실제표절 프로그램 그룹을 효과적으로 구분하였다.

공공기관 지원사업 선정평가 프레임워크 개발 및 적용: 모바일 앱 서비스 지원사업 선정사례 중심 (A Case Study on the Evaluation Framework of a New Service Model in the Public Sector: Focusing on the Mobile Application Project)

  • 배성준;김은희;고준
    • 경영정보학연구
    • /
    • 제14권2호
    • /
    • pp.117-140
    • /
    • 2012
  • 공공분야 신규 서비스 모델의 평가는 성과가 도출되지 않은 상태에서 진행해야 한다는 점에서 그 어려움이 크므로, 산업 육성 및 경제 활성화를 위한 공공 지원사업의 성과를 높일 수 있는 합리적인 평가체계가 필요하다. 본 연구의 목적은 공공기관에서 지원하는 사업의 선정평가 프레임워크를 개발함으로써 보다 합리적인 공공 지원사업 평가체계를 제시하고, 개발된 평가체계를 최근 많은 관심을 받고 있는 모바일 앱 서비스 사업에 적용해 봄으로써 그 활용가능성을 타진해 보는 것이다. 기존 관련 문헌연구와 현재 활용되고 있는 평가체계를 바탕으로 평가항목을 발굴하고, 전문가그룹의 인터뷰와 계층적 분석방법(AHP)을 통해 평가지표 및 가중치를 산정하여 선정평가 프레임워크를 개발하였다. 모바일 앱 서비스 지원사업에 적용할 새로운 평가체계를 위한 평가항목으로 시장지향성, 기술지향성, 서비스 개발역량, 정책지향성을 도출하였고, 각각 세부 평가지표를 발굴함으로써 평가체계를 구성하였다. 앱 개발을 통한 사업화 성과 달성을 목표로 하는 사업의 특성상 응답자들은 평가항목 중 시장지향성을 가장 중요하게 생각했고, 평가지표 중에서는 목표시장과 고객, 수익구조와 경제성 등을 우선순위로 꼽았다. 또한, 이를 활용하여 기존 평가 체계에 의한 앱 개발 지원사업의 재평가를 실시함으로써 실제 기업의 성과 창출에 더 적합한 평가 모델로서의 가능성을 살펴보았고, 본 연구에서 제시한 평가체계가 실제 기업의 성과와 보다 유사한 것으로 나타났다. 연구 결과, 실제 공공기관 지원사업의 선정평가에 적용할 수 있는 평가체계로서의 가능성을 확인했으며, 이를 통해 보다 경쟁력 있는 기업의 과제를 선정함으로써 사업의 목표를 달성하고 성과를 제고할 수 있을 것으로 기대된다. 이와 유사한 지원사업 및 과제에도 적용하여 기업의 프로젝트 수행능력을 배양하고, 공공 지원사업을 통한 산업의 육성과 정책적 성과 제고에 기여할 수 있는 시사점을 도출했다는데 본 연구의 의의가 있다.

  • PDF

절단된 분포를 이용한 인공신경망에서의 초기값 설정방법 (Initialization by using truncated distributions in artificial neural network)

  • 김민종;조성철;정혜린;이영섭;임창원
    • 응용통계연구
    • /
    • 제32권5호
    • /
    • pp.693-702
    • /
    • 2019
  • 딥러닝은 대용량의 데이터의 분류 및 예측하는 방법으로 각광받고 있다. 데이터의 양이 많아지면서 신경망의 구조는 더 깊어 지고 있다. 이때 초기값이 지나치게 클 경우 층이 깊어 질수록 활성화 함수의 기울기가 매우 작아지는 포화(Saturation)현상이 발생한다. 이러한 포화현상은 가중치의 학습능력을 저하시키는 현상을 발생시키기 때문에 초기값의 중요성이 커지고 있다.이런 포화현상 문제를 해결하기 위해 Glorot과 Bengio (2010)과 He 등 (2015) 층과 층 사이에 데이터가 다양하게 흘러야 효율적인 신경망학습이 가능하고 주장했다. 데이터가 다양하게 흐르기 위해서는 각 층의 출력에 대한 분산과 입력에 대한 분산이 동일해야 한다고 제안했다. Glorot과 Bengio (2010)과 He 등 (2015)는 각 층별 활성화 값의 분산이 같다고 가정해 초기값을 설정하였다. 본 논문에서는 절단된 코쉬 분포와 절단된 정규분포를 활용하여 초기값을 설정하는 방안을 제안한다. 출력에 대한 분산과 입력에 대한 분산의 값을 동일하게 맞춰주고 그 값이 절단된 확률분포의 분산과 같게 적용함으로써 큰 초기값이 나오는 걸 제한하고 0에 가까운 값이 나오도록 분포를 조정하였다. 제안된 방법은 MNIST 데이터와 CIFAR-10 데이터를 DNN과 CNN 모델에 각각 적용하여 실험함으로써 기존의 초기값 설정방법보다 모델의 성능을 좋게 한다는 것을 보였다.

개인정보의 안전성 확보조치 기준에서의 우선순위 정립에 관한 연구 (A Study on Priority Rankings of Actions Providing Personal Information Security)

  • 김영희;국광호
    • 융합보안논문지
    • /
    • 제14권4호
    • /
    • pp.9-17
    • /
    • 2014
  • 정보화 및 인터넷의 급속한 발전에 따라 개인정보를 취급하는 기업에서 개인정보의 안전한 취급 관리를 위한 조치를 취하지 않아 개인정보가 유출되고 오 남용되는 사례가 빈번히 발생하고 있다. 이에 국내에서는 개인정보주체의 프라이버시 보호와 피해를 줄이기 위해 개인정보보호 관련 법제를 강화하고 관련 법제를 바탕으로 개인정보처리자가 개인정보를 보호하기 위한 안전성 확보조치 기준을 마련하고 따르도록 하고 있다. 그러나 개인정보의 안전성 확보조치 기준항목의 경우 각 개인정보 처리 기업의 특성 및 항목별 중요도에 따른 우선 적용 기준 등이 고려되지 않아 이행에 어려움이 따르고 있다. 따라서 본 연구에서는 개인정보의 안전성 확보조치 기준들의 세부적인 사항들을 기존 문헌 연구와 관련 법률을 통해 평가 기준을 도출하고, 평가 기준의 정량화 및 계층화를 위해 KJ (Kawakita Jiro) 기법을 이용하여 유사기준 항목의 통합 및 그룹화를 하여 계층구조를 생성한다. 이렇게 생성된 계층 구조를 AHP (Analytical Hierarchy Process) 기법을 이용해 전문가 대상으로 가중치 산정하여 기업에서 보다 합리적이고 효율적인 개인정보보호를 위한 우선순위 제안을 목적으로 한다.

환경적으로 안전한 농업과 미래용도를 위한 토질 기준 평가 검토 (Review of Assessing Soil Quality Criteria for Environmentally-Sound Agricultural Practics and Future Use)

  • Doug Young Chung
    • 한국토양환경학회지
    • /
    • 제3권2호
    • /
    • pp.127-145
    • /
    • 1998
  • 인간의 건강에 관련된 수질이나 대기의 기준설정과는 달리, 토질은 지협적이고 한정적인 토양의 기능과 이와 관련된 환경요소에 근거한다. 적정한 토질평가제도는 안전한 식품을 생산하거나, 인간과 동물의 건강증진, 그리고 토양의 퇴화 과정을 나타내는 토양성능 지표의 역할을 하여야 한다. 이에 필요한 요소는 첫째로 수분이동과 흡착의 용이성, 둘째로 식물생장의 유지, 셋째로 토양의 물리적 붕괴에 대한 저항성, 넷째로 안전한 식품생산 기반이다. 그리고 끝으로 비용 절감 농업관리와 식품생산 요소로서 토양은 토양과 수질의 영역, 식품사슬, 지속성과 효용성, 환경과 경제성을 포함하여야 한다. 토질지표는 기본 골격 내에서 각각의 기능에 대하여 여러 단계로 분리되며, 각각의 지표는 체계의 원칙에 근거하여 다목적 접근방법을 사웅하여 상대적 중요도를 반영하는 우선 순위와 가중치를 정한다. 각각의점수 환산체계는 낮은 단계부터 높은 단계로 또는 0주터 10의 범위에서 여러 단계로 등급화되어야 한다. 그리고 각각의 범위 수치에 가중치를 곱하고 그리고 토양의 여러 가지의 물리화학적 특성이 고려된 종합 토질등급으로 결론지어져야 된다. 토질 평가 방법을 개발하는데 필요한 기본 골격과 과정은 해당 지역의 대체 또는 기존의 농업방식으로 얻어진 정보를 사용함으로서 결정된다. 토질에 있어서 부수적인 과정, 관리방법, 그리고 정책의 효과를 검증하기 위한 확장된 기본골격의 용도 또한 고려되어져야 한다. 이외에도 하나의 가능한 토질지수의 형태를 개발하기 위해서는 토양의 특성과 토양 내로 유입되는 또는 기존의 화학물질을 연계시켜야된다. 이 연구는 토질의 평가 시 고려되어야 될 요소를 찾기 위한 접근 방법을 제시하고자 한다.

  • PDF

Print Mottle : Causes and Solutions from Paper Coating Industry Perspective

  • Lee, Hak-Lae
    • 펄프종이기술
    • /
    • 제40권5호
    • /
    • pp.60-69
    • /
    • 2008
  • The principal reasons for applying a pigment coating to paper are to improve appearance and printability. The pigment coating provides a surface that is more uniform and more receptive to printing ink than are the uncoated fibers and, in turn, both facilitates the printing process and enhances the graphic reproduction. The improvement in print quality is readily apparent, especially in image areas or when multiple colors are involved. Although pigment coating of paper is to improve the printability, coated paper is not completely free from printing defects. Actually there are a number printing defects that are observed only with the coated papers. Among the printing defects that are commonly observed for coated papers, print mottle during multi-color offset printing is one of the most concerned defects, and it appears not only on solid tone area but also half dot print area. There are four main causes of print mottle ranging from printing inks, dampening solution, paper, and printing press or its operation. These indicates that almost every factors associated with lithographic printing can cause print mottle. Among these variation of paper quality influences most significantly on print mottle problems in multicolor offset printing, and this indicates that paper is most often to be blamed for its product deficiency as far as print mottle problems are concerned. Furthermore, most of the print mottle problems associated with paper is observed when coated papers are printed. Uncoated papers rarely show mottling problems. This indicates that print mottle is the most serious quality problems of coated paper products. Overcoming the print mottle is becoming more difficult because the operating speeds of coating and printing machines are increasing, coating weights are decreasing, and the demands on high-quality printing are increasing. Print mottle in offset printing is caused by (a) nonuniform back trap of ink caused by a nonuniform rate of ink drying, referred as "back trap mottle, and (b) nonuniform absorption of the dampening solution. Furthermore, both forms of print mottle have some relationship to the structure of the coated layer. The surest way of eliminating ink mottling is to eliminate unevenness in the base paper. Coating solutions, often easier to put into practice, should, however, be considered. In this paper the principal factors influencing print mottle of coated papers will be discussed. Especially the importance of base paper roughness, binder migration, even consolidation of coating layers, control of the drying rate, types of binders, etc. will be described.