• 제목/요약/키워드: vector algorithm

검색결과 3,096건 처리시간 0.033초

다분류 SVM을 이용한 DEA기반 벤처기업 효율성등급 예측모형 (The Prediction of DEA based Efficiency Rating for Venture Business Using Multi-class SVM)

  • 박지영;홍태호
    • Asia pacific journal of information systems
    • /
    • 제19권2호
    • /
    • pp.139-155
    • /
    • 2009
  • For the last few decades, many studies have tried to explore and unveil venture companies' success factors and unique features in order to identify the sources of such companies' competitive advantages over their rivals. Such venture companies have shown tendency to give high returns for investors generally making the best use of information technology. For this reason, many venture companies are keen on attracting avid investors' attention. Investors generally make their investment decisions by carefully examining the evaluation criteria of the alternatives. To them, credit rating information provided by international rating agencies, such as Standard and Poor's, Moody's and Fitch is crucial source as to such pivotal concerns as companies stability, growth, and risk status. But these types of information are generated only for the companies issuing corporate bonds, not venture companies. Therefore, this study proposes a method for evaluating venture businesses by presenting our recent empirical results using financial data of Korean venture companies listed on KOSDAQ in Korea exchange. In addition, this paper used multi-class SVM for the prediction of DEA-based efficiency rating for venture businesses, which was derived from our proposed method. Our approach sheds light on ways to locate efficient companies generating high level of profits. Above all, in determining effective ways to evaluate a venture firm's efficiency, it is important to understand the major contributing factors of such efficiency. Therefore, this paper is constructed on the basis of following two ideas to classify which companies are more efficient venture companies: i) making DEA based multi-class rating for sample companies and ii) developing multi-class SVM-based efficiency prediction model for classifying all companies. First, the Data Envelopment Analysis(DEA) is a non-parametric multiple input-output efficiency technique that measures the relative efficiency of decision making units(DMUs) using a linear programming based model. It is non-parametric because it requires no assumption on the shape or parameters of the underlying production function. DEA has been already widely applied for evaluating the relative efficiency of DMUs. Recently, a number of DEA based studies have evaluated the efficiency of various types of companies, such as internet companies and venture companies. It has been also applied to corporate credit ratings. In this study we utilized DEA for sorting venture companies by efficiency based ratings. The Support Vector Machine(SVM), on the other hand, is a popular technique for solving data classification problems. In this paper, we employed SVM to classify the efficiency ratings in IT venture companies according to the results of DEA. The SVM method was first developed by Vapnik (1995). As one of many machine learning techniques, SVM is based on a statistical theory. Thus far, the method has shown good performances especially in generalizing capacity in classification tasks, resulting in numerous applications in many areas of business, SVM is basically the algorithm that finds the maximum margin hyperplane, which is the maximum separation between classes. According to this method, support vectors are the closest to the maximum margin hyperplane. If it is impossible to classify, we can use the kernel function. In the case of nonlinear class boundaries, we can transform the inputs into a high-dimensional feature space, This is the original input space and is mapped into a high-dimensional dot-product space. Many studies applied SVM to the prediction of bankruptcy, the forecast a financial time series, and the problem of estimating credit rating, In this study we employed SVM for developing data mining-based efficiency prediction model. We used the Gaussian radial function as a kernel function of SVM. In multi-class SVM, we adopted one-against-one approach between binary classification method and two all-together methods, proposed by Weston and Watkins(1999) and Crammer and Singer(2000), respectively. In this research, we used corporate information of 154 companies listed on KOSDAQ market in Korea exchange. We obtained companies' financial information of 2005 from the KIS(Korea Information Service, Inc.). Using this data, we made multi-class rating with DEA efficiency and built multi-class prediction model based data mining. Among three manners of multi-classification, the hit ratio of the Weston and Watkins method is the best in the test data set. In multi classification problems as efficiency ratings of venture business, it is very useful for investors to know the class with errors, one class difference, when it is difficult to find out the accurate class in the actual market. So we presented accuracy results within 1-class errors, and the Weston and Watkins method showed 85.7% accuracy in our test samples. We conclude that the DEA based multi-class approach in venture business generates more information than the binary classification problem, notwithstanding its efficiency level. We believe this model can help investors in decision making as it provides a reliably tool to evaluate venture companies in the financial domain. For the future research, we perceive the need to enhance such areas as the variable selection process, the parameter selection of kernel function, the generalization, and the sample size of multi-class.

산림 총일차생산량 예측의 공간적 확장을 위한 인공위성 자료와 기계학습 알고리즘의 활용 (Application of Machine Learning Algorithm and Remote-sensed Data to Estimate Forest Gross Primary Production at Multi-sites Level)

  • 이보라;김은숙;임종환;강민석;김준
    • 대한원격탐사학회지
    • /
    • 제35권6_2호
    • /
    • pp.1117-1132
    • /
    • 2019
  • 산림생태계 내의 총일차생산량은 산림 자원 생산량과 직결되고, 산림생태계의 건강성, 산림식물계절 및 생태계 서비스의 중요한 지표가 된다. 이 연구에서는 인공위성 자료와 기계학습 알고리즘을 활용하여 우리 나라의 산림유역의 총일차생산량을 연구하였다. 에디공분산 타워가 있는 6개 지점에서의 MODIS (Moderate Resolution Imaging Spectroradiometer) 산출물과 에디공분산타워의 총일차생산성으로 연구기간의 75%-80%에 해당하는 자료로 기계학습 알고리즘을 훈련하고 나머지 기간으로 구축된 모델의 총일차생산성 예측 결과를 검증하였다. 모델을 구축할 때 MODIS 지상 산출물과 대기 산출물을 조합하여 새로운 입력자료(e.g., 포화수증기압차)를 모델의 입력자료(Processed MODIS)로 사용하였을 때와 이러한 과정 없이 QC(Quality control)만 거친 MODIS 산출물을 그대로 입력자료(Unprocessed MODIS)로 사용하였을 때의 총일차생산량을 비교해 보고 그 활용 가능성에 대해 고찰하였다. 추가로 MODIS 총일차생산량 산출물(MYD17)과 에디공분산 총일차생산성 및 기계학습 알고리즘 기반의 총일차생산성과의 상관관계를 보고 그 적합성에 대해 논의하였다. 이 연구에서 사용된 기계학습 알고리즘은 Support Vector Machine (SVM)으로 산림생태계 연구에서 가장 많이 사용되고 있는 기계학습 알고리즘 중 하나이다. 기계학습 알고리즘 기반(SVM 모델)의 총일차생산량 예측 결과는 MODIS 총일차생산량 산출물(MYD17)보다 에디공분산 총일차생산량과 전반적으로 높은 상관관계를 보였고 특히 식생 성장을 시작하는 시점의 값을 좀더잘 예측하는 결과를 보였다. 단일 지역에서 Unprocessed MODIS 입력자료로 훈련된 SVM 모델 결과는 피어슨 상관계수 0.75 - 0.95 (p < 0.001), 6개의 연구 지점에서 훈련된 SVM 모델 결과는 피어슨 상관계수 0.77 - 0.94 (p < 0.001) 사이를 보였다. 이 결과는 훈련 자료에 다양한 이벤트들이 포함되면 모델의 예측력이 향상되는 가능성을 보여주었고 위성영상의 산출물을 재계산하여 새로운 산출물을 내는 과정을 거친 위성 자료가 아니어도 그 예측력에는 크게 문제가 없음을 보여주었다.

포렌식 마킹을 위한 특징점 기반의 동적 멀티미디어 핑거프린팅 코드 설계 (A Design on the Multimedia Fingerprinting code based on Feature Point for Forensic Marking)

  • 이강현
    • 전자공학회논문지CI
    • /
    • 제48권4호
    • /
    • pp.27-34
    • /
    • 2011
  • 본 논문에서는 멀티미디어 콘텐츠 보호에 대한 반공모 코드를 위한 동적 멀티미디어 핑거프린팅 코드를 설계하는 알고리즘을 제안한다. 기존의 반공모 코드(ACC: Anti-Collusion Code)를 위한 멀티미디어 핑거프린팅 코드는 BIBD(Balanced Incomplete Block Design)의 접속행렬을 보수행렬로 변환하여 k를 k+1로 증대시키는 수리적 방법으로 설계되었다. 그리고 보수행렬의 코드벡터를 사용자에게 핑거프린팅 코드로 부여하고, 콘텐츠에 삽입하였다. 제안된 알고리즘에서는 사용자가 구매하는 콘텐츠로부터 특징점을 추출하고, 이를 기반으로 동적으로 핑거프린팅 코드를 설계할 수 있도록 BIBD의 v와 k+1 조건을 만족하는 반공모 코드의 후보성 코드를 코드북(Codebook)에 구축하고 ${\lambda}+1$ 조건을 만족하는 행렬(이하, Rhee행렬이라 함.)을 생성한다. 실험을 통하여 콘텐츠의 특징점 기반으로 생성된 Rhee행렬의 코드벡터는 v비트의 유의수준 ($1-{\alpha}$)에서 신뢰구간에 k가 존재하며, Rhee행렬의 각 행과 행, 열과 열 사이의 유클리디안 거리가 BIBD 기반의 보수행렬과 그래프 기반의 보수행렬과 같은 k값이 산출되었다. 더욱이 Rhee행렬의 첫 행과 첫 열은 생성과정에서 초기 점화벡터로 콘텐츠 포렌식 마크 정보가 되며, 이와 관계가 있는 나머지 코드벡터들과의 관계성이 코드북에 기록되어 있기 때문에, 공모된 코드를 추적할 때 원 핑거프린팅 코드의 상관관계 계수를 구할 필요 없이 코드북의 탐색으로 공모자를 추적이 용이하다. 따라서 본 논문에서 생성된 Rhee행렬은 수리적으로 생성된 BIBD 기반의 행렬보다 ACC로서 강인성과 충실도가 우수하다.

전통문화 콘텐츠 표준체계를 활용한 자동 텍스트 분류 시스템 (A System for Automatic Classification of Traditional Culture Texts)

  • 허윤아;이동엽;김규경;유원희;임희석
    • 한국융합학회논문지
    • /
    • 제8권12호
    • /
    • pp.39-47
    • /
    • 2017
  • 한국 문화의 역사, 전통과 관련된 디지털 웹 문서가 증가하게 되었다. 하지만 창작자 또는 전통 문화와 관련된 소재를 찾는 사용자들은 정보를 검색해도 결과가 충분하지 않았으며 원하는 정보를 얻지 못하는 경우가 나타나고 있다. 이런 효과적인 정보를 접하기 위해서는 문서 분류가 필요하다. 과거에 문서 분류는 작업자가 수작업으로 문서 분류하여 시간과 비용이 많이 소비하는 어려움이 있었지만, 최근 기계학습 기반으로 한 자동 문서 분류를 통해 효율적인 문서 분류가 이루어진다. 이에 본 논문은 전통문화 콘텐츠를 체계적인 분류체계로 구성한 한민족정보문화마당 데이터를 기반으로 전통문화 콘텐츠 자동 텍스트 분류 모델을 개발한다. 본 연구는 한민족정보문화마당 텍스트 데이터에 대해 단어 빈도수를 추출하기 위해 TF-IDF모델, Bag-of-Words 모델, TF-IDF/Bag-of-Words를 결합한 모델을 적용하여 각각 SVM 분류 알고리즘을 사용하여 전통문화 콘텐츠 자동 텍스트 분류 모델을 개발하여 성능평가를 확인하였다.

다차원 컬러벡터 기반 백태 및 황태 분류 판별함수 설계 (Design of Discriminant Function for White and Yellow Coating with Multi-dimensional Color Vectors)

  • 이전;최은지;유현희;이혜정;이유정;박경모;김종열
    • 한국한의학연구원논문집
    • /
    • 제13권2호통권20호
    • /
    • pp.47-52
    • /
    • 2007
  • In Oriental medicine, the status of tongue is the important indicator to diagnose one's health, because it represents physiological and clinicopathological changes of inner parts of the body. The method of tongue diagnosis is not only convenient but also non-invasive, therefore, tongue diagnosis is one of the most widely used in Oriental medicine. But tongue diagnosis is affected by examination circumstances a lot. It depends on a light source, degrees of an angle, doctor's condition and so on. So it is not easy to make an objective and standardized tongue diagnosis. As part of way to solve this problem, in this study, we tried to design a discriminant function for white and yellow coating with multi-dimensional color vectors. There were 62 subjects involved in this study, among them 48 subjects diagnosed as white-coated tongue and 14 subjects diagnosed as yellow-coated tongue by oriental doctors. And their tongue images were acquired by a well-made Digital Tongue Diagnosis System. From those acquired tongue images, each coating section were extracted by oriental doctors, and then mean values of multi -dimensional color vectors in each coating section were calculated. By statistical analysis, two significant vectors, R in RGB space and H in HSV space, were found that they were able to describe the difference between white coating section and yellow coating section very well. Using these two values, we designed the discriminant function for coating classification and examined how good it works. As a result, the overall accuracy of coating classification was 98.4%. We can expect that the discriminant function for other coatings can be obtained in a similar way. Furthermore, if an automated segmentation algorithm of tongue coating is combined with these discriminant functions, an automated tongue coating diagnosis can be accomplished.

  • PDF

H.264/AVC의 시간적 오류 은닉을 위한 경계 정합과 후처리 방법 (A Boundary Matching and Post-processing Method for the Temporal Error Concealment in H.264/AVC)

  • 이준우;나상일;원인수;임대규;정동석
    • 한국멀티미디어학회논문지
    • /
    • 제12권11호
    • /
    • pp.1563-1571
    • /
    • 2009
  • H.264/AVC의 시간적 오류 은닉을 위한 새로운 경계 정합 방법과 은닉된 영상의 화질 향상을 위한 후처리 방법을 제안한다. 시간적 오류 은닉은 참조 프레임에서 가장 유사한 블록으로 오류가 발생한 블록을 대체시키는 방법이다. 가장 유사한 블록을 찾기 위해 H.264/AVC에서는 오류가 발생한 블록의 바깥 경계의 화소값과 참조블록의 안쪽 경계의 화소값을 단순 비교한다. 그러나 기존의 방법은 좁은 범위의 화소값 만을 비교하므로 부정확한 블록으로 오류 블록을 대체할 확률이 높다. 본 논문에서는 더욱 정확한 블록으로 오류 블록을 대체하기 위하여 참조 블록의 안쪽 경계의 화소값과 바깥 경계의 화소값을 오류 블록의 바깥 경계의 화소값과 비교하고 후보 움직임 벡터의 최솟값과 최댓값을 기준으로 일정 검색 범위내의 추가적인 후보 움직임 벡터를 설정하는 보다 향상된 경계 정합 방법, 그리고 변형된 디블록킹 필터를 통해 오류 없이 복호된 블록과 오류가 은닉된 블록과의 경계를 부드럽게 하는 후처리 방법을 제안한다. 실험을 통하여 제안된 방법이 기존의 블록 정합방법보다 최대 약 0.9 dB의 화질 향상을 보여주는 것을 확인하였다.

  • PDF

센서리스 위치오차보상기능을 가지고 있는 공기압축기 구동용 영구자석 동기모터의 센서리스 속도제어 (Sensorless Speed Control of PMSM for Driving Air Compressor with Position Error Compensator)

  • 김윤현;김솔
    • 한국산학기술학회논문지
    • /
    • 제19권3호
    • /
    • pp.104-111
    • /
    • 2018
  • 본 논문은 무급유식 공기 압축기가 널리 확산됨에 따라 영구자석형 동기 모터를 이용한 고효율 공기 압축기의 센서리스 제어에 관한 논문이다. 공기 압축기는 특성상 위치 센서를 설치하기 어려운 문제를 가지고 있다. 영구자석형 동기모터를 가변속 제어하기 위해서는 회전자의 위치를 파악하기 위한 위치센서가 필수적이다. 따라서 영구자석형 동기모터를 압축기에 활용하기 위해서는 센서리스제어가 필수적이다. 센서리스제어 방식으로 널리 사용되고 있는 역기전력을 통한 위치추정방식은 정지좌표계의 사용으로 인한 위상지연으로 인한 위치오차가 발생하게 되거나, 동기좌표계의 사용으로 인한 과도상태에서 추정역기전력이 오차를 포함하여 발산의 문제 등이 발생되는 문제가 있다. 따라서 본 논문에서는 회전각 추적 관측기를 사용하여 위치와 속도를 추정하고 외란 관측기를 통하여 속도의 리플을 저감시키는 방안을 제시하였다. 프리스케일사의 MPU를 이용하여 실험장치를 구성하고 구현실험을 통하여 제안한 알고리즘의 타당성을 검토하였다. 일정 시점에서 위치오차를 강제로 주더라도 위치보정 값이 위치오차 값을 찾아가며 추정위치가 실제 벡터 위치로 수렴해감을 검증하였다.

토픽모델링을 활용한 SIAM Journal on Applied Mathematics의 연구 동향 분석 (Analysis of Research Trends in SIAM Journal on Applied Mathematics Using Topic Modeling)

  • 김성연
    • 한국산학기술학회논문지
    • /
    • 제21권7호
    • /
    • pp.607-615
    • /
    • 2020
  • 본 연구는 텍스트 마이닝 기법을 이용하여 산업수학과 관련한 논문들의 연구 현황 및 동향을 파악하는데 목적이 있다. 이를 위해 R로 1970년부터 2019년까지 SIAM Journal on Applied Mathematics 총 4910편 논문의 제목, 초록, 주제어를 수집하였으며, LDA 알고리즘 기반의 토픽모델링 분석을 수행하였다. 수집된 자료에 대한 coherence score 분석 결과, 토픽의 최적 개수는 20개로 결정하였으며, 핵심 연구 주제들은 Gibbs 샘플링 방법을 기반으로 추출하였다. 주요 분석 결과는 다음과 같다. 첫째, 해석학과 대수학을 중심으로 계산수학, 기하학, 수학적 모델링, 위상수학, 이산수학, 확률 및 통계학 등 다양한 수학 분야에서 산업수학 관련 연구가 진행되었다. 둘째, 연대별 연구 주제의 동향을 분석한 결과, 상승하는 연구 주제는 수리생물학, 비선형편미분방정식, 이산수학, 통계학, 위상수학으로, 하강하는 연구 주제는 확률론만 나타났다. 셋째, 2015개정 수학교육과정에서 반영되지 않은 분야 중 고등학교 수학교육과정에서 다루어야 할 내용으로 기수법, 행렬, 공간벡터, 복소수가 도출되었다. 마지막으로 분석 결과를 바탕으로 우리나라의 산업수학 활성화 방안과 본 연구의 제한점 및 후속 연구를 제시하였다.

개방환경에서 지형정보의 웹지도화 방법과 적용에 관한 연구 (A Study on the Web Mapping Method and Application of the Topographic Information in an Open Environment)

  • 김남신
    • 한국지역지리학회지
    • /
    • 제13권5호
    • /
    • pp.563-575
    • /
    • 2007
  • 본 연구는 개방환경에서 지형정보 웹지도화를 통한 활용가능성에 대한 검토 분석이다. 웹지형도는 기존 지형도의 기능을 수행하면서 동적인 지형정보 활용을 위한 기능과 분석, 시각화에 초점을 두고자 하였다. 웹지형정보도의 주요 기능 구현으로는 공간검색, 확대 축소, 이동, 토지이용 정보, 사용자정의 3차원 표현, 지형단면 및 고도분석, 거리분석, 지역간 경로안내, 지역검색, 필드정보, 지역 영상정보 등이다. 이러한 기능을 수행하기 위해 SVG, MYSQL, PHP, XML을 사용하였다. 공간정보는 SVG를 이용하여 표현되도록 하였다. SVG는 소스가 개방되어 누구나 쉽게 사용할 수 있을 뿐만 아니라, 웹언어를 통한 데이터베이스 연동, 지도학적 표현이 효과적이다. 본 연구에서 중점을 두어 개발한 기능은 사용자 정의 3차원지도, 지형단면도, 최단경로 분석이다. 3차원지도는 수치고도모델을 제작하여 고도에 따른 픽셀에 불투명도 간을 부여하여 태양빛에 따라 입체영상이 표현되도록 하였다. 지형단면분석은 사용자가 범위를 지정하면 수치고도모델의 고도간을 데이터베이스에서 가져와 지형단면도과 통계정보가 나타나도록 하였다. 지역간 최단경로는 다익스트라 알고리즘을 적용하여 개발하였다. 앞으로 WebGIS는 정보전달 보다는 사용자 제공 지리정보(WebGIS 2.0) 확산에 더 기여할 것으로 예상된다. 이를 위하여 보다 많은 WebGIS 에 대한 연구개발이 요구된다.

  • PDF

입술 영역의 움직임과 밝기 변화를 이용한 음성구간 검출 알고리즘 개발 (Voice Activity Detection using Motion and Variation of Intensity in The Mouth Region)

  • 김기백;유제웅;조남익
    • 방송공학회논문지
    • /
    • 제17권3호
    • /
    • pp.519-528
    • /
    • 2012
  • 음성구간을 검출하는 일반적인 방법은 음향신호로부터 특징값을 추출하여 판별식을 거치는 것이다. 그러나 잡음이 많은 환경에서 그 성능은 당연히 저하되며, 이 경우 영상신호를 이용하거나 영상과 음성을 동시에 사용함으로써 성능향상을 도모할 수 있다. 영상신호를 이용하여 음성구간을 검출하는 기존 방법들에서는 액티브 어피어런스 모델, 옵티컬 플로우, 밝기 변화 등 주로 하나의 특징값을 이용하고 있다. 그러나 음성구간의 참값은 음향신호에 의해 결정되므로 한 가지의 영상정보만으로는 음성구간을 검출하는데 한계를 보이고 있다. 본 논문에서는 입술 영역의 옵티컬 플로우와 밝기 변화 두 가지 영상정보로부터 특징값을 추출하고, 추출된 특징값들을 결합하여 음성구간을 검출하는 알고리즘을 제안하고자 한다. 또한, 음성구간 검출 알고리즘이 다른 시스템의 전처리로 활용되는 경우에 적은 계산량만으로 수행되는 것이 바람직하므로, 통계적 모델링에 의한 방법보다는 추출된 특징값으로부터 간단한 대수적 연산만으로 스코어를 산정하여 문턱값과 비교하는 방법을 제안하고자 한다. 입술 영역 검출을 위해서는 얼굴에서 가장 두드러진 특징점을 갖는 눈을 먼저 검출한 후, 얼굴의 구조와 밝기값을 이용하는 알고리즘을 제안하였다. 실험 결과 본 논문에서 제안하는 두 가지 특징값을 결합한 음성구간 검출 알고리즘이 하나의 특징값만을 이용했을 때보다 우수한 성능을 보임을 확인할 수 있다.