• 제목/요약/키워드: process mining

검색결과 1,061건 처리시간 0.028초

다분류 SVM을 이용한 DEA기반 벤처기업 효율성등급 예측모형 (The Prediction of DEA based Efficiency Rating for Venture Business Using Multi-class SVM)

  • 박지영;홍태호
    • Asia pacific journal of information systems
    • /
    • 제19권2호
    • /
    • pp.139-155
    • /
    • 2009
  • For the last few decades, many studies have tried to explore and unveil venture companies' success factors and unique features in order to identify the sources of such companies' competitive advantages over their rivals. Such venture companies have shown tendency to give high returns for investors generally making the best use of information technology. For this reason, many venture companies are keen on attracting avid investors' attention. Investors generally make their investment decisions by carefully examining the evaluation criteria of the alternatives. To them, credit rating information provided by international rating agencies, such as Standard and Poor's, Moody's and Fitch is crucial source as to such pivotal concerns as companies stability, growth, and risk status. But these types of information are generated only for the companies issuing corporate bonds, not venture companies. Therefore, this study proposes a method for evaluating venture businesses by presenting our recent empirical results using financial data of Korean venture companies listed on KOSDAQ in Korea exchange. In addition, this paper used multi-class SVM for the prediction of DEA-based efficiency rating for venture businesses, which was derived from our proposed method. Our approach sheds light on ways to locate efficient companies generating high level of profits. Above all, in determining effective ways to evaluate a venture firm's efficiency, it is important to understand the major contributing factors of such efficiency. Therefore, this paper is constructed on the basis of following two ideas to classify which companies are more efficient venture companies: i) making DEA based multi-class rating for sample companies and ii) developing multi-class SVM-based efficiency prediction model for classifying all companies. First, the Data Envelopment Analysis(DEA) is a non-parametric multiple input-output efficiency technique that measures the relative efficiency of decision making units(DMUs) using a linear programming based model. It is non-parametric because it requires no assumption on the shape or parameters of the underlying production function. DEA has been already widely applied for evaluating the relative efficiency of DMUs. Recently, a number of DEA based studies have evaluated the efficiency of various types of companies, such as internet companies and venture companies. It has been also applied to corporate credit ratings. In this study we utilized DEA for sorting venture companies by efficiency based ratings. The Support Vector Machine(SVM), on the other hand, is a popular technique for solving data classification problems. In this paper, we employed SVM to classify the efficiency ratings in IT venture companies according to the results of DEA. The SVM method was first developed by Vapnik (1995). As one of many machine learning techniques, SVM is based on a statistical theory. Thus far, the method has shown good performances especially in generalizing capacity in classification tasks, resulting in numerous applications in many areas of business, SVM is basically the algorithm that finds the maximum margin hyperplane, which is the maximum separation between classes. According to this method, support vectors are the closest to the maximum margin hyperplane. If it is impossible to classify, we can use the kernel function. In the case of nonlinear class boundaries, we can transform the inputs into a high-dimensional feature space, This is the original input space and is mapped into a high-dimensional dot-product space. Many studies applied SVM to the prediction of bankruptcy, the forecast a financial time series, and the problem of estimating credit rating, In this study we employed SVM for developing data mining-based efficiency prediction model. We used the Gaussian radial function as a kernel function of SVM. In multi-class SVM, we adopted one-against-one approach between binary classification method and two all-together methods, proposed by Weston and Watkins(1999) and Crammer and Singer(2000), respectively. In this research, we used corporate information of 154 companies listed on KOSDAQ market in Korea exchange. We obtained companies' financial information of 2005 from the KIS(Korea Information Service, Inc.). Using this data, we made multi-class rating with DEA efficiency and built multi-class prediction model based data mining. Among three manners of multi-classification, the hit ratio of the Weston and Watkins method is the best in the test data set. In multi classification problems as efficiency ratings of venture business, it is very useful for investors to know the class with errors, one class difference, when it is difficult to find out the accurate class in the actual market. So we presented accuracy results within 1-class errors, and the Weston and Watkins method showed 85.7% accuracy in our test samples. We conclude that the DEA based multi-class approach in venture business generates more information than the binary classification problem, notwithstanding its efficiency level. We believe this model can help investors in decision making as it provides a reliably tool to evaluate venture companies in the financial domain. For the future research, we perceive the need to enhance such areas as the variable selection process, the parameter selection of kernel function, the generalization, and the sample size of multi-class.

쌍극자-쌍극자 전기비저항 탐사에서 나타나는 음의 겉보기 비저항 (Negative apparent resistivity in dipole-dipole electrical surveys)

  • 정현기;민동주;이효선;오석훈;정호준
    • 지구물리와물리탐사
    • /
    • 제12권1호
    • /
    • pp.33-40
    • /
    • 2009
  • 쌍극자-쌍극자 전기비저항 탐사를 수행하여 자료를 얻다 보면 종종 음의 겉보기 비저항값을 얻게 된다. 음의 겉보기 비저항이란 겉보기비저항 가단면도 상에서 주변자료와 반대되는 부호를 갖고 나타나는 비저항을 의미한다. 이러한 음의 겉보기 비저항은 보통 측정오차로 간주되어 현장 자료 해석시 무시되어 왔다. 일부 측정기기에서는 겉보기 비저항의 절대간이 기록되므로 이러한 음의 비저항값들이 주변값과 같은 부호를 갖는 것으로 환산되어 해석되기도 한다. 현장에서의 여러 실험 결과 옴의 겉보기 비저항갈은 측정오차나 자연전위의 영향에 의해 나타나는 현상이 아니었으며, 유도분극에 의한 영향도 아니었다. 한가지 가능성으로 지하 지질구조에 의한 영향으로 생각할 수 있다. 이 연구에서는 수치모델링을 통하여 평탄한 지형에서 음의 비저항이 지하 지질구조에 의하여 나타날 수 있다는 것을 보여준다. 현장자료를 시뮬레이션하기 위하여 3차원 전산모델링 알고리즘을 이용하였으며, 3차원 결과로부터 2차원 가단면도를 얻었다. 음의 비저항을 발생시키는 모델로는 U자형과 초승달모양의 전도체 모델을 가정하였다. 수치모델링 결과 이러한 지질구조로부터 음의 비저항이 나타날 수 있다는 것을 확인할 수 있었다. 일반적으로 전류전극으로부터의 거리가 멀어질수록 전위값이 증가하게 되면 전위차 곡선들이 서로 교차하면서 음의 비저항값이 나타나는데, 본 연구에서 제시된 결과들에 대해 전극위치에 대한 전위차 그래프를 그려봄으로써 이를 확인할 수 있었다. 본 연구에서 제시한 수치예제들은 현장조사에서 획득한 음의 겉보기 비저항값들이 지하 지질구조에 의해 발생할 수 있는 가능성을 제시하며, 향후 현장조사 자료 해석시 이를 고려하여 해석할 것을 제안한다.

텍스트 마이닝을 활용한 융합인재교육정책 동향 분석 -2009년~2020년 교육부보도, 언론보도, 학술지 초록 비교분석- (Analysis of Trends in Education Policy of STEAM Using Text Mining: Comparative Analysis of Ministry of Education's Documents, Articles, and Abstract of Researches from 2009 to 2020)

  • 유정민;김성원
    • 한국과학교육학회지
    • /
    • 제41권6호
    • /
    • pp.455-470
    • /
    • 2021
  • 본 연구는 2009년부터 2020년까지 융합인재교육과 관련된 교육부 보도자료, 언론보도, 학술지 초록을 수집 및 비교 분석하여 키워드 및 주제의 변화 흐름을 정책단계별로 살피고 향후 융합인재교육의 발전 방향과 그 교육적 시사점을 도출하고자 하였다. 교육부 보도자료는 교육부 홈페이지의 뉴스홍보란, 언론보도는 한국언론재단의 빅카인즈, 학술지 초록은 학술연구정보서비스(RISS)에서 수집되었다. 수집된 자료 중 교육부 보도자료는 42건, 언론보도는 1,534건, 학술지 초록은 880건이 연구대상으로 선정하였다. 파이썬 프로그램을 통해 융합인재교육정책단계별로 키워드 빈도분석, 키워드 네트워크분석, 토픽모델링을 수행하였다. 분석 결과, 융합인재교육정책단계에 따라 매체별로 융합인재교육과 관련된 키워드의 빈도와 네트워크에 차이가 나타났다. 매체별로 주로 사용하거나 중요하게 사용되는 키워드와 토픽에 차이가 나타나 융합인재교육정책에 대한 관심의 차이가 존재한다는 것을 확인하였다. 끝으로 교육부 보도자료의 토픽 대부분은 언론보도에서 도출된 토픽과 대응되는 것으로 나타났다. 이 연구의 결과를 통해 도출된 융합인재교육정책에 대한 시사점은 다음과 같다. 정책의제설정 시기부터 지금까지 다양한 주제와 연계하고 대상을 확대하여 변화하고 있는 융합인재교육은 인문학을 포함한 다양한 주제를 연계하는 방안에 대해 고려할 필요가 있다. 또한 매체별로 융합인재교육정책에 관한 관심의 차이가 존재하므로 이에 대한 이해를 통해 정책의 협력적인 발전 방향이 모색될 필요가 있다. 그리고 융합인재교육의 목표인 미래인재 양성을 위한 핵심역량 강화와 융합 소양에 대한 교육부의 지원과 언론의 융합인재교육에 대한 대중의 이해도를 높이기 위한 노력이 요구된다. 끝으로 융합인재교육정책의 평가 및 변동 과정에서 나타날 주제들에 대해 지속해서 분석할 필요가 있다.

독일 경제아카이브즈의 형성과 유형 (The Formation and Types of Business Archives m Germany)

  • 김영애
    • 기록학연구
    • /
    • 제8호
    • /
    • pp.137-180
    • /
    • 2003
  • The term 'Business Archives' is not familiar with us in our society. Some cases can be found that materials are collected for publishing the history of a firm on commemoration of some decades of its foundation. However, the appropriate management of these collected materials doesn't seem to be followed in most of companies. The Records and archives management is inevitable in order to maximize the utility of Information and knowledge in the business world. The interest in records management has been grown, especially in the fields of business management and information technology. However, the importance of business archives hasn't been conceived yet. And also no attention has been paid to the business archives as social resources and the responsibility of the society as a whole for their preservation. The company archives doesn't have a long history in Germany although the archives of the nation, the aristocracy, communes and churches have a long tradition. However the company archives of Krupps which was established in 1905, is regarded as the first business archives in the world, It means that Germany has taken a key role to lead the culture of business archives. This paper focuses on the process of the establishment of business archives in Germany and its characteristics. The business archives in Germany can be categorized in three types: company archives, regional business archives and branch archives. It must be noted here that each type of these was generated in the context of the accumulation of the social resources and its effective use. A company archives is established by an individual company for the preservation of and use of the archives that originated in the company. The holdings in the company archives can be used as materials for decision making of policies, reporting, advertising, training of employees etc. They function not only as sources inside the company, but also as raw sources for the scholars, contributing to the study of the social-economic history. Some archives of German companies are known as a center of research. A regional business archives manages materials which originated m commerce chambers, associations and companies in a certain region. There are 6 regional business archives in Germany. They collect business archives which aren't kept in a proper way or are under pressure of damage in the region for which they are responsible. They are also open to the public offering the sources for the study of economic history, social history like company archives, so that they also play a central role as a research center. Branch business archives appeared relatively late in Germany. The first one is established in Bochum in 1969. Its general duties and goals are almost similar with ones of other two types of archives. It has differences in two aspects. One is that the responsibility of the branch business archives covers all the country, while regional business archives collects archives in a particular region. The other is that a branch business archives collects materials from a single industry. For example, the holdings of Bochum archives are related with the mining industry. The mining industry-specialized Bochum archives is run as an organization in combination with a museum, which is called as German mine museum, so that it plays a role as a cultural center with the functions of exhibition and research. The three types of German business archives have their own functions but they are also closely related each other under the German Association of Business Archivists. They are sharing aims to preserve primary materials with historical values in the field of economy and also contribute to keeping the archives as a social resources by having feed back with the public, which leads the archives to be a center of information and research. The German case shows that business archives in a society should be preserved not only for the interest of the companies, but also for the utilities of social resources. It also shows us how business archives could be preserved as a social resource. It is expected that some studies which approach more deeply on this topic will be followed based on the considerations from the German case.

건강추천시스템(HRS) 연구 동향: 인용네트워크 분석과 GraphSAGE를 활용하여 (Research Trends of Health Recommender Systems (HRS): Applying Citation Network Analysis and GraphSAGE)

  • 장하렴;유지수;양성병
    • 지능정보연구
    • /
    • 제29권2호
    • /
    • pp.57-84
    • /
    • 2023
  • 현대사회는 정보통신기술 및 빅데이터 기술의 발전으로 누구나 인터넷을 통해 손쉽게 방대한 데이터를 얻고 활용할 수 있는 시대로, 양질의 데이터를 수집하는 능력을 넘어 수많은 정보 속에서 올바른 데이터만을 선별하는 능력이 더욱 중요해지고 있다. 이러한 기조는 학계에서도 이어지고 있는데, 축적되는 연구물 속에서 양질의 연구를 선별하여 올바른 지식구조를 형성하기 위해, 다양한 연구 분야에서 체계적 고찰(systematic review) 및 비체계적 고찰(non-systematic review)과 같은 문헌연구(literature review)가 수행되고 있다. 한편, 코로나19 팬데믹 이후 의료산업에서도 그동안 합의에 이르지 못했던 원격의료가 제한적으로나마 허용되고, 인공지능 및 빅데이터 기술이 응용된 건강추천시스템(health recommender systems: HRS)과 같은 새로운 의료서비스가 각광을 받고 있다. 하지만, 실무적으로 HRS가 미래 의료산업 발전을 이끌 중요한 기술로 평가받고 있음에도 불구하고, 학술적인 문헌연구는 다른 분야에 비해 매우 부족한 실정이다. 더불어 HRS는 학제적 성격이 강한 융합 분야임에도 불구하고, 기존의 문헌연구는 비체계적 고찰과 체계적 고찰 방법만을 주로 활용하여 이뤄졌기 때문에, 다른 연구 분야와의 상호작용이나 동적인 관계를 유추하기에는 한계가 존재한다. 이에, 본 연구에서는 인용네트워크 분석(citation network analysis: CNA)을 활용하여 HRS 및 주변 연구 분야의 전체적인 네트워크 구조를 파악하였다. 또한, 이 과정에서 최신 논문이 인용 관계가 잘 나타나지 않는 문제를 보완하기 위해 GraphSAGE 알고리즘을 적용함으로써, HRS 연구에 있어 'recommender system', 'wireless & IoT', 'computer vision', 'text mining' 등과 같은 연구 분야들의 중요도가 높아지고 있음을 파악하였으며, 이와 동시에 개인화(personalization) 및 개인정보보호(privacy) 등과 같은 새로운 키워드가 주요 이슈로 등장하고 있음을 확인하였다. 본 연구를 통해 HRS 연구 커뮤니티의 구조를 파악하고, 관련된 연구 동향을 살펴보며, 미래 HRS 연구 방향을 설계함에 있어 실질적인 통찰을 제공할 수 있을 것으로 기대한다.

디지털 아카이브즈의 문제점과 방향 - 문화원형 콘텐츠를 중심으로 - (Digital Archives of Cultural Archetype Contents: Its Problems and Direction)

  • 함한희;박순철
    • 한국비블리아학회지
    • /
    • 제17권2호
    • /
    • pp.23-42
    • /
    • 2006
  • 본고는 문화원형콘텐츠를 유통시키고 있는 문화콘텐츠닷컴의 디지털아카이브 시스템에 주목해서 문제점을 분석하고 대안을 제시하는 것이 목적이다. 문화원형콘텐츠는 전통문화와 컴퓨터기술을 접목시켜 개척한 새로운 분야이다. 정부에서는 이 산업을 육성해서 한국문화의 세계화와 국가 경쟁력을 강화시킬 의도를 가지고 있다. 우리나라의 역사와 전통 풍물 생활 전승 예술 지리지 등 다양한 분야의 문화원형을 디지털 콘텐츠화하여 문화산업에 필요한 창작소재로 제공하는 것이 그 핵심내용이다. 아울러 디지털 콘텐츠 유통체계 정립과 저작권 관리를 통해서 공공부문 문화콘텐츠의 산업적 활용도를 제고하려는 의도도 포함된다. 본고에서 다루는 대상자료는 현재 문화콘텐츠닷컴에서 유통, 관리되고 있는 문화원형콘텐츠들이다. 이 성과물들은 2002년부터 2005년까지 개발되어서 문화콘텐츠닷컴 DB에 구축되어 있다. 이 자료들을 통해서 현재의 디지털아카이브 시스템의 문제점을 분석하였고, 현재의 시스템이 안고 있는 한계점을 요약하면 다음과 같다. 첫째는 각 자료에서 사용하는 주요 용어의 선택에 따라 유사한 자료들이 서로 다른 주제로 분류되면서 다른 항목에 속하게 되는 것이다. 둘째는, 따라서 서로 다른 항목 간에 교차검색이 이루어지지 않는 한계점이 있다. 현재의 제 문제를 해결할 수 있는 방법으로 본고에서는 온톨로지 기능을 포함한 데이터마이닝시스템을 이용해서 풍부한 지식정보표현과 활용이 가능한 디지털아카이브 시스템을 제안하고 있다. 데이터마이닝은 다섯 가지의 방법으로 가능하다. 의미검색 문서요약 문서클러스터링 문서분류 그리고 주제추적이다. 최근에 빠르게 개발되고 있는 디지털 신기술도 인문학과 긴밀하게 연결되지 않으면, 그 활용도가 제한적이라는 점을 본고를 통해서 지적하였다. 창작소재로서의 문화원형콘텐츠의 활용도를 크게 향상시킬 수 있는 길은 바로 신지식관리를 위한 통학적(uni-discipline) 접근이라는 점을 일깨우고자 한다.

웹검색 트래픽 정보를 활용한 유커 인바운드 여행 수요 예측 모형 및 유커마이닝 시스템 개발 (Development of Yóukè Mining System with Yóukè's Travel Demand and Insight Based on Web Search Traffic Information)

  • 최유지;박도형
    • 지능정보연구
    • /
    • 제23권3호
    • /
    • pp.155-175
    • /
    • 2017
  • 최근 독감 예측이나 당선인 예측, 구매 패턴, 투자 등 다방면에서 웹검색 트래픽 정보. 소셜 네트워크 내용 등 거대한 데이터를 통해 사회적 현상, 소비 패턴을 분석하는 시도가 이전보다 늘어났다. 구글, 네이버, 바이두 등 인터넷 포털 업체들의 웹검색 트래픽 정보 공개 서비스와 함께 웹검색 트래픽 정보를 활용하여 소비자나 사용자와 관련된 연구가 실시되기 시작했다. 웹검색 트래픽 정보를 활용한 사회 현상, 소비 패턴 분석을 연구는 많이 수행되었으나, 그에 비해서 도출된 여행 수요 모델을 토대로 의사결정을 위한 실질적 대책 수립으로 이어지는 연구는 많이 진행되지 않은 실정이다. 관광산업은 상대적으로 많은 고용을 가능하게 하고 외자를 유치하는 등 고부가가치를 창출하여 경제 전체에 선순환 효과를 일으키는 중요한 산업이다. 그 중에서도 국내 입국외래객중 수년간 2위와의 큰 차이로 1위를 차지해왔던 중국 국적의 관광객 '유커' 및 그들이 지출하는 1인당 평균 관광 수지는 한국 경제에 매우 중요한 한 부분이다. 관광 수요의 예측은 효율적인 자원 배분과 합리적인 의사 결정에 있어서 공공부문 및 민간부문 모두 중요하다. 적절한 관광 수요 예측을 통해서 한정된 자원을 더욱 효과적으로 활용하여 더욱 많은 부가가치를 창출하기 위한 것이다. 본 연구는 중국인 인바운드를 예측하는 방법에 있어, 이전보다 더 최신의 트렌드를 즉각적으로 반영하고 개인들의 집합의 관심도가 포함되어 예측 성능이 개선된 방법을 제안한다. 해외여행은 고관여 소비이기 때문에 잠재적 여행객들이 입국하기 전 웹검색을 통해 적극적으로 자신의 여정과 관련된 정보를 취득하기 위한 활동을 한다. 따라서 웹검색 트래픽 수치가 중국인 여행객의 관심정도를 대표할 수 있다고 보았다. 중국인 여행객들이 한국 여행을 준비하는 단계에서 검색할만한 키워드를 선정해 실제 중국인 입국자 수와 상관관계가 있음을 검증하고자 하였다. 중국 웹검색 엔진 시장에서 80%의 점유율을 가지는 중국 최대 웹검색 엔진 '바이두'에서 공개한 웹검색 데이터를 활용하여 그 관심 정도를 대표할 수 있을 것이라 추정했다. 수집에 필요한 키워드의 선정 단계에서는 잠재적 여행객이 여정을 계획하고 구체화하는 단계에서 일반적으로 검색하게 되는 키워드 후보군을 선정하였다. 키워드의 선정에는 중국 국적의 잠재적 여행객 표본과의 인터뷰를 거쳤다. 트래픽 대소 관계 확인 결과에 따라서 최종 선정된 키워드들을 한국여행이라는 주제와 직접적인 연관을 가지는 키워드부터, 간접적인 연관을 가지는 키워드까지 총 세 가지 레벨의 카테고리로 분류하였다. 분류된 카테고리 내의 키워드들은 바이두'가 제공하는 웹검색 트래픽 데이터 제공 서비스 '바이두 인덱스'를 통해 웹검색 트래픽 데이터를 수집했다. 공개된 데이터 페이지 특성을 고려한 웹 크롤러를 직접 설계하여 웹검색 트래픽 데이터를 수집하였고, 분리되어 수집된 변수에는 필요한 변수 변환 과정을 수행했다. 자동화 수집된 웹검색 트래픽 정보들을 투입하여 중국 여행 인바운드에 대한 유의한 영향 관계를 확인하여 중국인 여행객의 한국 인바운드 여행 수요를 예측하는 모형을 개발하고자 하였다. 정책 의사결정 및 관광 경영 의사결정 같은 실무적 활용을 고려하여 각 변수의 영향력을 정량적으로 설명할 수 있고 설득이 명료한 방법인 다중회귀분석방법을 적용해 선형 식을 도출하였다. 수집된 웹검색 트래픽 데이터를 기존 검증된 모형 독립변인들에 추가적으로 투입함으로써 전통적인 독립변인으로만 구성된 연구 모형과 비교하여 가장 뛰어난 성능을 보이는 모형을 확인하였다. 본 연구에서 검증하려는, 웹검색 트래픽으로 대표되는 독립변인을 투입한 최종 도출된 모형을 통해 중국인 관광 수요를 예측할 때 유의한 영향을 끼치는 웹검색 트래픽 변수를 확인할 수 있다. 최적 모형 설명력을 가지는 모형을 기반으로 최종 회귀 식을 만들었고 이를 '유커마이닝' 시스템 내부에 도입하였다. 데이터 분석에서 더 나아가 도출된 모형을 직관적으로 시각화하고, 웹검색 트래픽 정보를 활용하여 도출할 수 있는 인사이트를 함께 보여주는 데이터 분석 기반의 '유커마이닝' 솔루션의 시스템 알고리즘과 UX를 제안하였다. 본 연구가 제안하는 모형과 시스템은 관광수요 예측모형 분야에서 웹검색 트래픽 데이터라는 정보 탐색을 하는 과정에 놓인 개인들의 인터랙티브하고 즉각적인 변수를 활용한 새로운 시도이다. 실무적으로 관련 정책결정자나 관광사, 항공사 등이 활용 가능한 실제적인 가치를 가지고, 정책적으로도 효과적인 관광 정책 수립에 활용될 수 있다.

이질성 학습을 통한 문서 분류의 정확성 향상 기법 (Improving the Accuracy of Document Classification by Learning Heterogeneity)

  • 윌리엄;현윤진;김남규
    • 지능정보연구
    • /
    • 제24권3호
    • /
    • pp.21-44
    • /
    • 2018
  • 최근 인터넷 기술의 발전과 함께 스마트 기기가 대중화됨에 따라 방대한 양의 텍스트 데이터가 쏟아져 나오고 있으며, 이러한 텍스트 데이터는 뉴스, 블로그, 소셜미디어 등 다양한 미디어 매체를 통해 생산 및 유통되고 있다. 이처럼 손쉽게 방대한 양의 정보를 획득할 수 있게 됨에 따라 보다 효율적으로 문서를 관리하기 위한 문서 분류의 필요성이 급증하였다. 문서 분류는 텍스트 문서를 둘 이상의 카테고리 혹은 클래스로 정의하여 분류하는 것을 의미하며, K-근접 이웃(K-Nearest Neighbor), 나이브 베이지안 알고리즘(Naïve Bayes Algorithm), SVM(Support Vector Machine), 의사결정나무(Decision Tree), 인공신경망(Artificial Neural Network) 등 다양한 기술들이 문서 분류에 활용되고 있다. 특히, 문서 분류는 문맥에 사용된 단어 및 문서 분류를 위해 추출된 형질에 따라 분류 모델의 성능이 달라질 뿐만 아니라, 문서 분류기 구축에 사용된 학습데이터의 질에 따라 문서 분류의 성능이 크게 좌우된다. 하지만 현실세계에서 사용되는 대부분의 데이터는 많은 노이즈(Noise)를 포함하고 있으며, 이러한 데이터의 학습을 통해 생성된 분류 모형은 노이즈의 정도에 따라 정확도 측면의 성능이 영향을 받게 된다. 이에 본 연구에서는 노이즈를 인위적으로 삽입하여 문서 분류기의 견고성을 강화하고 이를 통해 분류의 정확도를 향상시킬 수 있는 방안을 제안하고자 한다. 즉, 분류의 대상이 되는 원 문서와 전혀 다른 특징을 갖는 이질적인 데이터소스로부터 추출한 형질을 원 문서에 일종의 노이즈의 형태로 삽입하여 이질성 학습을 수행하고, 도출된 분류 규칙 중 문서 분류기의 정확도 향상에 기여하는 분류 규칙만을 추출하여 적용하는 방식의 규칙 선별 기반의 앙상블 준지도학습을 제안함으로써 문서 분류의 성능을 향상시키고자 한다.

수요-공급의 동시모형을 통한 공로 화물운송특성분석 (The Analysis of the Road Freight Transportation using the Simultaneous Demand-Supply Model)

  • 장수은;이용택;지준호
    • 대한교통학회지
    • /
    • 제19권4호
    • /
    • pp.7-18
    • /
    • 2001
  • 본 연구의 목적은 지금까지의 수요 또는 공급의 한 측면만을 중심으로 하는 일방향적 단일모형에서 벗어나 화물운송의 수요-공급을 동시에 고려하는 모형을 정립하고 이를 활용하여 국내운송특성을 분석하고 정책적 시사점을 도출하는 것이다. 이를 위해 기존의 단일모형의 한계를 논하고 이를 개선할 수 있는 수요-공급 동시모형을 도입하여 국내화물운송 실적자료를 바탕으로 모형을 개발하였으며, 이를 바탕으로 국내공로화물의 특성을 분석하고 정책적 시사점을 도출하였다. 본 연구에서 개발된 모형은 공차거리율의 감소로 인한 적재효율의 증가는 적재용량(공급량)을 안정적으로 증가시키고, 이는 다시 물동량을 증가시키는 과정을 잘 묘사하고 있다. 이러한 상호조정 인과관계로부터 정부의 규제완화 조치가 장기적 관점에서 운송시장의 효율성을 재고시킬 것으로 예상할 수 있다. 그런데 물동량의 증가에 따른 공차거리율 감소 폭보다 적재용량의 증가에 따른 공차거리율 증가폭이 훨씬 큰 것으로 분석되어, 조정에 따른 단기적 비효율을 유발하는 것으로 나타나 물류인프라 구축과 단기적 조절 정책이 필요함을 시사하고 있다. 덧붙여 영세업자의 난립에 따른 소비자 보호를 위한 보완책과 함께 수요와 공급의 시장조절 능력에 따라 단계적으로 규제를 완화에 나아가는 것이 바람직한 것으로 분석되었다.

  • PDF

한반도 광상 성인유형에 따른 환경 특성 (An Overview of Geoenvironmental Implications of Mineral Deposits in Korea)

  • 최선규;박상준;이평구;김창성
    • 자원환경지질
    • /
    • 제37권1호
    • /
    • pp.1-19
    • /
    • 2004
  • 국내 금속광상의 성인적 유형은 주로 열수충진형 광상, 스카른형 광상, 열수교대형 광상 및 변성퇴적형 광상으로 배태되고 이외에 일부는 정마그마형 광상, 반암형 광상, 알라스카이트형 광상 등으로 부존되고 있다. 이러한 폐광산으로부터 발생되는 수질 및 토양의 환경문제는 개발규모 및 수반금속, 주변암상과 관련된 부존특성과 함께 열수변질작용과 관련된 광물조합, 광석-맥석 광물의 조직, 유형 및 양적관계, 풍화의 진행단계와 관련된 이차-삼차광물의 존재형태 등의 광물-지화학적 특성에 좌우되고 있다. 1970년대 초반부터 1990년대 후반에 걸쳐 광산개발이 종료된 국내금속광상은 폐광 이후의 경과기간에 따라 황화-황염광물과 같은 일차광물로부터 용해되어 수산화광물, 황산염광물, 탄산염광물로 변화하는 과정에서 산화-용출-침전-재용출-이동에 의한 다단계의 복잡한 지화학적 반응관계를 보이고 있다. 금속광상의 산성 배수 및 중금속오염은 다금속 광화작용과 관련된 비철금속 광상과 동시에 맥상광상 및 각력파이프형 광상과 백악기금광상에서 가장 높은 용출가능성을 보이는 반면, 스카른형 광상, 열수교대형 광상, 정마그마형 광상, 맥상 금-은광상, 맥상 동광상 및 변성퇴적형 광상에서 오염가능성은 매우 낮은 경향을 보이고 있다. 이와 같이 광상 유형과 관련된 지질부존 특성은 폐석 및 광미를 구성하는 황화광물 및 탄산염광물의 유형 및 양비와 밀접한 연관성을 갖고 있으며, 산성 배수에 함유된 금속원소종의 유형 및 용출량과 같은 지화학적 특성에 직접적으로 영향을 미치고 있다.