• 제목/요약/키워드: Pattern Mining

검색결과 621건 처리시간 0.025초

기술예측을 위한 특허 키워드 네트워크 분석 (Keyword Network Analysis for Technology Forecasting)

  • 최진호;김희수;임남규
    • 지능정보연구
    • /
    • 제17권4호
    • /
    • pp.227-240
    • /
    • 2011
  • 특허의 중요성이 커짐에 따라 특허분석의 중요성 또한 점점 커지고 있다. 특허분석은 네트워크 기반 방법과 키워드 기반 방법으로 나눠지는데 네트워크 기반은 특허 내부에 존재하는 세부 기술정보에 대한 분석이 불가능하다는 단점이 있고 키워드 기반은 기술정보간의 상호관계를 규명하지 못한다는 단점이 있다. 기존에 제시된 네트워크 기반 특허 분석과 키워드 기반 분석의 한계를 극복하기 위해서 두 방법을 혼합한 방법으로서 본 연구에서는 특허 키워드 네트워크 기반 분석 방법론을 제시하였다. 본 연구에서는 LED 분야의 특허들을 대상으로 텍스트 마이닝을 통해 중요한 기술정보를 추출한 다음, 키워드 네트워크를 구축하고, 이를 대상으로 커뮤니티 네트워크 분석을 수행하였다. 분석 결과는 다음과 같다. 첫째, 특허 키워드 네트워크는 매우 낮은 밀도와 매우 높은 클러스터링 지수를 나타내었다. 밀도가 높다는 것은 LED 분야내 특허 키워드 네트워크 내 노드(키워드)들이 산발적으로 연결되어 있다는 것을 의미하며, 클러스터링 지수가 높다는 것은 해당 키워드 네트워크 내 노드, 즉 키워드들이 각각의 커뮤니티로 매우 긴밀하게 연결되어 있음을 나타낸다. 둘째, 특허 키워드 네트워크도 다른 지식네트워크와 마찬가지로 명확한 멱함수 분포를 따른다는 사실을 알 수 있었다. 이는 기존에 활발히 연구, 활용되어 많은 연결고리를 갖고 있는 특허개념(키워드)수록 지속적으로 다른 연구자들에 의해 선택되고 이 키워드를 바탕으로 새로운 키워드들이 연결되어서 이들 키워드간의 조합으로 새로운 기술이 발명된다는 것이다. 셋째, 특허가 개발될 때 특정 분야에 유입된 키워드 중 새로운 링크가 생긴 키워드의 대부분이 기존에 연결되어 있던 커뮤니티 내의 키워드들과 결합되어 새로운 특허 개념을 구성한다는 사실을 발견하였다. 이러한 사실은 단기(4년) 장기(10년) 두 기간 모두 동일하게 나타났다. 나아가 본 연구에서 제시한 방법론을 통해 도출된 특허 키워드 조합 정보를 활용하면 미래에 어떤 개념들이 합쳐져서 새로운 특허 단위로 만들어 질지 가늠해볼 수 있고, 새로운 특허를 개발할 때 참고할 수 있는 유용한 정보로 활용할 수 있다.

AdaBoost 알고리즘기반 SVM을 이용한 부실 확률분포 기반의 기업신용평가 (Corporate Credit Rating based on Bankruptcy Probability Using AdaBoost Algorithm-based Support Vector Machine)

  • 신택수;홍태호
    • 지능정보연구
    • /
    • 제17권3호
    • /
    • pp.25-41
    • /
    • 2011
  • 최근 몇 년간 SVM(support vector machines)기법은 패턴인식 또는 분류의사결정문제를 위한 분석기법으로서 기존의 데이터마이닝 기법과 비교할 때, 매우 높은 성과를 갖는 것으로 인식되어 왔다. 더 나아나 많은 연구자들은 SVM기법이 1980년대 이후 대표적인 예측 및 분류모형으로 인정받은 인공신경망기법(ANNs : Artificial Neural Networks)에 비해 더 성과가 좋다는 사실을 실증적으로 입증해 왔다(Amendolia et al., 2003; Huang et al., 2004, Huang et al., 2005; Tay and Cao, 2001; Min and Lee, 2005; Shin et al., 2005; Kim, 2003). 일반적으로 이와 같이 다양한 데이터마이닝 기법에 의해 분석되는 이진분류 또는 다분류 의사결정문제들은 특히 금융분야 등에 있어서 오분류비용에 민감하며, 이로 인한 오분류의 경제적 손실도 상대적으로 매우 크다고 할 수 있다. 따라서 기업부도예측모형과 같은 이진분류모형의 결과값을, 부도확률에 기초하여 정교하게 계산된 사후확률의 개념으로서 다분류의 신용등급평가의 문제로 변환할 필요가 있다. 그러나, SVM 모형의 결과값은 기본적으로 그와 같은 부도확률분포를 보여주지 않는다. 따라서, 그러한 확률분포를 정교하게 보여줄 방법을 제시할 필요가 있다(Platt, 1999; Drish, 2001). 본 연구는 AdaBoost 알고리즘기반의 SVM 모형을 이용하여, 이진분류모형으로서 IT 기업의 부실예측모형에 적용한 후, 이 SVM 모형의 예측결과를 SVM의 손실함수에 적용하여 계산된 값을 사후부도확률의 정규분포 특성에 따라 이를 구간화하여 IT기업에 대한 다분류 신용등급 평가의 문제로 전환시키는 방법을 제시하였다. 그리고 본 연구에서 제안하는 방법은 이러한 AdaBoost 알고리즘기반 SVM 모형이 각 기업이 고유한 신용위험(부도확률)을 갖고 있다는 조건하에서, 신용등급부여를 위한 부도확률분포 구간을 정교하게 조정함으로써 오분류 문제를 좀 더 줄일 수 있음을 제시하였다.

KB국민카드의 빅데이터를 활용한 실시간 CRM 전략: 스마트 오퍼링 시스템 (Real-time CRM Strategy of Big Data and Smart Offering System: KB Kookmin Card Case)

  • 최재원;손봉진;임현아
    • 지능정보연구
    • /
    • 제25권2호
    • /
    • pp.1-23
    • /
    • 2019
  • 소비자의 니즈가 다양해지면서 데이터 마이닝과 고도화된 고객관계관리(CRM) 기법을 활용한 체계적인 마케팅 서비스를 제공하는 기업이 증가하고 있으며, KB국민카드는 고객의 결제 데이터 등을 활용하여 고객 개개인의 니즈를 충족시키고 소비자의 평생가치를 극대화하기 위한 전략을 강조하고 있다. 실시간으로 고객의 카드이용과 고객 행동, 위치 정보 등을 감지하여 진행하는 고효율 마케팅 운영시스템인 스마트 오퍼링 시스템을 운영하고 있으며, 다양한 앱 등과 결합하여 더욱 정교화된 서비스를 제공하고 있다. KB국민카드는 스마트 오퍼링 시스템의 성공과 지속적인 성장을 위해 고도화되고 있는 ICT 기술과 인재 확보를 위한 투자를 진행해야 하며, 장기적인 관점에서의 수익확보를 위한 전략을 확립하여 체계적인 진행이 필요하다. 특히, 프라이버시 침해와 개인정보 유출 등의 문제가 쟁점이 되는 현재 상황에서 고객 정보를 활용한 마케팅에 대한 고객의 인식을 긍정적으로 유도하고, 보안성을 강조하는 기업 이미지 형성을 위한 노력이 필요하다. 본 연구는 CRM 전략의 변화 과정을 통해 현재 카드사의 실시간 CRM 전략을 KB 국민카드의 빅데이터 활용전략과 마케팅 활동을 통해 확인하고자 한다.

k-Structure를 이용한 한국어 상품평 단어 자동 추출 방법 (Automatic Extraction of Opinion Words from Korean Product Reviews Using the k-Structure)

  • 강한훈;유성준;한동일
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권6호
    • /
    • pp.470-479
    • /
    • 2010
  • 감정어 추출과 관련하여 기존 영어권 연구에서 제시된 방법의 대부분은 한국어에 직접 적용이 쉽지 않다. 한국어권 연구에서 제시된 방법 중 수작업에 의한 방법은 감정어 추출에 많은 시간이 걸린다는 문제점이 있다. 영어 시소러스 기반 한국어 감정어 추출 기술은 한국어와 영어 단어간 일대일 부정합에서부터 기인하는 정확도의 저하를 제고해야 하는 과제를 갖고 있다. 한국어 구문 분석기를 기반으로 한 연구는 출현 빈도가 낮은 감정어를 선정하지 못할 수 있는 문제점을 내포하고 있다. 본 논문에서는 한국어 상품평 중 단순한 문장에서 감정어를 자동으로 추출하는 데 있어 기존에 제안된 한국어권 연구에 상호 보완적으로 정확도를 향상시킬 수 있는 k-Structure(k=5 또는 8) 기법을 제안한다. 단순한 문장이라 함은 패턴 길이를 최대 3으로 한다. 이는 평가 대상 상품(예를 들어 '카메라')의 속성 명 f (예를 들어 카메라의 '배터리')를 기준으로 ${\pm}2$의 거리에 감정어가 포함되어 있는 문장을 의미한다. 성능 실험은 국내 주요 쇼핑몰로부터 수집한 1,868개의 상품평을 대상으로 미리 주어진 8개의 속성 명에 대한 감정어를 k-Structure를 이용하여 자동으로 추출하고 그 정확도를 평가하였다. 그 결과, k=5일 경우 평균 79.0%의 재현률, 87.0%의 정확률을 보였고, k=8일 경우 평균 92.35%의 재현률, 89.3%의 정확률을 얻을 수 있었다. 또한, 영어권 연구에서 제안된 방법 중 PMI-IR(Pointwise Mutual Information-Information Retrieval) 기법을 이용하여 실험을 수행하였다. 이 결과, 평균 55%의 재현률과 57%의 정확률을 보였다.

과학기술정책 연구와 사회, 정부 : 과학기술의 사회이슈, 정부정책, 학술연구의 공진화 분석 (Science and Technology Policy Studies, Society, and the State : An Analysis of a Co-evolution Among Social Issue, Governmental Policy, and Academic Research in Science and Technology)

  • 권기석;정서화;이찬구
    • 기술혁신학회지
    • /
    • 제21권1호
    • /
    • pp.64-91
    • /
    • 2018
  • 이 연구의 목적은 우리나라에서 과학기술정책 연구가 본격적으로 등장한 이래 과학기술을 둘러싼 사회이슈, 학술연구, 과학기술정책이 어떻게 상호작용해 왔는지 탐색하는 데에 있다. 과학기술정책 연구가 시대적 수요를 얼마나 수용해 왔는지, 문제해결을 위해 얼마나 적절하게 대응해 왔는지 분석하였다. 이를 위해 크게 사회이슈, 학술연구, 그리고 과학기술정책의 텍스트에 대한 네트워크분석과 군집분석을 실시하였다. 먼저, 과거 20년 동안 과학기술 관련 언론 기사를 중심으로 사회이슈를 분석하였다. 다음으로, 과학기술정책 연구논문과 정부문서를 각각 분석해봄으로써 사회문제로 제기된 과학기술 관련 정책수요들이 연구를 통해 정부정책으로 이어졌는지 분석하였다. 분석 결과, 과학기술정책 연구는 통합적인 시각보다는 주로 급변하는 기술혁신에 발 빠르게 움직이는 단편적 연구가 많다고 할 수 있다. 그러나 다음 시기에서는 연구주제의 성숙도를 높이면서, 사회적 반응성을 높이는 공진화 경향을 보여 주었다. 이러한 과정에서 삼자간 시차 현상 또한 확인할 수 있었다. 향후 과학기술정책 연구는 기존의 미시수준의 연구에서 중범위와 거시수준으로 확장되어야 할 것이다. 특히 과학기술의 정책과정과 공공관리에 관심을 가져야하며, 사회적 이슈에 대한 민감성을 높이는 정책의제설정 등에 대한 연구가 필요하다는 시사점을 도출하였다.

시뮬레이션과 순차 패턴을 이용한 FMC 로봇의 효율적 작업 순서 설계 및 분석 (Design and Analysis of Efficient Operation Sequencing in FMC Robot Using Simulation and Sequential Patterns)

  • 김선길;김연진;이홍철
    • 한국산학기술학회논문지
    • /
    • 제11권6호
    • /
    • pp.2021-2029
    • /
    • 2010
  • 본 논문에서는 FMC 로봇의 생산성 향상을 위해 시뮬레이션과 순차 패턴 기법을 이용해 로봇의 패턴을 분석하고 최적의 로봇 작업 우선순위규칙(Dispatching Rule)을 설계하는 방법을 제시하였다. 이를 위해, 먼저 FMC를 시뮬레이션으로 설계하고 각 설비가 로봇에게 요청하는 신호를 추출 해 이를 로그(Log) 형태로 생성, 저장하였다. 그 후, 이 로그를 데이터 마이닝 기법 중 하나인 순차 패턴 분석을 이용해 설비의 신호와 로봇간의 연관된 순서를 분석 하여 로봇의 최적 이동 경로를 도출하는 방법을 제시하였다. 또한, 사례연구를 통하여 FMC의 적용성에 대한 효율성 을 입증하였다. 도출된 최적의 패턴을 국내 A사 생산라인에 적용한 결과 작업물 대기시간(Loss Time)의 감소와 로봇 이용률의 향상, 작업물의 총 처리량의 증가와 평균 처리시간 감소를 가져왔다. 또한, 이러한 신호의 패턴을 이용한 분석 방법은 신호와 동작간의 로그를 저장, 데이터베이스화하여 시스템 상에서 로봇의 작업 우선순위규칙을 도출할 수 있게 하므로, 작업자의 오랜 노하우(Know-How) 없이도 로봇 운영의 문제점을 파악하고 그 개선안을 제시할 수 있다. 이러한 방법을 통해 FMC 뿐만이 아닌 로봇을 사용하는 모든 분야에 설비의 신호와 로봇 동작간의 그 연관관계를 분석하고 최적의 운영법칙을 설계, 운영하여 생산성 향상에 크게 기여할 것으로 기대된다.

교통흐름에 기인하는 미세먼지 노출 도시인구에 대한 시.공간적 분석 (Spacio-temporal Analysis of Urban Population Exposure to Traffic-Related air Pollution)

  • 이금숙
    • 한국경제지리학회지
    • /
    • 제11권1호
    • /
    • pp.59-77
    • /
    • 2008
  • 자동차를 중심으로 하는 도로교통량이 크게 늘면서 교통에 기인한 다양한 피해 현상들이 나타나고 있다. 특히 교통량이 집중되는 대도시에서는 교통에 기인한 도시민의 건강피해가 심각한 것으로 밝혀지고 있다. 본 연구에서는 교통에 기인한 미세먼지의 피해를 직접적으로 받는 도시인구는 미세먼지의 주 발생원인 교통흐름이 있는 도로변에 가까이에 노출되는 도시민들이라고 보고 도시 공간 내에서 교통흐름과 미세먼지, 그리고 도시 통행인구의 공간적 분포를 분석하였다. 특히 본 연구에서는 대기오염문제가 심각한 서울을 대상으로 교통에 기인한 미세먼지의 실태를 살펴보고, 서울을 둘러싸고 있는 경기도 일대에 대단위 주거지들이 밀집된 신도시들이 개발되면서 나타나는 인구분포와 통행패턴, 그리고 교통흐름 및 미세먼지 농도에 나타나는 공간적 변화와 이들 간의 공간적 관계를 종합적으로 파악하기 위하여 GIS를 적용하였다. 또한 교통카드 트랜잭션 데이터베이스에서 데이터마이닝기법으로 추출해낸 통행흐름 자료를 이용하여 통행시간별 통행인구분포도를 작성하고, 이를 바탕으로 교통에 기인한 미세먼지에 직접 노출하게 되는 도시인구를 산정하는 시 공간적 모형개발을 시도하였다.

  • PDF

중력 및 자력 탐사에 의한 제주도 지질구조 연구 (Investigation of Subsurface Structure of Cheju Island by Gravity and Magnetic Methods)

  • 권병두;이희순;정귀금;정승환
    • 자원환경지질
    • /
    • 제28권4호
    • /
    • pp.395-404
    • /
    • 1995
  • 중력 및 자력 탐사자료를 분석하여 제주도의 지지구조를 연구하였다. 부우게 중력이상도에서 섬 중앙의 한라산체에서 뚜렷한 원형의 저이상이 나타나며, 이상값의 차이는 최대 30 mgal 로 나타났다. 지하지질구조 모델링을 위하여 기반암 상부에 위치하는 화산암체를 각주로 나누어 중력자료의 삼차원 심도역산을 실시한 결과, 화산암의 기저면은 한라산 아래로 휘어지며 최대 깊이는 5 km 정도에 이른다. 자력자료로는 항공탐사자료와 육상탐사자료를 함께 이용하였다. 이들로부터 구한 자력이상도는 다소의 차이는 보이나 전체적으로는 중위도 지방에서 지구자기장의 방향으로 자화된 자력이상체로 부터 야기되는 전형적인 이상의 형태를 보인다. 자극변환을 한 이상도를 보면 섬의 주된 자력원은 장축을 따라 발달하는 열곡대와 한라산체로 나타난다. Cordell과 Grauch (1985)의 방법으로 구한 자력원의 경계는 표선리 현무암과 시흥리 현무암과 같은 비교적 최근에 분출된 화산암의 경계와 잘 일치한다. 자력모델링은 심도와 대자율을 두 변수로 취하여 항공탐사자료의 삼차원 역산을 수행하였다. 역산 결과, 높은 대자율을 가지는 화산암은 열곡대와 중앙화산체에서 나타나며 기반의 심도는 장축을 따라서는 1.5~3 km, 용암대지에서는 1~1.5 km 정도로 나타나며, 한라산 하부에서 최대 5 km로 나타난다. 중력과 자력이상도 모두에서 나타나는 동부 지역의 남북 방향의 이상은 지질도 상에서는 확인되지 않는 단층 또는 파쇄대에 의한 것일 가능성이 있다.

  • PDF

북동태평양에서 형광 기법을 이용한 용존유기물의 기원 및 분포 (Sources and Distributions of Dissolved Organic Matter by Fluorescence Method in the Northeastern Pacific Ocean)

  • 손주원;손승규;주세종;김경홍;김웅서;박용철
    • Ocean and Polar Research
    • /
    • 제29권2호
    • /
    • pp.87-99
    • /
    • 2007
  • This study was conducted to understand the source and behavior of organic matter using the fluorescent technique (excitation-emission matrix) as a part of environmental monitoring program in the Korea manganese nodule mining site in the Northeastern Pacific Ocean. Water samples were collected at $0^{\circ},\;6^{\circ}N$, and $10.5^{\circ}N$ along $131.5^{\circ}W$ in August 2005. The concentration of total organic carbon (TOC) ranged from 58.01 to $171.93\;{\mu}M-C$. The vertical distribution of TOC was characterized as higher in the surface layer and decreased with depth. At $6^{\circ}N$, depth-integrated (from surface to 200 m depth) TOC was $337.1\;gC/m^2$, which was 1.4 times higher value than other stations. The exponential decay curve fit of vertical profile of TOC indicated that 59% of organic carbon produced by primary production in the surface layer could be decomposed by bacteria in the water column. Dissolved organic matter is generally classified into two distinctive groups based on their fluorescence characteristics using three-dimensional excitation/emission (Ex/Em) fluorescence mapping technique. One is known as biomacromolecule (BM; protein-like substance; showing max. at Ex 280/Em 330), mainly originated from biological metabolism. The other is geomacromolecule (GM; humic-like substance; showing max. at Ex 330/Em 430), mainly originated from microbial degradation processes. The concentration of BM and GM was from 0.42 to 7.29 TU (tryptophan unit) and from 0.06 to 1.81 QSU (quinine sulfate unit), respectively. The vertical distribution of BM was similar to that of TOC as high in the surface and decreased with depth. However, the vertical distribution of GM showed the reverse pattern of that of BM. From these results, it appeared that BM occupied a major part of TOC and was rapidly consumed by bacteria in the surface layer. GM was mainly transformed from BM by microbial processes and was a dominant component of TOC in the deep-sea layer.

중성자회절법을 이용한 이트리아 저코니아의 결정구조 연구 (Neutron Diffraction Study on the Crystal Structure of Yttria-Stabilized Zirconium Oxide)

  • Jin-Ho Lee;Chang-Hee Lee;Won-Sa Kim
    • 한국광물학회지
    • /
    • 제13권3호
    • /
    • pp.164-170
    • /
    • 2000
  • 중성자 단결정 및 분말회절실험을 이용하여 이트리아를 첨가한 저코니아 (yttria-stabilized airconia, Zr0.73Y0.27O1.87) 결정의 구조 분석을 수행하였다 시료는 입방정계로써, 공간군 Fm/equation omitted/ a=5.155(2)$\AA$, V=136.99(5), Z=4로 결정화되었고, 중성자 단결정 회절실험의 결과로 얻어진 70개의 브라그 회절반점을 이용한 최종신뢰도 R(F) 및 $\omega$R(I) 값은 각각 0.0576, 0.1057 이었다. Zr과 Y 원자 들은 이상적인 형석 (CaF2) 구조의 cation 위치에 불규칙하게 배열되어 있었으며, 산소 원자들의 대부분 (95%)은 (1/4,1/4,1/4) 위치에서 <110> 방향으로 $\Delta$/a~0.033의 크기만큼 이동하였고, 나머지 산소 원자들은 <100> 방향으로 $\Delta$/a~0.033의 변위가 존재하였다. Rietveld 분석법을 이용한 중성자 분말회절실험의 결과는 단결정 회절실험에서 보여주었던 결정학적 정보와 모든 면에서 잘 일치하고 있었으며, 정방정계의 구조에서 기인되는 몇 개의 불순상의 존재가 최종 분석된 분말 회절상에서 확인되었다.

  • PDF