• 제목/요약/키워드: 특허 데이터 마이닝

검색결과 33건 처리시간 0.02초

특허 키워드 시계열 분석을 통한 부상 기술 예측 (Time Series Analysis of Patent Keywords for Forecasting Emerging Technology)

  • 김종찬;이준혁;김갑조;박상성;장동식
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제3권9호
    • /
    • pp.355-360
    • /
    • 2014
  • 오늘날 국가와 기업의 연구 개발 투자 및 경영 정책 전략 수립에서 미래 부상 기술 예측은 매우 중요한 역할을 한다. 기술 예측을 위한 다양한 방법들이 사용되고 있으며 특허를 이용한 기술 예측 또한 활발히 진행되고 있다. 특허를 이용한 기술 예측에는 전문가들의 평가와 견해를 통한 정성적인 방법이 주로 사용되어 왔다. 정성적인 방법은 분석 결과의 객관성을 보장하지 못하고 분석에 많은 비용 및 시간이 요구된다. 이런 문제점을 보완하기 위해 최근에는 텍스트 마이닝을 이용한 특허 데이터의 정량적인 분석이 이루어지고 있다. 텍스트 마이닝 기법을 적용함으로써 특허 문서의 통계적 분석이 가능하다. 본 논문에서는 텍스트 마이닝과 ARIMA 분석을 이용한 기술 예측 방법을 제안한다.

특허분석을 위한 빅 데이터학습 (A Big Data Learning for Patent Analysis)

  • 전성해
    • 한국지능시스템학회논문지
    • /
    • 제23권5호
    • /
    • pp.406-411
    • /
    • 2013
  • 빅 데이터는 여러 분야에서 다양한 개념으로 사용된다. 예를 들어, 컴퓨터학과 사회학에서 빅 데이터에 대한 접근방법에 차이가 있지만, 데이터분석 관점에서는 공통적인 부분을 갖는다. 즉, 공학이든 사회과학이든 빅 데이터에 대한 분석은 반드시 필요하다. 통계학과 기계학습은 빅 데이터의 분석을 위한 대표적인 분석도구이다. 본 논문에서는 빅 데이터분석을 위한 학습도구에 대하여 알아보고 검색된 빅 데이터 원천에서부터 분석을 거쳐 최종적으로 분석결과를 사용하는 전체과정에 대하여 효율적인 빅 데이터학습 절차에 대하여 제안한다. 특히, 대표적인 빅 데이터 구조를 갖고 있는 특허문서에 대하여 빅데이터학습을 적용하여 특허분석을 수행하고 이 결과를 기술예측에 적용하는 방법에 대하여 연구한다. 제안방법에 대한 실제적용을 위하여 전 세계 특허청으로부터 빅 데이터 관련 특허문서를 검색하여 텍스트 마이닝의 전처리와 통계학의 다중선형회귀분석을 이용한 구체적인 빅 데이터학습에 대한 사례연구를 수행하였다.

통계적 텍스트 마이닝을 이용한 빅 데이터 전처리 (A Big Data Preprocessing using Statistical Text Mining)

  • 전성해
    • 한국지능시스템학회논문지
    • /
    • 제25권5호
    • /
    • pp.470-476
    • /
    • 2015
  • 빅 데이터는 여러 분야에서 다양하게 사용되고 있다. 예를 들어, 컴퓨터학과 사회학에서 빅 데이터에 대한 서로간의 접근방법에 대한 차이는 있겠지만 빅 데이터의 분석을 통한 활용 측면에서는 공통적인 부분을 갖는다. 따라서 대부분의 분야에서 빅 데이터에 대한 의미 있는 분석과 활용은 필요하게 된다. 통계학과 기계학습은 빅 데이터의 분석을 위한 다양한 방법론을 제공한다. 본 논문에서는 빅 데이터분석 과정에 대하여 알아보고 수집된 빅데이터의 원천에서부터 분석을 거쳐 최종적으로 분석결과를 활용하는 전체 과정을 위한 효율적인 빅 데이터 분석방법에 대하여 연구한다. 특히, 빅 데이터의 특성을 갖는 여러 데이터 중 하나인 특허문서 데이터에 대하여 빅데이터분석을 적용하여 효과적인 특허분석을 수행하고 이 결과를 연구개발 기획에 적용하는 방법론에 대하여 제안한다. 제안방법에 대한 실제적용을 위하여 전 세계 특허데이터베이스로부터 실제 기업의 전체 출원, 등록 특허 문서를 수집, 분석하고 연구개발 업무에 활용하는 전 과정에 대한 사례연구를 수행하였다.

데이터 마이닝 기법을 이용한 군 통신·전자 분야 기술 분석 (Analysis of Defense Communication-Electronics Technologies using Data Mining Technique)

  • 백성호;강석중
    • 한국정보통신학회논문지
    • /
    • 제24권6호
    • /
    • pp.687-699
    • /
    • 2020
  • 정부가 주도하는 종래의 하향식 무기체계 개발방식은 기술의 발전속도가 급격하게 빨라짐에 따라, 기술 진부화라는 문제에 직면하게 되었다. 이에 따라 정부는 방위산업 분야에도 기업 주도의 상향식 사업추진 방식을 점진적으로 확대 적용해오고 있다. 상향식 사업추진 방식의 핵심 성공요소는 무엇보다도 방산 기업의 기술기획 역량이다. 본 논문은 국내 방산 기업이 기술기획 활동에 활용할 수 있도록 데이터 마이닝 기법을 통해 특허 데이터를 분석하는 방법을 제시하였다. 주요 내용은 군 통신·전자 분야에 해당하는 기업선정 기법을 제안하고 국제특허분류(IPC)에 대해서 주성분 분석과 군집 분석을 수행하는 것이다. 이를 통해, 9개 기업의 특허를 기반으로 군 통신·전자 분야의 기술을 4개의 그룹으로 분류하고 각 그룹의 대표 기업을 도출하였다.

특허 키워드 시계열분석을 통한 부상기술 예측 (Time Series Analysis of Patent Keywords for Forecasting Emerging Technology)

  • 김종찬;이준혁;김갑조;박상성;장동식
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 춘계학술발표대회
    • /
    • pp.650-652
    • /
    • 2014
  • 국가와 기업의 연구개발투자 및 경영정책 전략 수립에서 미래 부상기술 예측은 매우 중요한 역할을 한다. 기술예측을 위한 다양한 방법들이 사용되고 있으며 특허를 이용한 기술예측 또한 활발히 진행되고 있다. 최근에는 텍스트마이닝을 이용해 특허데이터의 정량적인 분석이 이루어지고 있다. 본 논문에서는 텍스트마이닝과 지수평활법을 이용한 기술예측 방법을 제안한다.

베이지안 이산모형을 이용한 기술예측 (Technology Forecasting using Bayesian Discrete Model)

  • 전성해
    • 한국지능시스템학회논문지
    • /
    • 제27권2호
    • /
    • pp.179-186
    • /
    • 2017
  • 기술예측은 과거부터 현재까지의 기술개발 결과를 수집, 분석하여 특정 기술의 미래 추세 및 상태를 예측하는 것이다. 일반적으로 특허는 현재까지의 기술개발 결과를 가장 잘 가지고 있다. 왜냐하면 특허에 포함된 세부 기술은 일정기간 동안 배타적 권리가 법에 의해 보장되기 때문이다. 따라서 특허 데이터의 분석을 이용한 기술예측의 다양한 연구가 진행되었다. 특허문서의 분석을 위하여 널리 사용되는 특허 키워드 데이터는 주로 기술키워드에 대한 빈도 값으로 이루어진다. 기존의 많은 특허분석에서는 회귀분석, 박스-젠킨스 모형 등 연속형 데이터분석 기법이 적용하였다. 하지만 빈도 데이터는 이산형 데이터이기 때문에 이산형 데이터분석 방법을 사용해야 한다. 본 연구에서는 이와 같은 문제점을 해결하기 위하여 베이지안 포아송 이산모형을 이용한 특허분석 방법을 제안한다. 연구방법의 성능평가를 위하여 지금까지 출원, 등록된 애플의 전체특허를 분석하여 향후 기술을 예측하는 사례분석을 수행한다.

5개국 바이오헬스 산업의 기술융합과 트렌드 분석 : 특허 동시분류분석과 텍스트마이닝을 활용하여 (Technology Convergence & Trend Analysis of Biohealth Industry in 5 Countries : Using patent co-classification analysis and text mining)

  • 박수현;윤영미;김호용;김재수
    • 한국융합학회논문지
    • /
    • 제12권4호
    • /
    • pp.9-21
    • /
    • 2021
  • 본 연구는 IP5국가(KR, EP, JP, US, CN)의 바이오헬스 분야 특허데이터를 기반으로 기술의 융합과 트렌드를 파악하여 해당 산업 분야의 발전 방향을 제시하는 것을 목적으로 한다. 기술융합 현황 파악을 위해 특허 동시분류분석 기반의 네트워크분석과 TF-IDF 기반의 텍스트마이닝을 주요 방법론으로 활용하였고, 분석 결과 바이오헬스 산업의 기술융합 클러스터는 크게 (A)치료용 의료기기, (B)의료데이터프로세싱, (C)생체계측용 의료기기의 세 가지 형태로 도출되었다. 또한 기술융합 결과를 토대로 한 트렌드 분석의 결과에서 우리나라는 (B)의료데이터프로세싱 분야에서 시장선도국으로 도출됨에 따라 향후 상업적 가치가 높은 특허로 시장 우위를 선점할 수 있는 가능성이 높다고 분석되었다. 특히 해당 분야는 2019년 1월 국회에서 통과된 '데이터3법'이라는 정책적 변환과 더불어, 국내 바이오헬스 기업들의 의료데이터 활용 가능성이 확대됨에 따라 해당 기술에 대한 기술융합 활성화 정책 수립과 R&D 지원 전략이 필요할 것으로 전망된다.

산학협력 및 기술이전 촉진을 위한 텍스트마이닝과 사회 네트워크 분석 기반의 특허 분석 방법 (Text Mining and Social Network Analysis-based Patent Analysis Method for Improving Collaboration and Technology Transfer between University and Industry)

  • 이지형;김종우
    • 한국전자거래학회지
    • /
    • 제22권3호
    • /
    • pp.1-28
    • /
    • 2017
  • 지식기반 경제에서 산학협력의 중요성이 커짐에 따라 산학협력에 대한 지원과 연구들이 증가함에도 불구하고 산학협력의 특허 성과인 기술이전 및 기술료 수입은 낮은 편인데, 그 이유는 사업화 가치가 없는 특허들을 과도하게 출원하였기 때문이다. 따라서 본 연구에서는 산학협력 및 기술이전이 가능한 특허를 분석하는 방법을 제안한다. 분석을 위한 특허데이터는 WIPSON을 통하여 4개 대학, 1,061개 특허정보를 수집하여 분석에 활용하였다. 분석 방법은 대학이 보유한 산학협력단의 미국 특허를 대상으로 Quality-Strategy Matrix를 작성하고, Matrix의 Advanced Quality Technology 영역의 특허를 대상으로 텍스트마이닝과 사회네트워크 분석을 실시한 뒤, 핵심 키워드와 IPC 코드를 도출하여 대학별 핵심특허를 분석하였다. 분석결과, H 대학은 4개의 핵심특허와 2개의 핵심 IPC 코드를 도출하였으며, K 대학의 경우 4개의 핵심특허와 2개의 핵심 IPC 코드, Y 대학의 경우 6개의 핵심특허와 1개의 핵심 IPC 코드, 마지막으로 S 대학의 경우 14개의 핵심특허와 2개의 핵심 IPC 코드를 각각 도출하였다. 본 연구는 산학협력 및 기술이전이 가능한 특허와 IPC 코드를 분석하여 대학의 산학협력의 활성화에 기여하는데 그 의의가 있다.

특허 동시분류분석과 텍스트마이닝을 활용한 사물인터넷 기술융합 분석 (Analyzing Technological Convergence for IoT Business Using Patent Co-classification Analysis and Text-mining)

  • 문진희;권의준;금영정
    • 기술혁신연구
    • /
    • 제25권3호
    • /
    • pp.1-24
    • /
    • 2017
  • 최근 기술융합의 핵심현상으로 사물인터넷이 대두되면서 사물인터넷의 기술트렌드 및 기술융합에 관해 많은 연구들이 진행되고 있다. 그러나 기존 연구들의 대부분이 사물인터넷 기술 동향에 대한 정성적 연구에 그치고 있어 기술융합의 구체적 양상을 파악하기 어려운 실정이다. 따라서 본 연구에서는 특허 데이터를 기술의 대용데이터로 간주하고, 동시 분류분석과 텍스트마이닝을 바탕으로 사물인터넷 융합 네트워크를 구축하고 융합의 특성을 분석하였다. 본 연구에서는 먼저 문헌연구를 통해 사물인터넷의 융합을 일으키는 주요 기술군을 디바이스, 네트워크, 플랫폼, 서비스 네 가지로 정의한 후, "Internet of Things" 키워드를 중심으로 미국 특허청에서 수집된 923개 특허의 클래스를 네 가지 기술군에 할당하여 이들 간 관계를 파악하였다. 대부분의 클래스 및 키워드가 디바이스에 관련되어 있으므로, 본 연구에서는 융합 현상을 디바이스 융합과 전체 융합으로 나누어 기술융합 양상을 파악하였다. 디바이스 중심의 사물인터넷 기술을 분석한 결과 센서 디바이스를 비롯한 헬스케어 디바이스, 냉장 및 냉동 장치, 에너지관리 디바이스, 로봇, 임베디드 등이 주요 융합 그룹으로 도출되었다. 전체 기술을 대상으로 분석한 결과 사물인터넷 요소기술을 중심으로 스마트 헬스케어, 스마트 홈, 무인자동차 등 사물인터넷의 다양한 응용영역들이 기술융합을 이루고 있는 것으로 파악되었다. 본 연구 결과는 사물인터넷 기술융합 활성화를 위한 정책 및 전략 수립에 효과적으로 활용될 수 있을 것으로 기대된다.

AI Technology Analysis using Partial Least Square Regression

  • Choi, JunHyeog;Jun, Sunghae
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권3호
    • /
    • pp.109-115
    • /
    • 2020
  • 본 논문에서는 부분 최소 제곱(PLS) 회귀 모형을 이용한 인공지능(AI) 기술 분석을 제안한다. AI 기술은 이제 우리 사회의 대부분의 영역에 영향을 미치고 있다. 따라서 이 기술에 대한 정확한 이해가 필요하게 된다. AI 기술을 분석하기 위하여 전 세계 특허 데이터베이스로부터 AI 관련 특허 문서를 수집하고 텍스트 마이닝 기법을 사용하여 수집된 특허 문서에서 AI 기술 키워드를 추출한다. 본 연구에서는 추출된 AI 키워드 데이터를 PLS 회귀 모형으로 분석한다. 바이오정보학, 사회과학 및 공학 등 다양한 분야에서 고급 데이터 분석을 위하여 사용되는 PLS 회귀 모형은 부분 최소 제곱 기법을 기반으로 한다. 제안 방법의 성능을 확인하기 위하여 AI 특허 문서를 사용하여 분석 실험을 수행하고 제안하는 연구가 실제 문제에 어떻게 적용될 수 있는지 보여 준다. 본 논문은 AI 기술뿐만 아니라 다른 기술 분야에도 적용 할 수 있다.