• 제목/요약/키워드: 특허데이터

검색결과 349건 처리시간 0.032초

논문 및 특허 데이터를 활용한 전기자동차 기술 동향 예측 연구 (Electric Vehicle Technology Trends Forecast Research Using the Paper and Patent Data)

  • 구자욱;이종호;정명석;이주연
    • 디지털융복합연구
    • /
    • 제15권2호
    • /
    • pp.165-172
    • /
    • 2017
  • 본 논문에서는 전기자동차를 주제로 SCIE 및 SSCI 저널에 게재한 논문데이터를 활용한 시계열 분석과 국제특허분류(International patent classification, 이하 IPC) 별 특허 데이터를 활용한 시계열 분석과 노드엑셀을 활용한 네트워크 분석을 통해 2001년에서 2014년까지의 전기자동차의 기술 동향을 파악하고 특허와 논문 데이터의 상관관계 분석을 통하여 기술 동향을 분석하였다. 또한 예측기법 중 하나인 가중이동평균법으로 전기자동차의 유망 요소기술을 예측하였다. 본 연구의 결과 전기자동차 요소기술 중 배터리 기술이 유망한 기술로 나타났다.

조건부 랜덤 필드를 이용한 특허 문서의 개체명 인식 (Named Entity Recognition for Patent Documents Based on Conditional Random Fields)

  • 이태석;신수미;강승식
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제5권9호
    • /
    • pp.419-424
    • /
    • 2016
  • 특허 정보검색에서는 검색 정확도를 높이거나 유사 특허들을 검색하기 위한 목적으로 청구항 등 특허 기술 문서의 내용을 대표하는 개체명 인식이 필요하다. 본 연구에서는 특허 개체명을 자동으로 인식하기 위하여 기계 학습 기법에서 태깅 문제 해결에 매우 우수한 성능을 보이는 조건부 랜덤 필드 기법을 이용하는 특허 개체명 인식 방법을 제안하였다. 개체명 태깅이 되어 있는 특허 문서 말뭉치에서 66만 어절을 학습용 데이터로 사용하여 특허 개체명 시스템을 구축하고, 7만 어절을 평가용 데이터로 사용하여 성능 평가를 하였다. 실험 결과에 의하면 개체명 인식 정확도는 93.6%이고, 개체명 인식 성능을 수작업 태깅 결과와 비교하여 일치도를 평가했을 때 카파 계수는 0.67로 나타났다. 이 카파 계수값은 두 사람의 수작업 태깅 결과에 대한 카파 계수 0.6 보다 높은 것으로 특허 개체명 인식 시스템이 수작업 태깅을 대신하여 실용적으로 활용될 수 있음을 확인하였다.

특허 키워드 시계열 분석을 통한 부상 기술 예측 (Time Series Analysis of Patent Keywords for Forecasting Emerging Technology)

  • 김종찬;이준혁;김갑조;박상성;장동식
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제3권9호
    • /
    • pp.355-360
    • /
    • 2014
  • 오늘날 국가와 기업의 연구 개발 투자 및 경영 정책 전략 수립에서 미래 부상 기술 예측은 매우 중요한 역할을 한다. 기술 예측을 위한 다양한 방법들이 사용되고 있으며 특허를 이용한 기술 예측 또한 활발히 진행되고 있다. 특허를 이용한 기술 예측에는 전문가들의 평가와 견해를 통한 정성적인 방법이 주로 사용되어 왔다. 정성적인 방법은 분석 결과의 객관성을 보장하지 못하고 분석에 많은 비용 및 시간이 요구된다. 이런 문제점을 보완하기 위해 최근에는 텍스트 마이닝을 이용한 특허 데이터의 정량적인 분석이 이루어지고 있다. 텍스트 마이닝 기법을 적용함으로써 특허 문서의 통계적 분석이 가능하다. 본 논문에서는 텍스트 마이닝과 ARIMA 분석을 이용한 기술 예측 방법을 제안한다.

Patent Tokenizer: 형태소와 SentencePiece를 활용한 특허문장 토크나이즈 최적화 연구 (Patent Tokenizer: a research on the optimization of tokenize for the Patent sentence using the Morphemes and SentencePiece)

  • 박진우;민재옥;심우철;노한성
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.441-445
    • /
    • 2020
  • 토큰화(Tokenization)는 사람이 작성한 자연어 문장을 기계가 잘 이해할 수 있도록 최소 단위인 토큰으로 분리하는 작업을 말하여, 이러한 토큰화는 자연어처리 전반적인 태스크들의 전처리에 필수적으로 사용되고 있다. 최근 자연어처리 분야에서 높은 성능을 보이며, 다양한 딥러닝 모델에 많이 활용되고 있는 SentencePiece 토큰화는 여러 단어에서 공통적으로 출현하는 부분단어들을 기준으로, BPE 알고리즘을 이용하여 문장을 압축 표현하는 토큰화 방법이다. 본 논문에서는 한국어 기반 특허 문헌의 초록 자연어 데이터를 기반으로 SentencePiece를 비롯한 여러 토큰화 방법에 대하여 소개하며, 해당 방법을 응용한 기계번역 (Neural Machine Translation) 태스크를 수행하고, 토큰화 방법별 비교 평가를 통해 특허 분야 자연어 데이터에 최적화된 토큰화 방법을 제안한다. 그리고 본 논문에서 제안한 방법을 사용하여 특허 초록 한-영 기계번역 태스크에서 성능이 향상됨을 보였다.

  • PDF

TF-IDF와 네트워크분석을 이용한 특허 데이터 분석과 경쟁우위 전략수립에 관한 연구 (A Study on Patent Data Analysis and Competitive Advantage Strategy using TF-IDF and Network Analysis)

  • 윤석용;한경석
    • 디지털콘텐츠학회 논문지
    • /
    • 제19권3호
    • /
    • pp.529-535
    • /
    • 2018
  • 데이터는 폭발적으로 증가하고 있으나 아직도 많은 기업이 데이터 분석을 현황 설명(descriptive analysis)이나 진단 분석(diagnostic analysis)에만 활용하고 예측분석(predictive analysis)이나 기업의 기술전략 분석 등에는 적절하게 활용하고 있지 못하다. 본 연구는 오픈 되어 있는 특허의 IPC 코드, 발명자, 출원일 등의 정형데이터와 청구항 등의 비정형 데이터를 네트워크분석, TF-IDF 등의 빅데이터 분석기법을 활용하여 경쟁기업의 확보 기술과 핵심 기술의 분포, 해외 진출 전략을 파악하기 위한 분석 프로세스를 제시하고 이를 데이터 분석을 통하여 증명하고자 한다.

산업기술정보원의 특허정보 데이타베이스

  • 소대섭
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 1994년도 DB산업기술 활성화를 위한 학술대회 및 기술 심포지움
    • /
    • pp.255-287
    • /
    • 1994
  • 산업재산권 정보는 각국의 특허청에서 발행되는 공개공보와 공고공보에 수록되어 있다. 산업기술정보원은 특허청과 긴밀한 협조하에 산업재산권정보 전량을 입수하여 데이터베이스화하여 산업기술정보유통망(KINITI-IR)을 통하여 일반 이용자에게 서비스하고 있다. 산업재산권 DB제작은 1986년부터 시작되었으며 그 당시 한국 공고특허 DB가 처음으로 제작되었다. 지금은 한국공고특허ㆍ실용신안, 한국공개특허ㆍ실용신안, 의장 등 산업재산권 정보전반에 걸친 DB제작 활동이 수행되고 있다. 우리나라의 산업재산권 정보 발생량은 <표 1>과 같다.

  • PDF

빅데이터 분석 도구 R을 활용한 효율적인 특허 검색어 추출에 관한 연구 (A study on the efficient extraction method of patent search key words using big data analysis tool R)

  • 장정환;장청윤;이련;권혁철;이창호
    • 대한안전경영과학회:학술대회논문집
    • /
    • 대한안전경영과학회 2013년 추계학술대회
    • /
    • pp.387-391
    • /
    • 2013
  • 디지털 기술의 발달로 세계가 정보 및 지식이 주도하는 사회로 급변하고, 지식 재산권의 발전이 급속하게 진행되면서, 각 기업 및 국가들은 그들의 경쟁력을 키우기 위해 지식재산권에 대한 중요성을 강조하고 있다. 이와 같이 지식재산권의 중요성이 강조되는 현실에서 지식재산권의 확보는 기업의 경쟁력을 좌우하는 요소라 할 수 있다. 따라서 본 논문에서는 빅데이터 분석 도구인 R을 이용하여 빠른 시간 안에 사용자가 목적으로 하고 있는 특허검색 결과를 효율적으로 도출할 수 있는 검색어 추출에 관한 연구를 진행하였다. 이를 위해 다섯 단계의 특허 검색 프로세스를 제안하였고 프로그램으로 구현하여 검색목적에 맞는 특허의 검색에 필요한 시간을 대폭 단축시키면서 목표로 하는 특허 검색을 효율적으로 할 수 있었다.

  • PDF

논문·특허 데이터 기반 연구전략 수립 연구 : 차세대 반도체 제조공정 사례를 중심으로 (Study of formulation of research strategy based on paper/patent data : Case Study of Next Generation Semiconductor Manufacturing Process)

  • 조기환;윤정식;송중호;임진호
    • 한국기술혁신학회:학술대회논문집
    • /
    • 한국기술혁신학회 2017년도 추계학술대회 논문집
    • /
    • pp.763-777
    • /
    • 2017
  • 기술집약적 산업의 급격한 기술혁신 속도 및 환경변화에 따른 기술수명 주기의 단축, 기술간 경쟁을 통한 시장지배력의 우위를 선점하기 위해 기술융합을 통한 연구전략 수립은 중요한 이슈가 되고 있다. 최근 4차 산업혁명 기반의 반도체산업이 이러한 예이며, 이와 같은 기술집약적 산업의 기술융합이 매우 중요해짐에 따라, 관련 전략수립을 위한 다양한 방법이 시도되고 있다. 본 논문에서는 데이터 기반의 논문 특허 분석을 통해 반도체산업의 플라즈마 기술이슈의 기술융합 동향 및 특허 동향 분석과 이를 통한 특허 전략 수립 사례를 제시하고자 한다.

  • PDF

특허 패밀리 수를 고려한 머신러닝 기반의 특허 가치 평가 방안 (A Study on Machine Learning-Based Method for Patent Valuation Considering the Number of Patent Families)

  • 이형진;유헌창
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2024년도 춘계학술발표대회
    • /
    • pp.814-817
    • /
    • 2024
  • 특허의 가치를 평가하기 위해서는 특허 데이터에 포함된 다양한 지표가 활용될 수 있으며, 최근 다양한 지표를 머신 러닝 기법으로 분석하여 특허의 가치를 평가하는 연구가 증가하고 있다. 특허의 가치를 올바르게 평가하기 위해서는 여러 지표 중에서 어떤 지표가 특허의 가치에 크게 기여 하는지 판단할 수 있어야 하며, 이에 따라 지표별로 적절한 가중치를 설정할 수 있어야 한다. 제안된 방법은 회귀 모델 기반으로 다양한 지표에 가중치를 적용하여 특허 피인용수를 예측하였으며, 특허 패밀리 수에 적용되는 가중치를 변경하면서 특허 패밀리 수가 특허의 가치에 미치는 영향을 검증하였고, 특허 가치 평가 과정에서 특허 패밀리 수의 중요성에 대해 확인하였다.

  • PDF