• 제목/요약/키워드: 단어 데이터베이스

검색결과 208건 처리시간 0.021초

특허 등록 예측을 위한 특허 문서 분석 방법 (Analysis method of patent document to Forecast Patent Registration)

  • 구정민;박상성;신영근;정원교;장동식
    • 한국산학기술학회논문지
    • /
    • 제11권4호
    • /
    • pp.1458-1467
    • /
    • 2010
  • 최근 지식재산권의 모방과 권리 침해는 국가 산업발전의 저해요소로 인식되고 있다. 많은 연구자들은 이러한 저해요소로 인하여 발생하는 막대한 손실을 막기 위해 지식재산권의 보호와 효율적 관리에 관한 연구를 다양하게 진행 중이다. 특히, 특허 등록 예측은 지식재산권 보호와 권리 주장을 위해 매우 중요한 연구이다. 본 연구는 텍스트 마이닝 기법을 이용한 특허문서 분석을 통하여 특허 등록 및 거절 여부를 예측하는 방법을 제안한다. 먼저 거절된 특허문서들의 단어 빈도수를 이용하여 데이터베이스를 생성한다. 그리고 생성한 데이터베이스와 다른 특허문서들을 비교하여 각 문서와 데이터베이스와의 유사한 정도를 판단하는 유사치를 도출한다. 본 논문에서는 특허 거절 기준 값을 선정하기 위하여 분할 군집화 알고리즘인 k-means 사용하였다. 그 결과로 거절된 특허 문서와 유사한 특허 문서는 거절될 가능성이 높다는 결론을 얻을 수 있었다. 실험을 위한 데이터는 현재 미국에 출원되어 있는 블루투스 기술, 태양전지 기술 그리고 디스플레이에 관한 특허 문서를 이용하였다.

동시출현단어 분석을 이용한 토양침식 연구동향 비교 분석 (A Comparison of Current Trends in Soil Erosion Research Using Keyword Co-occurrence Analysis)

  • 임영협;김석우;남수연;전근우;김민석
    • 한국환경생태학회지
    • /
    • 제34권5호
    • /
    • pp.413-424
    • /
    • 2020
  • 최근의 환경정책과 산업은 사후관리에서 사전예방 중심으로 그 패러다임이 변화하고 있다. 이에 따라 국토의 유한자원으로서의 표토의 기능과 가치에 대한 인식 제고를 바탕으로 보전예방적으로 관리하기 위한 정책이 추진되고 있다. 이러한 배경을 바탕으로 이 연구에서는 국제·국내 전문학술지의 검색 데이터베이스(Web of science)를 기반으로 최근 10년간의 연구논문에 대하여 VOSviewer를 이용한 동시출현단어 분석을 실시하여 국내·외 토양침식 연구동향을 비교·분석하고 향후 연구방향을 제안하고자 하였다. 그 결과, 우리나라의 국토면적 대비 토양침식 관련 논문 게재건수는 세계적으로 비교적 상위에 속하고, 특히 토양침식 제어와 관련된 연구가 외국에 비해 큰 비중을 차지하고 있는 것으로 나타났다. 이러한 결과로부터 우리나라에서는 기후·지형·토지이용 여건에 따른 토양침식의 심각성을 인식하고 비교적 활발한 연구가 진행되고 있는 것으로 판단되었다. 그러나 토양침식 제어에 관한 연구영역은 외국에 비해 키워드 수가 적게 나타나 연구항목을 보다 다양화·확장할 필요가 있으며, 특히 토양침식의 프로세스와 이와 관련한 토양의 물리·화학적 특성에 대한 연구는 토양침식에 따른 문제의 근본적인 해결을 위하여 활발히 추진할 필요가 있는 분야로 나타났다.

사회학 분야의 연구데이터 특성과 지적구조 규명에 관한 연구 (An Investigation on Characteristics and Intellectual Structure of Sociology by Analyzing Cited Data)

  • 최형욱;정은경
    • 정보관리학회지
    • /
    • 제34권3호
    • /
    • pp.109-124
    • /
    • 2017
  • 여러 학문 분야에서 데이터의 공유와 재이용에 관한 관심이 증가하고 있다. 실제로 다른 연구자의 데이터를 다시 연구에 사용하고 인용을 부여하는 관행이 서서히 자리를 잡아가고 있다. 이러한 변화를 반영하여 톰슨로이터는 Data Citation Index(DCI)라는 데이터인용 색인 데이터베이스 서비스를 2012년부터 제공하기 시작하였다. DCI는 모든 학문의 전 영역에서 데이터의 인용 현황을 저널의 논문과 유사하게 집계한다. 본 연구에서는 데이터인용이 활발한 사회학 분야의 인용된 연구데이터를 분석하여 해당 분야의 특성과 지적구조를 규명하고자 하였다. 이를 위해 논문인용을 기반으로 한 사회학 분야의 지적구조와 비교하였으며, 사회학 분야의 연구데이터의 특성과 고유한 지적구조를 살펴보고자 하였다. 분석을 위한 데이터는 두 종류로 수집하였다. 첫째는 DCI에서 'Sociology'로 주제 검색을 수행하여 총 8,365건의 인용된 데이터를 수집하였다. 둘째로, 논문 인용 분석과의 비교를 위해서 Web of Science에서 'Sociology'로 주제 검색을 수행하여 총 12,132건의 데이터를 수집하였다. 이 두 데이터를 활용하여 저자키워드 동시출현단어 분석을 수행한 결과, 데이터를 기반으로 한 사회학 분야는 2영역 15군집으로 구성된 반면, 논문을 기반으로 한 사회학 분야는 3영역 17군집으로 나타났다. 내용적인 특성을 살펴보면, 전통적으로 사회학의 지적구조를 나타낸다고 볼 수 있는 논문 기반 사회학과 달리 사회학 분야의 연구데이터는 의학 분야와의 활발한 접목을 찾아볼 수 있으며, 그 중에서도 공중보건과 심리학이 중심 영역인 것으로 나타났다.

온라인 시스템 장애를 원활히 해결하기 위한 챗봇 Q&A시스템 개발 - 예술 교육 서비스를 중심으로 - (A Development of Chatbot Q&A System to Answer Questions in Webpage - Focused on arts education matching services -)

  • 김재민;이혜문;김명영;;이대영
    • 한국컴퓨터게임학회논문지
    • /
    • 제31권4호
    • /
    • pp.157-166
    • /
    • 2018
  • 각종 비즈니스와 거래가 이루어지는 사이트에서 고객과 서비스 공급자와의 소통은 중요한 문제이다. 특히 어떠한 문제가 발생해 문의가 들어왔을 때 그 문제를 빠르고 정확하게 해결하는 능력은 사이트에 대한 신뢰와도 직결된다. 본 논문에서는 재능마켓 플랫폼 사이트에서 챗봇 기술을 이용해 사이트 이용자들의 불평과 문의를 처리하는 방식을 제안한다. 우선 문의자와 실시간으로 대화할 수 있는 챗봇을 구현하여 사이트 이용법, 단어 검색 등의 기능을 이용할 수 있게 하였다. 몇 단어 혹은 문장으로 정의하기 힘든 사이트의 각종 오류와 문제에 대해서는 에러코드를 지정해 데이터베이스화시켰다. 사이트 이용자들은 오류 발생 시 출력되는 에러코드를 챗봇에 문의하여 그에 대응하는 답변을 실시간으로 얻을 수 있었다. 본 연구에서 구현한 챗봇은 사이트 이용 시 오류를 경험하거나 문의가 생긴 이용자에게 빠르고 정확한 답변을 줄 수 있어 만족스러운 경험을 제공했다. 이는 장기적으로 사이트의 신뢰성과 호감도에 긍정적인 영향을 주고 오류 문의 등에 들어가는 인력과 시간비용을 줄이는 등의 도움을 줄 것으로 예상된다.

초·중·고 교육분야의 인공지능(AI) 관련 해외 연구동향 분석 (Analysis of Overseas Research Trends Related to Artificial Intelligence (AI) in Elementary, Middle and High School Education)

  • 정영주;김혜진
    • 한국도서관정보학회지
    • /
    • 제52권3호
    • /
    • pp.313-334
    • /
    • 2021
  • 본 연구는 초·중·고 교육분야 인공지능과 관련된 해외 연구동향을 분석하기 위해 SCOPUS 데이터베이스를 대상으로 관련 문헌을 수집하였다. 수집된 문헌의 발행 기간은 1974년부터 2021년 3월까지이며, 학술지 논문이 154건, 컨퍼런스 논문은 571건으로 나타났다. 이들 논문에 포함된 저자 키워드 및 인덱스 키워드 4,521개의 단어들의 동시출현(co-occurrences) 분석기법을 바탕으로 연구 동향을 분석하였다. 분석결과 machine learning을 주축으로 big data, data mining, data science, deep learning이 최신 연구 동향으로 나타났고, 초·중·고등교육 간에는 차이가 있는 것으로 나타났다. 초등은 로봇 관련 연구가 많이 있었으며, 중등은 게임과 데이터 관련 연구가 많이 있었고, 고등은 다양하고 심도 있는 연구가 이루어졌음을 알 수 있었다. 마지막으로 결과분석에서 우리나라 교육부에서 2020년 9월 발표된 '인공지능 기초' 교육과정과 미국 AK4K12의 '5 Big Ideas'와 초·중·고 공통 상위 50단어와 매핑하여 우리나라 초·중·고 인공지능 교육에 시사점을 제시하였다.

토픽모델링을 이용한 약어 중의성 해소 (Abbreviation Disambiguation using Topic Modeling)

  • 이운교;김자희;양준기
    • 한국시뮬레이션학회논문지
    • /
    • 제32권1호
    • /
    • pp.35-44
    • /
    • 2023
  • 최근 텍스트 분석으로 트렌드 분석이나 연구 동향 분석을 하는 연구 사례가 많다. 텍스트 분석을 위한 자료 수집에 사용되는 검색어가 약어일 때 약어의 특성상 의미 중의성 해소가 필요하다. 다수의 연구에서는 연구에 필요한 자료를 찾기 위해 수작업으로 자료를 하나씩 읽어 문서를 분류하고 있다. 약어의 의미 중의성 해소를 위한 연구는 단어의 의미를 명확화하는 연구가 대부분이고 지도학습을 이용하고 있다. 약어 중의성 해소를 위한 선행 방법은 약어로 검색된 자료에서 연구 대상 자료를 찾는 문서 분류에는 적합하지 않으며 관련 연구도 부족하다. 본 연구에서는 데이터 전처리 단계에서 비지도 학습 방법인 비음수 행렬 분해 방법으로 토픽 모델링을 진행하여 약어로 수집된 문서를 반자동으로 분류하는 방법을 제시한다. 이를 검증하기 위해 'MSA'라는 약어 검색어로 학술 데이터베이스에서 논문 자료를 수집했다. 수집된 논문 1,401편에서 제안된 방법으로 316편의 Micro Services Architecture와 관련된 논문을 찾았다. 제안된 방법의 문서 분류 정확도는 92.36%로 측정되었다. 제안된 방법이 수작업에 따른 연구자의 시간과 비용을 줄일 수 있기를 기대한다.

GMM 기반 실시간 문맥독립화자식별시스템의 성능향상을 위한 프레임선택 및 가중치를 이용한 Hybrid 방법 (Hybrid Method using Frame Selection and Weighting Model Rank to improve Performance of Real-time Text-Independent Speaker Recognition System based on GMM)

  • 김민정;석수영;김광수;정호열;정현열
    • 한국멀티미디어학회논문지
    • /
    • 제5권5호
    • /
    • pp.512-522
    • /
    • 2002
  • 본 논문에서는 GMM(Gaussian Mixture Model)에 기반한 실시간문맥독립화자식별시스템[1][2]의 성능향상을 위하여 프레임선택(Frame Selection)방법과 프레임가중치(Weighting Model Rank)방법을 혼합한 hybrid방법을 제안한다. 본 시스템에서는 GMM의 파라미터를 최적화하기 위하여 MLE(Maximum likelihood estimation)방법과 인식 알고리즘으로 ML(Maximum Likelihood)을 기본적으로 사용하였다. 제안한 hybrid 방법은 두 단계로 이루어진다. 첫째, 화자모델과 테스트 데이터를 이용하여 프레임단위로 유사도를 계산하고, 가장 큰 유사도 값과 두 번째로 큰 유사도 값의 차를 계산한 후, 차가 문턱치보다 큰 프레임만을 선택한다 두 번째로, 선택되어진 프레임에서 계산되어진 유사도 값 대신에 가중치 값을 사용하여 전체 스코어를 계산한다. 특징 파라미터로서는 켑스트럼과 회귀계수를 사용하였으며, 학습과 테스트를 위한 데이터베이스는 채집기간이 다른 여러 데이터베이스들로 구성되어 있으며, 실험을 위한 데이터는 임의의 단어를 선택하여 사용하였다. 화자인식실험은 기본 시스템에 프레임선택방법, 프레임가중치방법, 제안한 Hybrid방법을 각각 적용하여 실험하였다. 실험결과, 프레임선택방법에 비해 평균 4%, 프레임가중치방법에 비해 평균 1%의 인식률 향상을 보여, 본 논문에서 적용한 hybrid방법의 유효성을 확인하였다.

  • PDF

IT 업체정보검색시스템에서 동의어 처리 기법

  • 강옥선;이현철;조완섭
    • 한국정보기술응용학회:학술대회논문집
    • /
    • 한국정보기술응용학회 2001년도 춘계학술대회 E-Business 활성화를 위한 첨단 정보기술
    • /
    • pp.105-106
    • /
    • 2001
  • 일반적인 정보 검색은 색인어를 통해 이루어지는데 이런 경우 사용자는 정보를 검색하기 위해 데이터베이스에 저장된 정보들이 가지고 있는 색인어를 정확하게 입력해야 한다. 그러나 일반 사용자가 색인어를 정확하게 입력하기는 어렵고, 특히 찾고자 하는 분야가 전문 분야에서 사용되는 용어일 때는 더욱 그러하다. 이럴 때 시소러스와 같은 지식구조를 이용해서 색인어를 탐색하여 검색의 효율을 높일 수 있다. 최근 들어 정보기술 분야의 연구가 활발함에 따라 정보자로의 생산이 급격히 증가하고 이를 관련 주제 분야의 연구정보로 활용하는 경우가 증가하고 있다. 따라서 IT 분야의 정보를 관리할 수 있는 시스템의 개발이 시급하다. 또한 IT 분야와 같은 전문분야일 때 검색 시스템에서 사용할 용어의 관리에 대한 연구의 필요성이 증가하고 있다. 본 논문에서는 IT분야의 정보를 검색할 수 있는 IT 업체정보검색시스템에서 정보 검색시에 생기는 용어간의 불일치 문제를 해결하고, 각 용어들간의 계층 관계를 나타내어 정보 검색시 검색어의 확장을 도울 수 있는 용어 관리 시스템의 구조를 제안하고 그에 대한 검색 알고리즘을 제시한다. 제안된 구조는 사용자의 검색어에 대한 동의어 관계나 상위어, 하위어 등의 계층 관계를 파악하여 검색의 범위에 추가함으로써 검색 효율을 높일 수 있다. 또한 새로운 용어의 생성이나 삭제와 같은 연산이 발생했을 때 시스템을 동적으로 확장할 수 있도록 구현하였다. 제안된 시스템은 단어간의 계층 구조를 효율적으로 검색하기 위하여 객체-관계형 데이터베이스를 사용하였다. 또한 메모리 상주 DBMS를 사용하여 많은 사용자들이 동시에 접근하는 환경에서도 빠른 검색 성능을 유지할 수 있도록 하였다. 제시된 방법은 정보기술 분야뿐만 아니라 다른 전문용어 분야의 연구로도 그 범위를 확장 할 수 있다.자기자본비용의 조합인 기회자본비용으로 할인함으로써 현재의 기업가치를 구할 수 있기 때문이다. 이처럼 기업이 영업활동이나 투자활동을 통해 현금을 창출하고 소비하는 경향은 해당 비즈니스 모델의 성격을 규정하는 자료도로 이용될 수 있다. 또한 최근 인터넷기업들의 부도가 발생하고 있는데, 기업의 부실원인이 어떤 것이든 사회전체의 생산력의 감소, 실업의 증가, 채권자 및 주주의 부의 감소, 심리적 불안으로 인한 경제활동의 위축, 기업 노하우의 소멸, 대외적 신용도의 하락 등과 같은 사회적·경제적 파급효과는 대단히 크다. 이상과 같은 기업부실의 효과를 고려할 때 부실기업을 미리 예측하는 일종의 조기경보장치를 갖는다는 것은 중요한 일이다. 현금흐름정보를 이용하여 기업의 부실을 예측하면 기업의 부실징후를 파악하는데 그치지 않고 부실의 원인을 파악하고 이에 대한 대응 전략을 수립하며 그 결과를 측정하는데 활용될 수도 있다. 따라서 본 연구에서는 기업의 부도예측 정보 중 현금흐름정보를 통하여 '인터넷기업의 미래 현금흐름측정, 부도예측신호효과, 부실원인파악, 비즈니스 모델의 성격규정 등을 할 수 있는가'를 검증하려고 한다. 협력체계 확립, ${\circled}3$ 전문인력 확보 및 인력구성 조정, 그리고 ${\circled}4$ 방문보건사업의 강화 등이다., 대사(代謝)와 관계(關係)있음을 시사(示唆)해 주고 있다.ble nutrient (TDN) was highest in booting stage (59.7%); however no significant difference was found among other stages. The concentrations of Ca and P were not different among mature stages. Accordi

  • PDF

정형외과 모의수술을 위한 원격 시뮬레이터의 개발에 관한 연구

  • 최수미;김명희
    • 한국시뮬레이션학회:학술대회논문집
    • /
    • 한국시뮬레이션학회 1996년도 춘계학술대회
    • /
    • pp.6-6
    • /
    • 1996
  • 컴퓨터 통신망의 활용이 각 분야에서 걸쳐서 점차 확대되고 있으며 의료 분야에서도 원격진료(tele-medicine), 원격교육(tele-education), 원격수술(tele-surgery) 등에 대한 시스템 개발이 관심을 끌고 있다. 본 연구에서는 초고속 정보통신망 환경에서 정형외과 모의수술을 하기 위한 시뮬레이터의 프로토타입을 구현하였다. 원격 모의수술 시뮬레이터를 구축하기 위해서는 CT, MRI와 같은 의학영상 처리, 다지점간의 회의를 제어할 수 있는 통신 제어, 환자의 진료를 위한 멀티미디어 데이터의 저장 및 검색을 위한 데이터베이스 구축 등 다양한 기술들의 총체적인 결합이 요구되어진다. 구축 시뮬레이터는 세가지 주요 서브 시스템으로 구성된다. 첫째, 원격 시뮬레이션을 위한 전반적인 관리, 운영, 제어를 담당하는 수술회의 시스템, 둘째, 모의수술을 가능케 하기 위한 2차원 영상의 전처리 3차원 영상 재구성 및 조작을 통한 모의수술 시스템, 셋재, 멀티미디어 환자 자료의 검색 및 관리를 하기 위한 데이터베이스 운영시스템으로 구성된다. 제안된 원격 모의수술 시뮬레이터는 서버-클라이언트 구조를 기반으로 하고, 여러명의 의사가 공동작업(CSCW: Computer Supported Cooperative Work)에 의해 모의수술을 할 수 있도록 공용 윈도우를 기반으로 한 그래픽 사용자 인터페이스를 제공한다. 멀티미디어 의료 데이터의 전송은 TCP/IP 프로토콜을 사용하고, 사용자 인터페이스는 X-window를 이용하여 구축하였다. 본 시뮬레이터는 SUN Server 1000을 서버로 하고, 두대의 SDT Workstation을 클라이언트로 하여 Ethernet 환경에서 구현 및 검증하였다. 또한 ATM Network에서 본 시뮬레이터를 시험함으로써 국책 사업으로 구축되는 초고속 정보통신망 환경에서의 사용 가능성을 입증하였다. 판단된다.원과 섭식장소, 수중생물의 경우는 특히 수온, 수량 영양원등이다.(중략). 본 연구의 접근방법으로는 ASRS의 개념적인 Reference Model을 수립하고 이 Reference Model에 대한 Formal Model로 DEVS(Discrete Event System Specification)을 이용하여 시스템을 Modeling하였다. 이의 Computer Simulation을 위하여 DEVS형식론 환경에서의 Simulation Language인 DEVSim ++ⓒ를 이용하여 시스템을 구현하였다.. 실형 결과로는 먼저 선형 상미분방정식의 예로 mass-damper-spring system, 비선형 상미분방정식의 예로는 van der Pol 방정식, 연립 상미분방정식의 예로는 mixing tank problem 등을 보였으며, 그의 공학에서 일어나는 여러 가지 문제들도 다루었다.화물에 대한 방어력이 증가되어 나타난 결과로 여겨지며, 또한 혈청중의 ALT, ALP 및 LDH활성을 유의성있게 감소시키므로서 감잎 phenolic compounds가 에탄올에 의한 간세포 손상에 대한 해독 및 보호작용이 있는 것으로 사료된다.반적으로 홍삼 제조시 내공의 발생은 제조공정에서 나타나는 경우가 많으며, 내백의 경우는 홍삼으로 가공되면서 발생하는 경우가 있고, 인삼이 성장될 때 부분적인 영양상태의 불충분이나 기후 등에 따른 영향을 받을 수 있기 때문에 앞으로 이에 대한 많은 연구가 이루어져야할 것으로 판단된다.태에도 불구하고 [-wh]의미의 겹의문사는 병렬적 관계의 합성어가 아니라 내부구조를 지니지 않은 단순한 단어(minimal $X^{0}$ elements)로 가정한다. 즉, [+wh] 의미의 겹의문사는 동일한 구성요 소를 지닌 병렬적 합성어([$[W1]_{XO-}$ $[W1]_{

  • PDF

PDA를 위한 내장형 화자인증기의 구현 (An Implementation of Embedded Speaker Identifier for PDA)

  • 김동주;노용완;김동규;정광우;홍광석
    • 융합신호처리학회 학술대회논문집
    • /
    • 한국신호처리시스템학회 2005년도 추계학술대회 논문집
    • /
    • pp.286-289
    • /
    • 2005
  • 기존의 물리적 인증도구를 이용한 방식이나 패스워드 인증 방식은 분실, 도난, 해킹 등에 취약점을 가지고 있다. 따라서 지문, 서명, 홍채, 음성, 얼굴 등을 이용한 생체 인식기술을 보안 기술로 적용하려는 연구가 진행중이며 일부는 실용화도 되고 있다. 본 논문에서는 최근 널리 보급되어 있는 임베디드 시스템중의 하나인 PDA에 음성 기술을 이용한 내장형 화자 인증기를 구현하였다. 화자 인증기는 음성기술에서 널리 사용되고 있는 벡터 양자화 기술과 은닉 마코프 모델 기술을 사용하였으며, PDA의 하드웨어적인 제약 사항을 고려하여 사용되는 벡터 코드북을 두 가지로 다르게 하여 각각 구현하였다. 처음은 코드북을 화자 등록시에 발성음만을 이용하여 생성하고 화자인증 시에 이용하는 방법이며, 다른 하나는 대용량의 음성 데이터베이스를 이용하여 코드북을 사전에 생성하여 이를 화자 인증시에 이용하는 방법이다. 화자인증기의 성능평가는 5명의 화자가 10번씩 5개의 단어에 대하여 실험하여, 각각 화자종속 코득북을 이용한 인증기는 88.8%, 99.5%, 화자독립 코드북을 이용한 인증기는 85.6%, 95.5%의 인증율과 거절율을 보였으며, 93.5%와 90.0%의 평균 확률을 보였다.. 실험을 통하여 화자독립 인증기의 경우가 화자종속 인증기의 경우보다 낮은 인식율을 보였지만, 화자종속 인증기에서 나타나는 코드북 훈련시에 발생하는 메모리 문제를 해결 할 수 있었다.

  • PDF