• 제목/요약/키워드: $(2D)^2$LDA

검색결과 41건 처리시간 0.025초

선형판별분석(LDA)기법을 적용한 국가연구시설장비 표준분류체계의 분류 정확도 검증 (Verifying the Classification Accuracy for Korea's Standardized Classification System of Research F&E by using LDA(Linear Discriminant Analysis))

  • 정석인;송영화;정의덕
    • 경영과정보연구
    • /
    • 제39권1호
    • /
    • pp.35-57
    • /
    • 2020
  • 정부는 연구시설장비가 과학기술의 발전을 견인하는 매우 중요한 도구이자, 수단으로 여겨지면서 국가적으로 R&D와 연구시설장비에 대한 예산 투자를 지속적으로 확대하였다. 또한, 기 구축된 국가연구시설장비의 효율적 운영 및 체계적 관리의 필요성이 점차 대두되면서 2010년 12월, 국가연구시설장비 표준분류체계를 개발하였다. 그러나 연구현장에서는 국가연구시설장비의 NTIS(National Science and Technology Service) 정보수집 초기단계로 누적정보 부족에 따른 표준분류체계의 과학적 검증절차 부재와 동일계층 간 분류기준의 비일관성 문제가 여전히 한계로 제기되고 있다. 따라서 본 연구는 지난 2010년, 2015년 각 제/개정된 국가연구시설장비 표준분류체계(대분류 8개, 중분류 25개, 소분류 410개)의 분류 정확도를 측정하고자 선형판별분석(LDA)과 분산분석(ANOVA) 기법을 적용하여 2단계로 분석하였다. 또한, 본 연구 분석을 위해 지난 10년 동안 NTIS에 누적 등록된 정보데이터(Big-Data) 50,271건을 수집하여 이를 활용하였다. 이는 단순히 국내외 유사 분류체계와 전문가 의견을 토대로 만들어진 현(現) 국가연구시설 표준분류체계를 과학적으로 실증 검증한 첫 연구 사례에 해당된다. 본 연구 결과, 대분류 이하 중분류와 소분류로 분류된 개체 수의 집단별 판별정확도는 92.2% 로 매우 높은 수준이었고, 분산분석을 통한 사후검증에서는 대분류 8개 중 2개 집단의 변별력이 다소 낮게 나타나, 현(現) 표준분류체계 중 일부 개선이 필요한 것으로 조사되었다. 본 연구를 통해 현(現) 국가연구시설장비 표준분류체계가 향후 지속적으로 개선되길 바란다.

Analysis of Secondary Battery Trends Using Topic Modeling: Focusing on Solid-State Batteries

  • Chunghyun Do;Yong Jin Kim
    • Asian Journal of Innovation and Policy
    • /
    • 제12권3호
    • /
    • pp.345-362
    • /
    • 2023
  • As the widespread adoption and proliferation of electric vehicles continue, the secondary battery market is experiencing rapid growth. However, lithium-ion batteries, which constitute a majority of secondary batteries, present high risks of fire and explosion. Solid-state batteries are thus garnering attention as the next-generation batteries since they eliminate fire hazards and significantly reduce the risk of explosions. Against this background, the study aimed to analyze research trends and provide insights by examining 2,927 domestic papers related to solid-state batteries over the past decade (2013-2022). Specifically, we used topic modeling to extract major keywords associated with solid-state batteries research and to explore the network characteristics across major topics. The changes in research on solid-state batteries were analyzed in-depth by calculating topic dominance by year. The findings provide an overview of the emerging trends in domestic solid-state battery research, and might serve as a valuable reference in shaping long-term research directions.

텍스트 마이닝 기법을 활용한 인공지능과 헬스케어 융·복합 분야 연구동향 분석 (Research Trend Analysis by using Text-Mining Techniques on the Convergence Studies of AI and Healthcare Technologies)

  • 윤지은;서창진
    • 한국IT서비스학회지
    • /
    • 제18권2호
    • /
    • pp.123-141
    • /
    • 2019
  • The goal of this study is to review the major research trend on the convergence studies of AI and healthcare technologies. For the study, 15,260 English articles on AI and healthcare related topics were collected from Scopus for 55 years from 1963, and text mining techniques were conducted. As a result, seven key research topics were defined : "AI for Clinical Decision Support System (CDSS)", "AI for Medical Image", "Internet of Healthcare Things (IoHT)", "Big Data Analytics in Healthcare", "Medical Robotics", "Blockchain in Healthcare", and "Evidence Based Medicine (EBM)". The result of this study can be utilized to set up and develop the appropriate healthcare R&D strategies for the researchers and government. In this study, text mining techniques such as Text Analysis, Frequency Analysis, Topic Modeling on LDA (Latent Dirichlet Allocation), Word Cloud, and Ego Network Analysis were conducted.

비정형 텍스트 데이터를 활용한 융합연구개발의 정책 동향 분석 (Analysis of Policy Trends in Convergence Research and Development Using Unstructured Text Data)

  • 이지예;신재은
    • 지식경영연구
    • /
    • 제25권2호
    • /
    • pp.177-191
    • /
    • 2024
  • 현대사회의 다양하고 복잡한 사회적 문제를 해결하기 위해서는 융합적 시각의 문제 분석과 해결책 모색이 필요하다. 이러한 의미에서 융합연구의 중요성이 더욱 강조되고 있으며 효율성과 효과성 제고를 위한 전략적 접근이 요구되고 있다. 본 연구에서는 융합연구개발 활성화 기본계획의 텍스트 분석을 통하여 융합연구 정책의 시기별 특성과 시기별 토픽의 연관성과 변화추이를 확인하고 이를 통해 기본계획이 제시하는 정책적 변화를 이해하고자 하였다. TF-IDF 분석, 토픽 모델링(LDA), 그리고 네트워크(CONCOR) 분석 등 다양한 분석 방법을 활용하여 각 시기별 핵심 토픽을 도출하여 정책 변화 추이를 파악하였다. 분석결과, 시기별 토픽의 군집화와 토픽의 변화를 확인하였고 융합연구 생태계 조성과 당면한 과제 해결을 위한 융합연구의 방향성을 제시하고 있다는 것을 파악할 수 있었다. 본 연구 결과는 향후 거시적 관점에서 융합연구개발 활성화 정책 수립 시에 정책의 변화에 대한 새로운 통찰을 제공함으로써 정부, 기업, 학계, 연구기관 등 다양한 이해관계자들에게 중요한 시사점을 제공할 수 있을 것으로 기대한다.

토픽모델링을 이용한 국내 미세먼지 연구 분류 및 연구동향 분석 (A Study on the Research Topics and Trends in South Korea: Focusing on Particulate Matter)

  • 박혜민;김태용;권대웅;허준용;이주연;양민준
    • 대한원격탐사학회지
    • /
    • 제38권5_3호
    • /
    • pp.873-885
    • /
    • 2022
  • 전 세계적으로 미세먼지(particulate matter, PM)와 사망률 및 유병률 증가의 관련성이 보고되면서 다양한 연구가 수행되었으며, 우리나라에서는 1990년대 후반을 기점으로 PM에 대한 중요성을 인식하고, PM에 대한 다양한 연구가 수행되었다. 본 연구에서는 '미세먼지' 관련 연구들의 주제를 분류하고, 각 주제별 연구 동향을 확인하기 위해 Research Information Sharing Service (RISS)에 게재된 미세먼지 관련 2,764편의 논문을 대상으로 Latent Dirichlet Allocate (LDA) 분석을 수행하였다. 연구 결과, 총 10개의 주제로 분류하는 것이 가장 적합하였으며, 미세먼지 관련 연구주제는 '미세먼지 저감(Topic 1)', '정부 정책 및 관리(Topic 2)', '미세먼지 특성(Topic 3)', '미세먼지 모델(Topic 4)', '환경교육(Topic 5)', '바이오(Topic 6)', '교통수단(Topic 7)', '황사(Topic 8)', '실내 미세먼지 오염(Topic 9)', '인체 위해성(Topic 10)'의 주제로 분류할 수 있었다. 특히, '정부 정책 및 관리(Topic 2)', '미세먼지 모델(Topic 4)', '환경교육(Topic 5)'. '바이오(Topic 6)' 관련 연구주제들이 시간에 따라 전체 논문에 대한 비율이 증가하는 추세를 보여 성행하는 것을 확인하였다(linear slope>0). 본 연구의 결과는 미세먼지 관련 다양한 분야의 연구자들에게 새로운 문헌 고찰의 방법론을 제시하고, 미세먼지 분야의 역사와 발전에 대한 이해를 제공했음에 의의가 있다.

PIV System for the Flow Pattern Anaysis of Artificial Organs ; Applied to the In Vitro Test of Artificial Heart Valves

  • Lee, Dong-Hyeok;Seh, Soo-Won;An, Hyuk;Min, Byoung-Goo
    • 대한의용생체공학회:의공학회지
    • /
    • 제15권4호
    • /
    • pp.489-497
    • /
    • 1994
  • The most serious problems related to the cardiovascular prothesis are thrombosis and hemolysis. It is known that the flow pattern of cardiovascular prostheses is highly correlated with thrombosis and hemolysis. Laser Doppler Anemometry (LDA) is a usual method to get flow pattern, which is difficult to operate and has narrow measure region. Particle Image Velocimetry (PIV) can solve these problems. Because the flow speed of valve is too high to catch particles by CCD camera, high-speed camera (Hyspeed : Holland-Photonics) was used. The estimated maximum flow speed was 5m/sec and maximum trackable length is 0.5 cm, so the shutter speed was determined as 1000 frames per sec. Several image processing techniques (blurring, segmentation, morphology, etc) were used for the preprocessing. Particle tracking algorithm and 2-D interpolation technique which were necessary in making gridrized velocity pronto, were applied to this PIV program. By using Single-Pulse Multi-Frame particle tracking algorithm, some problems of PIV can be solved. To eliminate particles which penetrate the sheeted plane and to determine the direction of particle paths are these solving methods. 1-D relaxation fomula is modified to interpolate 2-D field. Parachute artificial heart valve which was developed by Seoul National University and Bjork-Shiely valve was testified. For each valve, different flow pattern, velocity profile, wall shear stress and mean velocity were obtained.

  • PDF

An experimental investigation into cavitation behaviour and pressure characteristics of alternative blade sections for propellers

  • Korkut, Emin;Atlar, Mehmet;Wang, Dazheng
    • International Journal of Naval Architecture and Ocean Engineering
    • /
    • 제5권1호
    • /
    • pp.81-100
    • /
    • 2013
  • During the final quarter of the last century considerable efforts have been spent to reduce the hull pressure fluctuations caused by unsteady propeller cavitation. This has resulted in further changes in propeller design characteristics including increased skew, tip unloading and introduction of "New Blade Sections" (NBS) designed on the basis of the so-called Eppler code. An experimental study was carried out to investigate flow characteristics of alternative two-dimensional (2-D) blade sections of rectangular planform, one of which was the New Blade Section (NBS) developed in Newcastle University and other was based on the well-known National Advisory Committee for Aeronautics (NACA) section. The experiments comprised the cavitation observations and the measurements of the local velocity distribution around the blade sections by using a 2-D Laser Doppler Anemometry (LDA) system. Analysis of the cavitation tests demonstrated that the two blade sections presented very similar bucket shapes with virtually no width at the bottom but relatively favourable buckets arms at the suction and pressure sides for the NACA section. Similarly, pressure analysis of the sections displayed a slightly larger value for the NBS pressure peak. The comparative overall pressure distributions around the sections suggested that the NBS might be more susceptible to cavitation than the NACA section. This can be closely related to the fundamental shape of the NBS with very fine leading edge. Therefore a further investigation into the modification of the leading edge should be considered to improve the cavitation behaviour of the NBS.

돈육의 신선도 평가를 위한 전자코 시스템 개발 (Development of an Electronic Nose System for Evaluation of Freshness of Pork)

  • 이훈수;조병관;정창호;이기택;조철훈
    • Journal of Biosystems Engineering
    • /
    • 제34권6호
    • /
    • pp.462-469
    • /
    • 2009
  • The aim of this study was to develop a portable electronic nose system for freshness measurement of stored pork. An electronic nose system was constructed using seven different MOS sensor array. To determine the quality change of pork with storage time, the samples were divided into ten groups in terms of storage time with an increment of 2 day up to 19 storage days. GC-MS, total bacteria's count (TBC), thiobarbituric acid reactive substance (TBARS), and pH analyses as well as the analysis of the electronic nose system measurement were performed to monitor the freshness change of the samples. To investigate the performance of the electronic nose system for detecting the change of freshness of pork, the acquired signal values of the system were compared with those of GC-MS, TBC, TBARS, and pH analysis values. According to principal component analysis (PCA) and linear discriminant analysis (LDA) with the signals of the electronic nose system for the pork samples, the sample groups were clearly separated into two groups of 1-9 days and 11-19 days, and four groups of 1-3 days, 5-9 days, 11 days, and 13-19 days respectively. The results show that the electronic nose system has potential for evaluating freshness of pork.

A first-principles theoretical investigation of the structural, electronic and magnetic properties of cubic thorium carbonitrides ThCxN(1-x)

  • Siddique, Muhammad;Rahman, Amin Ur;Iqbal, Azmat;Azam, Sikander
    • Nuclear Engineering and Technology
    • /
    • 제51권5호
    • /
    • pp.1373-1380
    • /
    • 2019
  • Besides promising implications as fertile nuclear materials, thorium carbonitrides are of great interest owing to their peculiar physical and chemical properties, such as high density, high melting point, good thermal conductivity. This paper reports first-principles simulation results on the structural, electronic and magnetic properties of cubic thorium carbonitrides $ThC_xN_{(1-x)}$ (X = 0.03125, 0.0625, 0.09375, 0.125, 0.15625) employing formalism of density-functional-theory. For the simulation of physical properties, we incorporated full-potential linearized augmented plane-wave (FPLAPW) method while the exchange-correlation potential terms in Kohn-Sham Equation (KSE) are treated within Generalized-Gradient-Approximation (GGA) in conjunction with Perdew-Bruke-Ernzerhof (PBE) correction. The structural parameters were calculated by fitting total energy into the Murnaghan's equation of state. The lattice constants, bulk moduli, total energy, electronic band structure and spin magnetic moments of the compounds show dependence on the C/N concentration ratio. The electronic and magnetic properties have revealed non-magnetic but metallic character of the compounds. The main contribution to density of states at the Fermi level stems from the comparable spectral intensity of Th (6d+5f) and (C+N) 2p states. In comparison with spin magnetic moments of ThSb and ThBi calculated earlier with LDA+U approach, we observed an enhancement in the spin magnetic moments after carbon-doping into ThN monopnictide.

사회문제 해결형 기술수요 발굴을 위한 키워드 추출 시스템 제안 (A Proposal of a Keyword Extraction System for Detecting Social Issues)

  • 정다미;김재석;김기남;허종욱;온병원;강미정
    • 지능정보연구
    • /
    • 제19권3호
    • /
    • pp.1-23
    • /
    • 2013
  • 융합 R&D가 추구해야 할 바람직한 방향은 이종 기술 간의 결합에 의한 맹목적인 신기술 창출이 아니라, 당면한 주요 문제를 해결함으로써 사회적 니즈를 충족시킬 수 있는 기술을 개발하는 것이다. 이와 같은 사회문제 해결형 기술 R&D를 촉진하기 위해서는 우선 우리 사회에서 주요 쟁점이 되고 있는 문제들을 선별해야 한다. 그런데 우선적이고 중요한 사회문제를 분별하기 위해 전문가 설문조사나 여론조사 등 기존의 사회과학 방법론을 사용하는 것은 참여자의 선입견이 개입될 수 있고 비용이 많이 소요된다는 한계를 지닌다. 기존의 사회과학 방법론이 지닌 문제점을 보완하기 위하여 본 논문에서는 사회적 이슈를 다루고 있는 대용량의 뉴스기사를 수집하고 통계적인 기법을 통하여 사회문제를 나타내는 키워드를 추출하는 시스템의 개발을 제안한다. 2009년부터 최근까지 3년 동안 10개 주요 언론사에서 생산한 약 백 30만 건의 뉴스기사에서 사회문제를 다루는 기사를 식별하고, 한글 형태소 분석, 확률기반의 토픽 모델링을 통해 사회문제 키워드를 추출한다. 또한 키워드만으로는 정확한 사회문제를 파악하기 쉽지 않기 때문에 사회문제와 연관된 키워드와 문장을 찾아서 연결하는 매칭 알고리즘을 제안하다. 마지막으로 사회문제 키워드 비주얼라이제이션 시스템을 통해 시계열에 따른 사회문제 키워드를 일목요연하게 보여줌으로써 사회문제를 쉽게 파악할 수 있도록 하였다. 특히 본 논문에서는 생성확률모델 기반의 새로운 매칭 알고리즘을 제안한다. 대용량 뉴스기사로부터 Latent Dirichlet Allocation(LDA)와 같은 토픽 모델 방법론을 사용하여 자동으로 토픽 클러스터 세트를 추출할 수 있다. 각 토픽 클러스터는 연관성 있는 단어들과 확률값으로 구성된다. 그리고 도메인 전문가는 토픽 클러스터를 분석하여, 각 토픽 클러스터의 레이블을 결정하게 된다. 이를 테면, 토픽 1 = {(실업, 0.4), (해고, 0.3), (회사, 0.3)}에서 토픽 단어들은 실업문제와 관련있으며, 도메인 전문가는 토픽 1을 실업문제로 레이블링 하게 되고, 이러한 토픽 레이블은 사회문제 키워드로 정의한다. 그러나 이와 같이 자동으로 생성된 사회문제 키워드를 분석하여 현재 우리 사회에서 어떤 문제가 발생하고 있고, 시급히 해결해야 될 문제가 무엇인지를 파악하기란 쉽지 않다. 따라서 제안된 매칭 알고리즘을 사용하여 사회문제 키워드를 요약(summarization)하는 방법론을 제시한다. 우선, 각 뉴스기사를 문단(paragraph) 단위로 세그먼트 하여 뉴스기사 대신에 문단 세트(A set of paragraphs)를 가지게 된다. 매칭 알고리즘은 각 토픽 클러스터에 대한 각 문단의 확률값을 측정하게된다. 이때 토픽 클러스터의 단어들과 확률값을 이용하여 토픽과 문단이 얼마나 연관성이 있는지를 계산하게 된다. 이러한 과정을 통해 각 토픽은 가장 연관성이 있는 문단들을 매칭할 수 있게 된다. 이러한 매칭 프로세스를 통해 사회문제 키워드와 연관된 문단들을 검토함으로써 실제 우리 사회에서 해당 사회문제 키워드와 관련해서 구체적으로 어떤 사건과 이슈가 발생하는 지를 쉽게 파악할 수 있게 된다. 또한 매칭 프로세스와 더불어 사회문제 키워드 가시화를 통해 사회문제 수요를 파악하려는 전문가들은 웹 브라우저를 통해 편리하게 특정 시간에 발생한 사회문제가 무엇이며, 구체적인 내용은 무엇인지를 파악할 수 있으며, 시간 순서에 따른 사회이슈의 변동 추이와 그 원인을 알 수 있게 된다. 개발된 시스템을 통해 최근 3년 동안 국내에서 발생했던 다양한 사회문제들을 파악하였고 개발된 알고리즘에 대한 평가를 수행하였다(본 논문에서 제안한 프로토타입 시스템은 http://dslab.snu.ac.kr/demo.html에서 이용 가능함. 단, 구글크롬, IE8.0 이상 웹 브라우저 사용 권장).