• 제목/요약/키워드: Improved classification system

검색결과 365건 처리시간 0.027초

Word2Vec 기반의 의미적 유사도를 고려한 웹사이트 키워드 선택 기법 (Web Site Keyword Selection Method by Considering Semantic Similarity Based on Word2Vec)

  • 이동훈;김관호
    • 한국전자거래학회지
    • /
    • 제23권2호
    • /
    • pp.83-96
    • /
    • 2018
  • 문서를 대표하는 키워드를 추출하는 것은 문서의 정보를 빠르게 전달할 수 있을 뿐만 아니라 문서의 검색, 분류, 추천시스템 등의 자동화서비스에 유용하게 사용 될 수 있어 매우 중요하다. 그러나 웹사이트 문서에서 출현하는 단어의 빈도수, 단어의 동시출현관계를 통한 그래프 알고리즘 등의 기반으로 키워드를 추출할 경우 웹페이지 구조상 잠재적으로 주제와 관련이 없는 다양한 단어를 포함하고 있는 문제점과 한국어 형태소 분석의 정확성이 떨어지는 형태소 분석기 성능의 한계점 때문에 의미적인 키워드를 추출하는데 어려움이 존재한다. 따라서 본 논문에서는 의미적 단어 위주로 구축된 후보키워드들의 집합과 의미적 유사도 기반의 후보 키워드를 선택하는 방법으로써 의미적 키워드를 추출하지 못하는 문제점과 형태소 분석의 정확성이 떨어지는 문제점을 해결하고 일관성 없는 키워드를 제거하는 필터링 과정을 통해 최종 의미적 키워드를 추출하는 기법을 제안한다. 실 중소기업 웹페이지를 통한 실험 결과, 본 연구에서 제안한 기법의 성능이 통계적 유사도 기반의 키워드 선택기법보다 34.52% 향상된 것을 확인하였다. 따라서 단어 간의 의미적 유사성을 고려하고 일관성 없는 키워드를 제거함으로써 문서에서 키워드를 추출하는 성능을 향상시켰음을 확인하였다.

S.E.R.I. 수술법을 이용한 소건막류의 치료 (Treatment of Bunionette Deformity with S.E.R.I. (simple, effective, rapid, inexpensive) Operation)

  • 김선용;박광환;이진우
    • 대한족부족관절학회지
    • /
    • 제14권1호
    • /
    • pp.25-30
    • /
    • 2010
  • Purpose: The purpose of this study was to evaluate the clinical and radiological outcomes of the S.E.R.I. (simple, effective, rapid, inexpensive) operation for the bunionette deformity. Materials and Methods: Between March 2005 and February 2009, 22 patients (26 feet) who had been treated for the bunionette deformity with minimally invasive osteotomy were reviewed retrospectively. Clinically, Visual Analogue Scale (VAS), American Orthopaedic Foot and Ankle Society (AOFAS) score, shoes selectivity, disappearance of callus and patient's satisfaction level by Coughlin scoring system were evaluated. Radiologically, the bunionette was classified as four types according to the Fallat classification. The 4-5$^{th}$ intermetatarsal angle (4-5$^{th}$ IMA), the 5$^{th}$ metatarsophalangeal angle (5$^{th}$ MPA) and the length of 5th metatarsal bone (5$^{th}$ MTL) were analyzed at preoperatively and at final follow up visit. Results: VAS improved from $6.8{\pm}1.8$ points to $2.2{\pm}1.8$ points (p<0.05). AOFAS score improved from $54.0{\pm}14.2$ points to $90.0{\pm}4.8$ points (p<0.05). There was no change in shoes selectivity. 9 feet (34.6%) were satisfied with excellent results, 16 feet (61.5%) with good results and 1 foot (3.9%) with fair results. The average 4-5$^{th}$ IMA was corrected from $10.1{\pm}2.3^{\circ}$ to $4.4{\pm}1.7^{\circ}$ (p<0.05). The average 5$^{th}$ MPA was corrected from $11.5{\pm}8.6^{\circ}$ to $-0.1{\pm}4.1^{\circ}$ (p<0.05). The average 5$^{th}$ MTL was changed from $66.1{\pm}4.3$ millimeters to $64.1{\pm}4.4$ millimeters (p=0.069). There was no malunion, nonunion or delayed union and other perioperative complications. Conclusion: S.E.R.I. operation is less invasive and easy technique. This procedure is recommendable for the treatment of the bunionette deformity.

전자문서에서 서식인식과 광학문자인식을 이용한 개인정보 탐지 및 보호 시스템 (A Personal Information Security System using Form Recognition and Optical Character Recognition in Electronic Documents)

  • 백종경;지윤석;박재표
    • 한국산학기술학회논문지
    • /
    • 제21권5호
    • /
    • pp.451-457
    • /
    • 2020
  • 전자문서에서 개인정보를 보호하기 위한 방법으로 서식 인식과 광학 문자 인식 기법이 많이 이용되고 있으나 OCR 엔진의 저조한 인식률로 인해서 개인정보를 탐지하지 못하거나 오탐이 많이 발생하고 있고 또한 대량의 전자문서를 분석하는데도 오랜 시간이 걸린다. 본 논문에서는 기존의 방법을 개선하여 전자문서의 이미지 분석 속도와 OCR엔진의 글자 인식률, 그리고 개인정보의 탐지율을 향상할 수 있는 방안을 제시한다. 서식 인식 방법을 이용하여 분석 속도를 높이고, 이미지 보정을 통해 OCR 엔진 분석 속도 및 글자 인식률을 향상한다. 이미지에서의 개인정보 분석 알고리즘을 제안하여 개인정보의 탐지율을 높였다. 실험을 통하여 이미지 서식 인식 시료 1755개를 분석하여 평균 0.24초가 소요되어 기존의 PAID 시스템 서식 인식 방안보다 0.5초 향상되었으며 이미지 서식 인식률은 평균 99%를 기록하였다. 본 논문에서 제안한 방법은 전자문서에서 개인정보를 보호할 수 있는 시스템으로서 공공, 통신사, 금융, 관광, 보안 등 여러분야에서 활용할 수 있을 것이다.

CNN-LSTM 딥러닝 기반 캠퍼스 전력 예측 모델 최적화 단계 제시 (Proposal of a Step-by-Step Optimized Campus Power Forecast Model using CNN-LSTM Deep Learning)

  • 김예인;이세은;권용성
    • 한국산학기술학회논문지
    • /
    • 제21권10호
    • /
    • pp.8-15
    • /
    • 2020
  • 딥러닝을 사용한 예측 방법은 동일한 예측 모델과 파라미터를 사용한다 하더라도 데이터셋의 특성에 따라 결과가 일정하지 않다. 예를 들면, 데이터셋 A에 최적화된 예측 모델 X를 다른 특성을 가진 데이터셋 B에 적용하면 데이터셋 A와 같이 좋은 예측 결과를 기대하기 어렵다. 따라서 높은 정확도를 갖는 예측 모델을 구현하기 위해서는 데이터셋의 성격을 고려하여 예측 모델을 최적화하는 것이 필요하다. 본 논문에서는 하루 대학 캠퍼스 전력사용량을 1시간 단위로 예측하기 위해 데이터셋의 특성이 고려된 예측 모델이 도출되는 일련의 방법을 단계적으로 제시한다. 데이터 전처리 과정을 시작으로, 이상치 제거와 데이터셋 분류 과정 그리고 합성곱 신경망과 장기-단기 기억 신경망이 결합된 알고리즘(CNN-LSTM: Convolutional Neural Networks-Long Short-Term Memory Networks) 기반 하이퍼파라미터 튜닝 과정을 소개한다. 본 논문에서 제안하는 예측 모델은, 각 시간별 24개 포인트에서 2%의 평균 절대비율 오차(MAPE: Mean Absolute Percentage Error)를 보인다. 단순히 예측 알고리즘만을 적용한 모델과는 달리, 단계적 방법을 통해 최적화된 예측 모델을 사용하여 단일 전력 입력 변수만을 사용해서 높은 예측 정확도를 도출한다. 이 예측 모델은 모바일 에너지관리시스템(Energy Management System: EMS) 어플리케이션에 적용되어 관리자나 소비자에게 최적의 전력사용 방안을 제시할 수 있으며 전력 사용 효율 개선에 크게 기여할 것으로 기대된다.

로봇 인터페이스 활용을 위한 가속도 센서 기반 제스처 인식 (Accelerometer-based Gesture Recognition for Robot Interface)

  • 장민수;조용석;김재홍;손주찬
    • 지능정보연구
    • /
    • 제17권1호
    • /
    • pp.53-69
    • /
    • 2011
  • 로봇 자체 또는 로봇에 탑재된 콘텐츠와의 상호작용을 위해 일반적으로 영상 또는 음성 인식 기술이 사용된다. 그러나 영상 음성인식 기술은 아직까지 기술 및 환경 측면에서 해결해야 할 어려움이 존재하며, 실적용을 위해서는 사용자의 협조가 필요한 경우가 많다. 이로 인해 로봇과의 상호작용은 터치스크린 인터페이스를 중심으로 개발되고 있다. 향후 로봇 서비스의 확대 및 다양화를 위해서는 이들 영상 음성 중심의 기존 기술 외에 상호보완적으로 활용이 가능한 인터페이스 기술의 개발이 필요하다. 본 논문에서는 로봇 인터페이스 활용을 위한 가속도 센서 기반의 제스처 인식 기술의 개발에 대해 소개한다. 본 논문에서는 비교적 어려운 문제인 26개의 영문 알파벳 인식을 기준으로 성능을 평가하고 개발된 기술이 로봇에 적용된 사례를 제시하였다. 향후 가속도 센서가 포함된 다양한 장치들이 개발되고 이들이 로봇의 인터페이스로 사용될 때 현재 터치스크린 중심으로 된 로봇의 인터페이스 및 콘텐츠가 다양한 형태로 확장이 가능할 것으로 기대한다.

도메인 특수성이 도메인 특화 사전학습 언어모델의 성능에 미치는 영향 (The Effect of Domain Specificity on the Performance of Domain-Specific Pre-Trained Language Models)

  • 한민아;김윤하;김남규
    • 지능정보연구
    • /
    • 제28권4호
    • /
    • pp.251-273
    • /
    • 2022
  • 최근 텍스트 분석을 딥러닝에 적용한 연구가 꾸준히 이어지고 있으며, 특히 대용량의 데이터 셋을 학습한 사전학습 언어모델을 통해 단어의 의미를 파악하여 요약, 감정 분류 등의 태스크를 수행하려는 연구가 활발히 이루어지고 있다. 하지만 기존 사전학습 언어모델이 특정 도메인을 잘 이해하지 못한다는 한계를 나타냄에 따라, 최근 특정 도메인에 특화된 언어모델을 만들고자 하는 방향으로 연구의 흐름이 옮겨가고 있는 추세이다. 도메인 특화 추가 사전학습 언어모델은 특정 도메인의 지식을 모델이 더 잘 이해할 수 있게 하여, 해당 분야의 다양한 태스크에서 성능 향상을 가져왔다. 하지만 도메인 특화 추가 사전학습은 해당 도메인의 말뭉치 데이터를 확보하기 위해 많은 비용이 소요될 뿐 아니라, 고성능 컴퓨팅 자원과 개발 인력 등의 측면에서도 많은 비용과 시간이 투입되어야 한다는 부담이 있다. 아울러 일부 도메인에서 추가 사전학습 후의 성능 개선이 미미하다는 사례가 보고됨에 따라, 성능 개선 여부가 확실하지 않은 상태에서 도메인 특화 추가 사전학습 모델의 개발에 막대한 비용을 투입해야 하는지 여부에 대해 판단이 어려운 상황이다. 이러한 상황에도 불구하고 최근 각 도메인의 성능 개선 자체에 초점을 둔 추가 사전학습 연구는 다양한 분야에서 수행되고 있지만, 추가 사전학습을 통한 성능 개선에 영향을 미치는 도메인의 특성을 규명하기 위한 연구는 거의 이루어지지 않고 있다. 본 논문에서는 이러한 한계를 극복하기 위해, 실제로 추가 사전학습을 수행하기 전에 추가 사전학습을 통한 해당 도메인의 성능 개선 정도를 선제적으로 확인할 수 있는 방안을 제시한다. 구체적으로 3개의 도메인을 분석 대상 도메인으로 선정한 후, 각 도메인에서의 추가 사전학습을 통한 분류 정확도 상승 폭을 측정한다. 또한 각 도메인에서 사용된 주요 단어들의 정규화된 빈도를 기반으로 해당 도메인의 특수성을 측정하는 지표를 새롭게 개발하여 제시한다. 사전학습 언어모델과 3개 도메인의 도메인 특화 사전학습 언어모델을 사용한 분류 태스크 실험을 통해, 도메인 특수성 지표가 높을수록 추가 사전학습을 통한 성능 개선 폭이 높음을 확인하였다.

해양구조물 움직임에 따른 Topside Module의 HPU에 대한 구조안전성 평가 (Structural Safety Evaluation for the Hydraulic Power Unit of Topside Module According to the Movement of Offshore Plant)

  • 류보림;이진욱;강호근
    • 해양환경안전학회지
    • /
    • 제26권6호
    • /
    • pp.723-731
    • /
    • 2020
  • 해양플랜트는 발주처와 선급에서 요구하는 다양한 항목들을 설계할 시에 반영하여야 한다. 특히, 해양구조물에 탑재되는 Topside Module의 경우 육상플랜트와는 다르게 공간적 제약이 크고 구조물의 움직임과 같은 해상 환경조건 및 안전과 관련된 요구사항들이 많아 그 설계 과정이 매우 까다롭다. 본 연구에서는 Topside Module에 들어가는 주요장비 중 하나인 HPU(Hydraulic Power Unit) 구조물에 작용하는 하중을 DNVGL 규칙에 따라 계산하고, 각 하중조건에 따른 구조안전성 평가를 진행하였고 개발된 제품의 구조 신뢰성을 향상하고자 하였다. 구조해석은 범용프로그램인 MSC 소프트웨어를 사용하였고, 총 5가지 하중 조건으로 구조해석을 진행하여 다양한 움직임에 대한 안전성을 검토하였다. 그 결과 선미 방향 Pitching 상태(Load Case 5)에서 최대 응력이 발생하였고, 응력 수준은 허용응력의 약 85 % 수준이고, 최대변위는 허용치의 약 5 % 수준으로 구조안전성이 확인되었으며 부재 간 간섭은 발생하지 않았다.

유제품 산업의 품질검사를 위한 빅데이터 플랫폼 개발: 머신러닝 접근법 (Building an Analytical Platform of Big Data for Quality Inspection in the Dairy Industry: A Machine Learning Approach)

  • 황현석;이상일;김성현;이상원
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.125-140
    • /
    • 2018
  • 품질검사는 중간상품이나 최종상품을 품질관리 표준을 만족하는 양품과 불량품으로 분리하는 일을 수행한다. 대량생산체계에서 품질을 수작업으로 검사하는 것은 일관성과 효율성을 저하시키므로 대량으로 생산되는 상품의 품질을 검사하는 것은 다수의 공정에서 기계에 의한 자동 확인과 분류를 포함하게 된다. 생산공정에서 발생하는 데이터를 활용하여 공정을 개선하고 최적화하려는 선행 연구들이 많았음에도 불구하고, 실시간에 많은 데이터를 처리하는데 있어서의 기술적인 한계로 인해 실제 구현에서의 제약이 많이 있었다. 최근 빅데이터에 관한 연구에서는 데이터 처리기술을 개선하였고, 실시간에 데이터를 수집, 처리, 분석하는 과정을 가능하게 하게 하고 있다. 본 논문에서는 품질검사를 위한 빅데이터 적용의 단계와 세부사항을 제안하고, 유제품 산업에 적용 사례를 제시하려고 한다. 먼저 선행 연구들을 조사하고, 제조 부문에 적용할 수 있는 빅데이터 분석절차를 제안하며 제안된 방법의 실현가능성을 평가하기 위해서, 유제품 산업 분야의 품질검사과정 중 하나에 회선신경망(Convolutional Neural Network) 기술 및 랜덤포레스트(Random Forest) 기술을 적용하였다. 품질검사를 위해 제품의 뚜껑 및 빨대의 사진을 수집, 처리, 분석하여, 결함 여부를 판단하고, 과거 품질 검사결과와 비교하였다. 제안된 방법은 과거에 수행되었던 품질검사에 비해 분류 정확성 측면에서 의미 있는 개선을 확인할 수 있었다. 본 연구를 통해, 유제품 산업의 빅데이터 활용을 통한 품질검사 정확도 개선 가능성을 확인하였다.

다중이용업소의 내장재 규정의 적용에 관한 연구 (A Study on the Application of the Regulation of the Interior Materials in Entertainment Occupancy)

  • 이주헌;윤명오;김운형
    • 한국화재소방학회논문지
    • /
    • 제15권1호
    • /
    • pp.100-107
    • /
    • 2001
  • 건물 내장재는 화재 발생 시 화염 확산 및 유독성 가스발생의 주원인으로 피난안전계획에 매우 중요하지만 다중이용업소의 인테리어 공사 시 화재성능에 대한 검증 없이 무분별하게 사용되고 있어 동일한 유형의 인명피해가 반복되고 있다. 따라서 본 연구에서는 국내 내장재 사용 실태조사를 통해 현행 관련규정상 문제점을 살펴보고, 이를 효과적으로 개선, 보완할 수 있는 방안을 제시하였다. 연구 결과, 구조체 밀착재를 제외한 내장재는 가칭 화재안전코드규정에서 사용규제하고, 소방·방화완비증명제도 시행 전 허가·신고된 다중이용업소는 건축법시행령에 소급하여 적용 할 수 있는 근거를 마련하며 지하 소규모 업소에 대한 소방방화시설 법제화, 내부 용도 변경 시 내장재사용 도면첨부 및 무단 변경 시 관련기관에 통보조치, 이동성가구에 대한 방염 처리 의무조항 신설, 화재확산 빛 연기 유독성을 기준으로 하는 재료등급 평가 및 시험방법의 개선이 필요한 것으로 사료된다.

  • PDF

Gene Discovery Analysis from Mouse Embryonic Stem Cells Based on Time Course Microarray Data

  • Suh, Young Ju;Cho, Sun A;Shim, Jung Hee;Yook, Yeon Joo;Yoo, Kyung Hyun;Kim, Jung Hee;Park, Eun Young;Noh, Ji Yeun;Lee, Seong Ho;Yang, Moon Hee;Jeong, Hyo Seok;Park, Jong Hoon
    • Molecules and Cells
    • /
    • 제26권4호
    • /
    • pp.338-343
    • /
    • 2008
  • An embryonic stem cell is a powerful tool for investigation of early development in vitro. The study of embryonic stem cell mediated neuronal differentiation allows for improved understanding of the mechanisms involved in embryonic neuronal development. We investigated expression profile changes using time course cDNA microarray to identify clues for the signaling network of neuronal differentiation. For the short time course microarray data, pattern analysis based on the quadratic regression method is an effective approach for identification and classification of a variety of expressed genes that have biological relevance. We studied the expression patterns, at each of 5 stages, after neuronal induction at the mRNA level of embryonic stem cells using the quadratic regression method for pattern analysis. As a result, a total of 316 genes (3.1%) including 166 (1.7%) informative genes in 8 possible expression patterns were identified by pattern analysis. Among the selected genes associated with neurological system, all three genes showing linearly increasing pattern over time, and one gene showing decreasing pattern over time, were verified by RT-PCR. Therefore, an increase in gene expression over time, in a linear pattern, may be associated with embryonic development. The genes: Tcfap2c, Ttr, Wnt3a, Btg2 and Foxk1 detected by pattern analysis, and verified by RT-PCR simultaneously, may be candidate markers associated with the development of the nervous system. Our study shows that pattern analysis, using the quadratic regression method, is very useful for investigation of time course cDNA microarray data. The pattern analysis used in this study has biological significance for the study of embryonic stem cells.