• 제목/요약/키워드: machine learning

검색결과 5,177건 처리시간 0.033초

학계와 산업계의 정보 대중성 변동과 인용 정보에 기반한 최신 기술 동향 식별 시스템 (An Emerging Technology Trend Identifier Based on the Citation and the Change of Academic and Industrial Popularity)

  • 김선호;이준규;와카스 라시드;여운동
    • 기술혁신학회지
    • /
    • 제14권spc호
    • /
    • pp.1171-1186
    • /
    • 2011
  • 본 연구는 대용량 학술 및 특허 데이터 분석을 기본으로하여 중소 기업이 필요로 하는 유망기술을 도출하는 모형을 제시하고자 하였다. 유망기술 발굴은 국가와 기관의 주요 결정권자가 시간이나 돈과 같은 제한된 자원을 효과적으로 사용할 수 있게 하기 위한 중요한 연구이다. 많은 연구자들이 유망기술 발굴 방법에 대한 연구를 수행하고 있고 모델을 제시하고 있지만 아직까지 더 향상된 방법론의 개발이 필요하다. 이 논문은 학계와 산업계의 데이터를 동시에 이용하여 주어진 기술의 유망 기술 여부를 판단하는 모델을 제안한다. 대부분의 다른 유망기술 발굴 모델과는 다르게 이 논문에서 제안하는 모델은 완전자동 학습 방식이 아닌, 전문가가 개입하는 준-자동 학습 방식의 기계 학습 방법을 이용한다. 이는 학습 속도을 양보하고 대신 정확성을 높이기 위한 방법으로 유망기술 발굴 시스템의 원래 목적에 적당하다. 또한 이 모델은 유망기술 초기 신호를 감지하기 위해 학술 데이터의 인용정보를 분석하여 학습하도록 하였다.

  • PDF

화장품원료 온라인 데이터베이스 구축과 활용 (The practical use with online database program of cosmetics' raw materials.)

  • 전상훈;김주덕
    • 대한화장품학회지
    • /
    • 제29권2호
    • /
    • pp.233-250
    • /
    • 2003
  • 현재 화장품 연구업무 및 수출입업무 종사자들이 많이 사용하고 있는 ICID 및 장원기 등의 화장품 원료규격집과 각종 원료메이커들이 제공하는 원료의 기술자료, MSDS 등의 기술문서를 연관 데이터베이스로 처리하여 인터넷 서버&클라이언트의 구조를 통해 사용자들에게 제공되어질 수 있는 온라인형 데이터베이스 프로그램을 개발하였고, 이를 완성한 도구로서 서버로는 Linux Machine을 사용하였고, 데이터베이스서버로는 MySQL Server를, CGI Tool로는 PHP를 사용하였다. 또한 데이터베이스 구조상 차후 확장성을 대비하여 데이터베이스를 연관구조로 작성하였으며, 이는 데이터의 중복성을 피하여 화장품 원료정보의 검색 효율을 높일 수 있었고, 차후 다른 화장품관련데이터베이스와의 상호 연계의 인터페이스를 마련할 수 있었다. 데이터베이스의 특성상 한번 구축되면 원하는 형태로의 자료변환 및 재구성이 용이하여, 아직까지 화장품 원료 데이터베이스가 구축되어 있지 못한 국내현실을 볼 때 본 프로그램이 화장품업계의 소중한 기초자료로 활용되기를 기대한다.

기계학습기법을 이용한 광고 외식 블로그의 자동분류 (Automatic Classification of Advertising Restaurant Blogs Using Machine Learning Techniques)

  • 장재영;이병준;조세진;한다혜;이규홍
    • 한국인터넷방송통신학회논문지
    • /
    • 제16권2호
    • /
    • pp.55-62
    • /
    • 2016
  • 최근 들어 블로그가 제공하는 정보를 활용하여 외식업소를 선택하는 사용자가 크게 늘고 있다. 그러나 국내의 외식관련 블로그들은 파워 블로거에 의한 광고 블로그들이 다수를 차지하고 있어 신뢰성을 잃은 지 오래다. 따라서 블로그의 신뢰성을 확보하기 위해서는 허위 또는 과장되게 작성된 광고 블로그들을 필터링하는 기술이 필수적이다. 본 논문에서는 자동분류 기술을 이용하여 광고 블로그들을 판별하는 기법을 제안한다. 제안된 기법에서는 우선 외식 블로그들 중에서 광고 블로그로 판명된 블로그들을 수집하고 이들에 공통적으로 나타나는 특징들을 분석하였다. 이렇게 추출된 특징들을 이용하여 데이터 마이닝의 자동 분류 알고리즘을 적용하여 광고 블로그 여부를 판단하였다. 또한 다양한 실험을 통해 최적의 알고리즘과 특징들을 선별하였다.

신경망의 노드 가지치기를 위한 유전 알고리즘 (Genetic Algorithm for Node P겨ning of Neural Networks)

  • 허기수;오일석
    • 전자공학회논문지CI
    • /
    • 제46권2호
    • /
    • pp.65-74
    • /
    • 2009
  • 신경망의 구조를 최적화하기 위해서는 노드 또는 연결을 잘라내는 가지치기 방법과 노드를 추가해 나가는 구조 증가 방법이 있다. 이 논문은 신경망의 구조 최적화를 위해 가지치기 방법을 사용하며, 최적의 노드 가지치기를 찾기 위해 유전 알고리즘을 사용한다. 기존 연구에서는 입력층과 은닉층의 노드를 따로 최적화 대상으로 삼았다 우리는 두 층의 노드를 하나의 염색체에 표현하여 동시 최적화를 꾀하였다. 자식은 부모의 가중치를 상속받는다 학습을 위해서는 기존의 오류 역전파 알고리즘을 사용한다. 실험은 UCI Machine Learning Repository에서 제공한 다양한 데이터를 사용하였다. 실험 결과 신경망 노드 가지치기 비율이 평균 $8{\sim}25%$에서 좋은 성능을 얻을 수 있었다. 또한 다른 가지치기 및 구조 증가 알고리즘과의 교차검증에 대한 t-검정 결과 그들에 비해 우수한 성능을 보였다.

다중 클래스 SVM을 이용한 스마트폰 중독 자가진단 시스템 (Self-diagnostic system for smartphone addiction using multiclass SVM)

  • 피수영
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권1호
    • /
    • pp.13-22
    • /
    • 2013
  • 무선으로 응용 프로그램을 다운받아 실행하고 수많은 응용 프로그램들을 통신 접속이 없어도 실행이 가능하다는 점으로 인해 스마트폰 중독이 인터넷 중독보다 심각한 상태이지만 아직까지 스마트폰 중독과 관련된 연구가 부족한 상태이다. 한국정보화진흥원에서 개발한 스마트폰 중독 검사 척도인 S-척도는 문항수가 많아 응답자들이 진단 자체를 회피할 수도 있으며 인구통계학적 변인도 고려하지 않은 상태에서 체크한 문항들에 대한 총점만으로 중독여부를 진단하므로 정확하게 진단하는데 어려움이 있다. 따라서 본 논문에서는 인구통계학적 변인을 포함한 여러 문항들을 추가한 자료들을 대상으로 먼저 스마트폰 중독에 영향을 미치는 중요한 요인들을 추출해 보았다. 추출한 축소문항을 대상으로 데이터마이닝기법 중 하나인 신경망을 이용하여 분류를 하였다. 신경망 학습알고리즘 중에서 BP학습 알고리즘과 다중 SVM을 이용하여 학습을 시켜 비교, 분석 해 본 결과 다중 SVM의 학습율이 조금 더 높게 나타났다. 본 논문에서 제안한 다중 SVM을 이용하여 학습을 한 자가진단 시스템을 이용하면 자료들의 급격한 변화에 대해 뛰어난 적응성을 가지므로 빠른 시간 내에 자신의 중독여부를 정확하게 자가진단 할 수 있다.

QFN 납땜 불량 검출을 위한 효율적인 검사 기법 (Efficient Mechanism for QFN Solder Defect Detection)

  • 김호중;조태훈
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2016년도 춘계학술대회
    • /
    • pp.367-370
    • /
    • 2016
  • QFN(Quad Flat No-leads package)은 SMD(Surface Mount Device) 자재 중의 하나로써, 납땜을 하는 lead 부분이 따로 있지 않아 납땜에 대한 불량이 많이 발생하고 있다. 따라서 본 논문에서는 QFN의 납땜에 대한 불량을 검출하는 기법을 제안하고자 한다. 우리는 QFN의 납땜에 대한 불량 검출을 위해 기계학습 방법 중 하나인 Convolutional Neural Network(CNN)을 사용하였고, CNN에 학습을 시키기 위한 데이터로는 납땜을 한 QFN 컬러 다단 영상을 사용하였다. 이 영상은 3채널 컬러 영상으로, 이를 바로 CNN에 적용시켜 학습시키기에는 문제가 있다. 그렇기 때문에 3채널 컬러 영상을 세개의 1채널 Grayscale 영상(Red, Green, Blue)로 분리시켜 CNN에 적용시켰다. 이렇게 학습시킨 결과를 이용하여 QFN의 납땜에 대한 불량을 검출할 수 있었다. 현재는 Dicing과 Punch에 대해서만 테스트를 해보았기 때문에, 추후에 이를 제외한 다른 것들에 대한 추가적인 연구가 필요하다.

  • PDF

잠재 의미 분석을 적용한 유사 특허 검색 서비스 시스템 (Similar Patent Search Service System using Latent Dirichlet Allocation)

  • 임현근;김재윤;정회경
    • 한국정보통신학회논문지
    • /
    • 제22권8호
    • /
    • pp.1049-1054
    • /
    • 2018
  • 유사 특허를 검색하는 방법으로 기존에는 키워드 검색 방법을 사용하고 최근에는 머신러닝을 활용한 자동분류 방법을 사용하고 있다. 키워드 검색은 데이터 정제를 통해 정형화된 데이터 분석 방법으로 단문일 경우 검색에서는 정확도는 높지만 문서와 같이 여러 단어로 이루어진 장문일 경우 문장에 내포된 의미 분석을 할 수 없었다. 의미 분석 단계에서의 자동 분류 방법은 비정형 데이터 분석 방법으로 여러 단어로 이루어진 문장을 분류하는데 사용되고 있다. 그 동안 두 가지 방법을 결합하여 유사 문서 검색을 하려는 시도가 있었지만 비정형 데이터와 정형 데이터의 동시 사용에는 분석하는 방법이 다르기 때문에 동시 적용에는 알고리즘 상의 문제가 있었다. 이에 본 논문에서는 문서에서 함축된 키워드를 검출하고 잠재 의미 분석(LDA) 방식을 사용하여 사람이 개입하지 않고 문서를 효율적으로 자동분류하고 유사 특허를 검색할 수 있는 방법을 연구하였다.

암묵적 피드백 기반 반려동물 용품 추천 시스템 (Pet Shop Recommendation System based on Implicit Feedback)

  • 최희열;강윤희;강명주
    • 디지털콘텐츠학회 논문지
    • /
    • 제18권8호
    • /
    • pp.1561-1566
    • /
    • 2017
  • 기계 학습과 인공 지능 기술의 발전으로 다양한 응용분야들이 가능해지고 있고, 이중에 추천 시스템은 이미 여러 업체들에서 영화 추천이나 상품 추천 등의 서비스에 적용하여 효과를 보고 있다. 이러한 서비스 중인 추천 시스템들의 대부분은 아이템의 내용을 분석하여 추천하거나 아니면 평점과 같은 직접적인 피드백에 기반하여 시스템을 학습하고 추천하고 있다. 하지만 많은 온라인 쇼핑몰 중에는 아이템의 내용을 분석하는 것이 어렵고, 직접적인 피드백 정보가 없거나 혹은 거의 없어 추천 시스템 구축이 어려운 경우가 많다. 이러한 경우에도 사용자의 상품 조회에 관한 로그 기록들은 어렵지 않게 확보할 수 있고, 로그 기록들만 가지고도 추천 서비스를 제공할 수 있다면 서비스의 질을 향상할 수 있을 것으로 기대된다. 본 논문에서는 사용자의 로그 기록으로부터 암묵적인 피드백인 상품 조회 정보를 추출하고, 암묵적인 피드백에 기반한 추천 시스템을 구현하고, 제안된 시스템은 온라인 반려동물 용품점에 적용하여 확인한다. 즉, 사용자들의 상품조회를 위한 클릭정보만을 활용하여 반려동물 용품 추천 시스템을 구축하여 서비스로 확인한다.

기계학습 알고리즘을 사용한 스포츠 경기장 방문객 마케팅 적용 방안 (A Study on Application of Machine Learning Algorithms to Visitor Marketing in Sports Stadium)

  • 박소현;임선영;박영호
    • 디지털콘텐츠학회 논문지
    • /
    • 제19권1호
    • /
    • pp.27-33
    • /
    • 2018
  • 본 연구에서는 마케팅 분야 중 스포츠 경기장을 찾는 관람객의 빅 데이터를 분석하여 소비자에게 맞춤형 마케팅 서비스를 제공하는 연구를 진행한다. 이를 위해 본 연구에서는 K-평균 군집화 방법을 사용하여 유사 관람객 그룹을 도출하고자 하며, K-근접 이웃 방법을 사용하여 새로운 방문객의 관심 매장을 예측하고자 한다. 실험 결과를 통해 상기 두 가지 알고리즘을 사용하는 것은 유사 관람객 그룹을 도출하며 신규 관람객 입장 시 신규 관람객의 특성에 맞는 적합한 마케팅 서비스를 제공 할 수 있게 하였다.

PHR 기반 개인 맞춤형 건강정보 탐사 알고리즘 설계 (Design of knowledge search algorithm for PHR based personalized health information system)

  • 신문선
    • 디지털융복합연구
    • /
    • 제15권4호
    • /
    • pp.191-198
    • /
    • 2017
  • PHR(Personal Health Record)기반 헬스케어 서비스 플랫폼 지능화를 위해서는 사용자 맞춤형 건강정보 제공서비스가 필요하다. 본 논문에서는 개인 맞춤형 건강정보 추천을 위해서 온톨로지 기반 건강 정보 모델을 제안하였다. 또한 기계학습과 데이터마이닝 기법을 적용한 유사 건강정보 탐사 알고리즘을 설계하였다. 기존의 데이터마이닝 기법중 연관규칙 알고리즘을 확장하여 속성을 기반으로 연관규칙 탐사를 수행하여 지식탐사의 연관성을 높이고 효율적인 탐사시간을 제공할 수 있도록 하였다. 머신러닝의 한 기법인 K근접이웃 알고리즘을 적용하여 사용자 프로파일별 그룹화를 수행하고 유사패턴의 사용자 프로파일을 검색할 수 있도록 하였다. 이는 사용자의 질환과 건강상태에 따른 맞춤형 건강정보 탐사 수행의 효율성을 높인다. 제안된 알고리즘은 개인 맞춤형 헬스케어 서비스 플랫폼에서 추론과정에 적용되어 사용자에게 개인맞춤형건강정보를 추천하는 것을 가능하게 한다. 이는 고령화사회에서 스마트한 자가 건강관리에 활용될 수 있다.