• 제목/요약/키워드: multiple input processing

검색결과 258건 처리시간 0.022초

사전과 말뭉치를 이용한 한국어 단어 중의성 해소 (Korean Word Sense Disambiguation using Dictionary and Corpus)

  • 정한조;박병화
    • 지능정보연구
    • /
    • 제21권1호
    • /
    • pp.1-13
    • /
    • 2015
  • 빅데이터 및 오피니언 마이닝 분야가 대두됨에 따라 정보 검색/추출, 특히 비정형 데이터에서의 정보 검색/추출 기술의 중요성이 나날이 부각되어지고 있다. 또한 정보 검색 분야에서는 이용자의 의도에 맞는 결과를 제공할 수 있는 검색엔진의 성능향상을 위한 다양한 연구들이 진행되고 있다. 이러한 정보 검색/추출 분야에서 자연어처리 기술은 비정형 데이터 분석/처리 분야에서 중요한 기술이고, 자연어처리에 있어서 하나의 단어가 여러개의 모호한 의미를 가질 수 있는 단어 중의성 문제는 자연어처리의 성능을 향상시키기 위해 우선적으로 해결해야하는 문제점들의 하나이다. 본 연구는 단어 중의성 해소 방법에 사용될 수 있는 말뭉치를 많은 시간과 노력이 요구되는 수동적인 방법이 아닌, 사전들의 예제를 활용하여 자동적으로 생성할 수 있는 방법을 소개한다. 즉, 기존의 수동적인 방법으로 의미 태깅된 세종말뭉치에 표준국어대사전의 예제를 자동적으로 태깅하여 결합한 말뭉치를 사용한 단어 중의성 해소 방법을 소개한다. 표준국어대사전에서 단어 중의성 해소의 주요 대상인 전체 명사 (265,655개) 중에 중의성 해소의 대상이 되는 중의어 (29,868개)의 각 센스 (93,522개)와 연관된 속담, 용례 문장 (56,914개)들을 결합 말뭉치에 추가하였다. 품사 및 센스가 같이 태깅된 세종말뭉치의 약 79만개의 문장과 표준국어대사전의 약 5.7만개의 문장을 각각 또는 병합하여 교차검증을 사용하여 실험을 진행하였다. 실험 결과는 결합 말뭉치를 사용하였을 때 정확도와 재현율에 있어서 향상된 결과가 발견되었다. 본 연구의 결과는 인터넷 검색엔진 등의 검색결과의 성능향상과 오피니언 마이닝, 텍스트 마이닝과 관련한 자연어 분석/처리에 있어서 문장의 내용을 보다 명확히 파악하는데 도움을 줄 수 있을 것으로 기대되어진다.

빅데이터 기반의 정성 정보를 활용한 부도 예측 모형 구축 (Bankruptcy Prediction Modeling Using Qualitative Information Based on Big Data Analytics)

  • 조남옥;신경식
    • 지능정보연구
    • /
    • 제22권2호
    • /
    • pp.33-56
    • /
    • 2016
  • 대부분의 부도 예측에 관한 연구는 재무 변수를 중심으로 통계적 방법 또는 인공지능 기법을 적용하여 부도 예측 모형을 구축하였다. 그러나 재무비율과 같은 회계 정보를 이용한 부도 예측 모형은 재무 제표 결산 시점과 신용평가 시점 간 시차를 고려하지 않을 뿐만 아니라 해당 산업의 경제적 상황과 같은 외부 환경적인 요소를 반영하기 어렵다는 한계점이 존재하였다. 기업의 부도 여부를 예측하기 위해 정량 정보인 재무 변수만을 이용하는 것에 한계가 있음에도 불구하고 정성 정보를 부도 예측 모형에 반영한 연구는 아직 미흡한 실정이다. 본 연구에서는 재무 변수를 이용하는 기존 부도 예측 모형의 성과를 개선하기 위해 빅데이터 기반의 정성 정보를 추가적인 입력 변수로 활용하는 부도 예측 모형을 제안하였다. 제안 모형의 성과 향상은 정성 정보를 예측 모형에 통합시키기에 적합한 형태로 정보의 유형을 변환시킬 수 있는가에 따라 달려있다. 이에 본 연구에서는 정성 정보 처리를 위한 방법으로 빅데이터 분석 기법 중 하나인 텍스트 마이닝(Text Mining)을 활용하였다. 해당 산업과 관련된 경제 뉴스 데이터로부터 경제 상황에 대한 감성 정보를 추출하기 위해 도메인 중심의 감성 어휘 사전을 구축하고, 구축된 어휘 사전을 기반으로 감성 분석(Sentiment Analysis)을 수행하였다. 형태소 분석 등을 포함한 텍스트 전처리 과정을 거쳐 감성 어휘를 추출하고, 각 어휘에 대한 극성 및 감성 점수를 부여하였다. 분석 결과, 전통적 부도 예측 모형에 경제 뉴스 데이터에서 도출한 정성 정보를 반영하는 것은 모형의 성과를 개선하는 것으로 나타났다. 특히, 경제 상황에 대한 부정적 감정이 기업의 부도 여부를 예측하는 데 더욱 효과적임을 알 수 있었다.

회분식 공정이 포함된 화학산업에서의 공급사슬 관리 모델 개발 (A Development of SCM Model in Chemical Industry Including Batch Mode Operations)

  • 박경민;하진국;이의수
    • Korean Chemical Engineering Research
    • /
    • 제46권2호
    • /
    • pp.316-329
    • /
    • 2008
  • 최근의 급변하는 시장 상황의 변화와 제품의 수요에 대한 다양한 요구는 회분식 공정에 의한 다품종 소량생산으로의 전환을 가져오게 하였다. 이러한 회분식 공정은 주로 정밀 화학 관련 제품들인 의약품, 생화학 제품, 농약, 고분자 소재 등의 생산에 사용되어 왔지만, 근래에는 윤활유, 섬유, 석유 화학, 식품 같은 제품의 생산에도 널리 적용되고 있다. 그러나 회분식 공정은 원료의 공급, 제품의 가격 등과 같은 불확실 변수에 의한 조업의 변화가 자주 발생하는 단점이 있다. 이러한 조업의 변화는 조업시간의 변동과 각 부분별 예측량이 달라져 시장 경쟁력을 잃게 된다. 이에 공급망 상에 위치한 각 부서별, 기업별 협력과 조정을 통한 총체적 관점에서의 최적화를 추구하는 공급사슬 관리에 관한 관심이 고도되고 있다. 이에 본 논문에서는 회분식 공정에 공급사슬 관리 기법을 도입하여 원자재의 구매에서부터 분배에 이르는 전과정에 대한 총체적인 최적해를 찾고 각 공급사슬간의 영향력을 조사, 분석하였다. 또한 본 논문에서는 생산계획과 상세일정계획 모델의 통합과 수요에 대한 단계별 예측을 통해 시장 변화와 불확실 변수(uncertainty)에 대한 적절한 대응방안을 모색하여, 회분식 공정에서의 공급사슬 관리 모델을 개발하였다. 이와 함께 각각의 공급사슬간 인터페이스를 통하여 정보와 물류의 통합이 이루어지게 하여, 실제 주문과 수요의 변화에 대하여 생산계획, 구매계획, 일정계획 및 분배계획을 수립하여 안정적인 공급이 이루어지게 하였다.

퍼지알고리즘을 이용한 전기전자기기의 안전진단방법에 대한 연구 (Study on the method of safety diagnosis of electrical equipments using fuzzy algorithm)

  • 이재철
    • 디지털융복합연구
    • /
    • 제16권7호
    • /
    • pp.223-229
    • /
    • 2018
  • 최근 전기기기로 인한 화재발생이 급증함에 따라 기기에 대한 안전진단의 필요성이 높아지고 있다. 본 연구는 지능형의 Fuzzy기술을 이용한 전기기기의 안전진단에 관한 것으로 기기의 사용전류특성, 누적사용시간, 열화특성 및 Arc특성 등의 복합적인 전기안전 요인을 검출하여 진단한다. 이들 안전요인을 실시간으로 추출하기 위하여 각종 Sensor회로, DSP(Digital Signal Processor) 신호처리회로, 무선통신회로 등으로 구성된 Board를 설계하였고, 추출된 4가지 진단정보를 이용하여, 기기의 안전정도를 퍼지수치 값으로 표시하기 위하여 각 정보마다 Gaussian function을 사용한 퍼지 알고리즘을 설계하고 DSP에 실장 하였다. 지능적인 퍼지알고리즘은 4가지의 진단정보를 입력받아 퍼지엔진으로 추론하고 해당기기의 종합적인 안전 상태를 사람의 감성에 익숙한 100단계의 아날로그 퍼지 값으로 출력한다. 본 연구에서 구현된 DSP 하드웨어와 퍼지 알고리즘을 융합한 보드의 실험을 통하여, 전기기기의 운전 중 실시간 안전 상태를 복합적으로 검출하고, 사람에게 친화적인 감성적 퍼지 값으로 진단결과를 출력하는 기능을 소형의 DSP Board에서 구현할 수 있음을 입증하였다. 향후 인공지능 전용 Micom이 출시된다면 지능을 바탕으로 보다 진보된 진단 시스템을 연구할 수 있을 것으로 기대한다.

원격.다원 사용자 환경에서의 순차적 이벤트 공유기에 관한 연구 (A Study on the Serialized Event Sharing System for Multiple Telecomputing User Environments)

  • 유영진;오용선
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2003년도 춘계종합학술대회논문집
    • /
    • pp.344-350
    • /
    • 2003
  • 본 논문에서는 원격ㆍ다원으로 구축된 컴퓨팅 환경에서 공동 사용자간에 발생하는 이벤트를 순서화 하여 공유하는 방법과 이를 멀티미디어 자료에 적용하여 구현함으로써 통신망을 이용한 공동작업의 효과를 향상시키는 공유기술을 제안한다. 이 공유방법은 정보통신망의 서로 다른 지역에 설치된 사용자간의 프리젠테이션, 저작, 활용, 이벤트 발생 등을 원활하게 하여 원격교육, 화상회의, 멀티미디어 콘텐츠 공동저작 둥 원격ㆍ다원 프로젝트의 수행에 있어 효율성을 크게 향상시킨다. 기존의 공동 화이트보드(sharing white board) 시스템에 있어서는, 멀티미디어 단위 콘텐츠를 반드시 전용 프로그램에 의하여 저작하고 이미 저작되어 있는 콘텐츠나 프로그램은 사용할 수 없으며, 원격ㆍ다원으로 접수되는 명령어의 입력순서를 정렬하는 기술이 적용되지 않은 상태였으므로 순서오류에 의한 오동작을 감수해야 하는 문제점을 안고 있었다. 이에, 본 논문은 프로그램의 종류에 관계없이 윈도우 시스템으로부터 입출력 이벤트(event)를 추출하는 기술과 운영체제 내의 프로그램간 전송에 있어 이벤트를 후킹(hooking)하는 기술 및 공유 프로그램의 처리결과를 원격ㆍ다원으로 분산된 환경에 전달하는 알고리듬을 설계하고 이를 구현함으로써 원격ㆍ다원 환경의 모든 참여자가 오류 얼이 동일한 결과를 정확하게 공유할 수 있도록 개선하였다. 본 논문의 공유기술은 멀티미디어 콘텐츠의 공동저작, 원격교육에 있어서 공동칠판의 활용, 화상회의에 있어서 프리젠테이션 화면 제공 등에 활용함으로써 온라인 면대면 효과를 향상시키는 것으로 확인되었다.하였으나(P<0.05), 계란1개당 사료비에서는 18∼20g 공급구간에 유의차가 없었다. (시험 2) 육용종계 하절기 산란피크계의 에너지 공급수준에 관한 연구: 육용종계 산란기의 적정 에너지공급체계를 구명하기 위하여 강원도 홍천군 북방면소재 홍천종계에서 케이지 사양형태의 로스 육용종계 400수를 공시하여 2002년 4월부터 2003년 1월까지 40주간 (24∼64주령) 표2와 같은 4가지 에너지공급체계로 사양시험을 실시한 결과를 요약하면 다음과 같다. 1) 총 산란율, 종란 산란율, 평균난중 및 성계 생존율은 모두 처리간에 유의적인 차이가 인정되지 않았으나, 산란율은 1일 에너지공급량이 많을수록 오히려 저하하는 경향을 보였다. 2) 사료요구율, ME 및 CP요구량과 사료비는 모두 1일 에너지공급량이 많아질수록 증가하는 경향을 보였다(P<0.05).dis에 대한 키토산의 최소저해농도는 각각 0.1461 mg/mL, 0.2419 mg/mL, 0.0980 mg/mL 및 0.0490 mg/mL로 측정되었다. 또한 2%(v/v) 초산 자체의 최소저해농도를 측정한 결과, B. cereus, L. mosocytogenes, E. eoli에 대해서는 control과 비교시 유의적인 항균효과는 나타나지 않았다. 반면에 S. enteritidis의 경우는 배양시간 4시간까지는 항균활성을 나타내었지만, 8시간 이후부터는 S. enteritidis의 성장이 control 보다 높아져 배양시간 20시간에서는 control 보다 약 2배 이상 균주의 성장을 촉진시켰다.차에 따른 개별화 학습을 가능하게 할 뿐만 아니라

  • PDF

딥러닝의 모형과 응용사례 (Deep Learning Architectures and Applications)

  • 안성만
    • 지능정보연구
    • /
    • 제22권2호
    • /
    • pp.127-142
    • /
    • 2016
  • 딥러닝은 인공신경망(neural network)이라는 인공지능분야의 모형이 발전된 형태로서, 계층구조로 이루어진 인공신경망의 내부계층(hidden layer)이 여러 단계로 이루어진 구조이다. 딥러닝에서의 주요 모형은 합성곱신경망(convolutional neural network), 순환신경망(recurrent neural network), 그리고 심층신뢰신경망(deep belief network)의 세가지라고 할 수 있다. 그 중에서 현재 흥미로운 연구가 많이 발표되어서 관심이 집중되고 있는 모형은 지도학습(supervised learning)모형인 처음 두 개의 모형이다. 따라서 본 논문에서는 지도학습모형의 가중치를 최적화하는 기본적인 방법인 오류역전파 알고리즘을 살펴본 뒤에 합성곱신경망과 순환신경망의 구조와 응용사례 등을 살펴보고자 한다. 본문에서 다루지 않은 모형인 심층신뢰신경망은 아직까지는 합성곱신경망 이나 순환신경망보다는 상대적으로 주목을 덜 받고 있다. 그러나 심층신뢰신경망은 CNN이나 RNN과는 달리 비지도학습(unsupervised learning)모형이며, 사람이나 동물은 관찰을 통해서 스스로 학습한다는 점에서 궁극적으로는 비지도학습모형이 더 많이 연구되어야 할 주제가 될 것이다.

R&D 기술 선정을 위한 시계열 특허 분석 기반 지능형 의사결정지원시스템 (An Intelligent Decision Support System for Selecting Promising Technologies for R&D based on Time-series Patent Analysis)

  • 이충석;이석주;최병구
    • 지능정보연구
    • /
    • 제18권3호
    • /
    • pp.79-96
    • /
    • 2012
  • 기술의 발전과 융합이 빠르게 이루어지고 있는 오늘날 유망기술을 어떻게 파악하여, 다양한 후보군들 중에서 최적의 R&D 대상을 어떻게 선정할 것인가에 대한 문제는 주요한 경영의사결정문제 중 하나로 부상하고 있다. 본 연구에서는 이러한 R&D 기술 선정 의사결정을 지원할 수 있는 새로운 지능형 의사결정지원시스템을 제안한다. 본 연구의 의사결정지원시스템은 크게 3가지 모듈로 구성되는데, 우선 첫 번째 모듈인 '기술가치 평가' 모듈에서는 기업이 관심을 갖고 있는 분야의 특허들을 분석하여 유망기술 파악에 요구되는 다양한 차원의 기술가치 평가지수 값들을 산출하는 작업이 이루어진다. 이를 통해, 현재 시점에서의 각 기술의 가치가 다양한 차원에서 평가가 이루어지고 나면, 두 번째 모듈인 '미래기술가치 예측' 모듈에서 이들의 시간 흐름에 따른 변화를 학습한 인공지능 모형을 토대로 각 후보기술들이 미래 시점에 어떤 가치지수값을 갖게 될 것인지 예측값을 산출하게 된다. 마지막 세 번째 모듈인 '최적 R&D 대상기술 선정 지원' 모듈에서는 앞서 두 번째 모듈에서 산출된 각 차원별 예상 가치지수값들을 적절히 가중합하여 기술의 종합적인 미래가치 예측값을 산출하여 의사결정자에게 제공하는 기능을 수행한다. 이를 통해 의사결정자가 자사에 적합한 최적의 R&D 대상기술을 선정할 수 있도록 하였다. 본 연구에서는 제안된 시스템의 적용 가능성을 검증하기 위해, 10년치 특허데이터에 인공신경망 기법을 적용하여 실제 기술가치 예측모형을 구축해 보고, 그 효과를 살펴본다.

우편물 자동구분기의 구분율 향상을 위한 문자인식기의 구현 방법 (An Implementation Method of the Character Recognizer for the Sorting Rate Improvement of an Automatic Postal Envelope Sorting Machine)

  • 임길택;정선화;장승익;김호연
    • 한국산업정보학회논문지
    • /
    • 제12권4호
    • /
    • pp.15-24
    • /
    • 2007
  • 우편물의 자동구분을 위해서는 주소영상의 인식이 필수적이다. 주소영상의 인식 과정은 주소영상 전처리, 문자인식, 주소해석의 과정으로 이루어져 있다. 주소영상 전처리 과정을 통해 추출된 문자영상들은 인식과정으로 전달되고 이 과정에서 각 문자영상마다 다수의 후보문자와 인식 스코어가 생성된다. 주소해석기는 후보문자와 인식 스코어의 집합을 이용하여 유효한 최종 주소를 생성한다. 우편물의 자동구분 율은 주소영상의 인식과정에 포함된 모든 과정의 성능에 따라 좌우되는데 특히 문자인식 성능이 중요한 요인이다. 주소인식에서 좋은 문자인식기란 주소해석이 용이할 수 있도록 신뢰도 높은 후보문자를 생성하는 것이라 할 수 있다. 본 논문에서는 문자인식기에서 신뢰도 높은 후보문자를 생성하는 방법을 제안한다. 논문에서는 현행 우편물 자동구분기의 주소인식 시스템에서 사용되고 있는 MLP 인식기를 개별 문자인식을 위한 인식기로 사용한다. MLP 인식기는 인식 속도와 인식률 측면에서 가장 우수한 인식기의 하나로 알려져 있지만, false alarm과 같은 잘못된 결과를 생성하기도 하는데 이는 주소해석을 어렵게 만드는 주요 요인이 된다. 본 논문에서는 주소해석을 쉽게 하고 우편물 구분율을 높이기 위해 기 구현된 MLP 인식기의 출력값을 재추정하는 방법을 제안한다. 재추정값의 신뢰도를 높이기 위한 인식기의 통계적 동작특성을 생성하는 방법과, 기존 MLP와 신뢰도 재추정기로서 동작하는 Subspace 인식기를 결합하는 방법을 제안한다. 제안 방법의 타당성을 확인하기 위해 우체국에 설치된 우편물구분기로부터 획득한 문자영상을 이용하여 실험하였다. 실험 결과 제안 방법이 개별 문자 및 비문자에 대한 오류율과 기각률 측면에서 높은 신뢰도를 보임을 확인할 수 있었다.

  • PDF