• 제목/요약/키워드: Retrieval Model

검색결과 815건 처리시간 0.027초

문단 단위 가중치 함수와 문단 타입을 이용한 문서 범주화 (Automatic Text Categorization Using Passage-based Weight Function and Passage Type)

  • 주원균;김진숙;최기석
    • 정보처리학회논문지B
    • /
    • 제12B권6호
    • /
    • pp.703-714
    • /
    • 2005
  • 문서 범주화 분야에 대한 연구들은 전체 문서 단위에 한정되어 왔으나, 오늘날 대부분의 전문들이 주요 주제를을 표현하기 위해서 조직화 된 특정 구조로 기술되고 있어, 텍스트 범주화에 대한 새로운 인식이 필요하게 되었다. 이러한 구조는 부주제(Sub-topic)의 텍스트 블록이나 문단(Passage) 단위의 나열로서 표현되는데, 이러한 구조 문서에 대한 부주제 구조를 반영하기 위해서 문단 단위(Passage-based) 문서 범주화 모델을 제안한다. 제안한 모델에서는 문서를 문단들로 분리하여 각각의 문단에 범주(Category)를 할당하고, 각 문단의 범주를 전체 문서의 범주로 병합하는 방법을 사용한다. 전형적인 문서 범주화와 비교할 때, 두 가지 부가적인 절차가 필요한데, 문단 분리와 문단 병합이 그것이다. 로이터(Reuter)의 4가지 하위 집합과 수십에서 수백 KB에 이르는 전문 테스트 컬렉션(KISTl-Theses)을 이용하여 실험하였는데, 다양한 문단 타입들의 효과와 범주 병합 과정에서의 문단 위치의 중요성에 초점을 맞추었다 실험한 결과 산술적(Window) 문단이 모든 테스트 컬렉션에 대해서 가장 좋은 성능을 보였다. 또한 문단은 문서 안의 위치에 따라 주요 주제에 기여하는 바가 다른 것으로 나타났다.

사례기반추론의 유사 임계치 및 커버리지 최적화 (Optimizing Similarity Threshold and Coverage of CBR)

  • 안현철
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제2권8호
    • /
    • pp.535-542
    • /
    • 2013
  • 사례기반추론(CBR)은 많은 장점으로 인해 지금까지 의료진단, 생산계획, 고객분류 등 다양한 분야의 의사결정 지원에 적용되어 왔다. 그러나, 효과적인 CBR 시스템을 설계, 구축하기 위해서는 연구자가 직관적으로 설정해야 할 많은 설계요소들이 존재한다. 본 연구에서는 이러한 CBR의 여러 설계요소들 중 사례 검색 단계에서 결합할 이웃 사례들을 보다 효과적으로 선정할 수 있는 새로운 모형을 제시한다. 기존 연구에서는 결합할 이웃 사례를 선정하는 방법으로 사전에 정해진 이웃사례의 수(k-NN의 k)를 적용하든가, 혹은 최대 유사도의 상대적 비율을 임계치로 사용하는 방식을 적용해 왔다. 하지만, 본 연구에서는 결합할 유사사례를 선택하는 새로운 기준으로 0에서 1사이의 값을 갖는 절대적 유사 임계치를 사용할 것을 제안한다. 이 경우, 임계치 값이 과도하게 작아지게 되면, 예측결과의 생성이 잘 이루어지지 않을 수 있는 문제가 발생할 수 있다. 이에, 전체 학습사례들 중에서 예측결과가 생성된 사례의 비중을 커버리지(coverage)로 정의하고, 이를 유사 임계치 최적화 시 제약조건으로 설정함으로서, 사용자가 원하는 수준의 커버리지는 유지한 상태에서 가장 효과적인 유사 사례를 찾아 추론할 수 있도록 모형을 설계하였다. 제안 모형의 유용성을 검증하기 위해, 본 연구에서는 이 모형을 실존하는 국내 한 온라인 쇼핑몰의 표적 마케팅 사례에 적용하였다. 그 결과, 제안 모형이 CBR의 예측 성과를 유의미하게 개선시킬 수 있음을 확인할 수 있었다.

빅데이터 분석을 활용한 실험계획법 기반의 코팅제 배합비율 최적화 모형 (Optimization Model for the Mixing Ratio of Coatings Based on the Design of Experiments Using Big Data Analysis)

  • 노성여;김영진
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제3권10호
    • /
    • pp.383-392
    • /
    • 2014
  • 코팅제에 대한 연구는 고분자 산업에서 가장 보편화되고 활발하게 연구되고 있는 내용의 하나이다. 코팅제는 전자산업, 의료, 광학 분야 등에서 중요성이 더욱 커지고 있으며, 특히 자동차 및 전자부품의 첨단화에 힘입어 코팅제에 대한 성능과 정밀도 등 기술적인 요구사항이 증가하고 있는 추세이다. 또한 방대한 환경 정보와 상황 정보를 기반으로 한 사물 인터넷과 빅데이터 분석 기술의 도입을 통해 산업 현장에서는 더욱 지능화되고 자동화된 시스템과 처리 기술의 필요성이 높아지고 있다. 이에 본 논문에서는 사물 인터넷 기술과 빅데이터 분석을 활용한 실험계획법 기반의 코팅제 배합 데이터에 대한 최적화 모형을 제안한다. 본 논문에서는 실제 생산현장에서 사용하는 코팅제 배합 기준 데이터와 발생한 오차에 대하여 작업자가 수정한 보정 결과 데이터를 실험계획법을 기반으로 분석하여 최적의 코팅제 배합 기준 데이터를 계산하였다. 또한 빅데이터 분석 기술과 사물 인터넷 기술을 활용하여 기존의 코팅제 배합 기준 데이터만을 적용한 공정이 아니라 제조 환경 정보와 상황 정보를 이용하여 색상과 품질 유지에 가장 중요한 인자를 검색하고 기준값을 보정하는 최적화 모형을 도출하였다. 실험 및 분석을 통해 확보된 기준 데이터는 제조 공정에 적용할 경우 배합의 정확도 향상과 LOT별 작업시간 단축을 가능하게 해주고, 건당 처리시간의 감소로 인한 생산 납품시간 단축, 불량률 감소 등에 따른 원가 절감에 기여할 수 있다. 또한, 다양한 모델링에 대한 제조 공정에서의 표준 데이터를 획득할 수 있다.

MODIS 관측자료를 이용한 러시아 산불 영향 하에 발달한 구름의 미세 물리적 특성 연구 (MODIS-estimated Microphysical Properties of Clouds Developed in the Presence of Biomass Burning Aerosols)

  • 김신영;손병주
    • 대한원격탐사학회지
    • /
    • 제24권4호
    • /
    • pp.289-298
    • /
    • 2008
  • 본 연구에서는 에어로솔의 간접 효과를 고려한 구름의 광학두께와 유효입자반경을 산출하기 위해 새로운 알고리즘을 개발하였다. 구름의 미세물리적 특성을 산출하기 위해 Nakajima and Nakajima(1995)의 방법을 응용하였다. 다양한 대기상태에서 복사전달모델을 이용하여 미리 계산한 서로 다른 LUT을 적용하여 최종 산출물인 구름광학두께와 유효입자반경을 산출하였다. 러시아지역에 산불이 있었던 2003년 5월 한반도 주변을 사례로 선택하였다. 이 때 발생한 에어로솔은 대기 흐름을 따라 한반도까지 도달하여 한반도 주변의 날씨에 매우 많은 영향을 주었다. 본 연구에서는 이 시기에 러시아 지역의 산불로 인하여 발생한 에어로솔이 한반도 주변의 구름에 어떠한 영향을 주는지 알아보았다. 이 사례의 알고리즘 적용을 위해 Terra위성에 탑재된 분광계인 MODIS자료를 사용하였다. 사례분석 결과, 에어로솔이 있는 시기에는 유효입자반경이 $20{\mu}m$ 이상의 큰 구름은 거의 존재하지 않았음에 비해, 에어로솔이 거의 없는 시기에는 $20{\mu}m$ 이상의 큰 구름도 다수 존재하였다. 즉, 에어로솔의 영향하에 발달한 구름은 구름광학두께는 크고, 유효입자반경은 작은 구름이라는 것을 확인할 수 있었다. 이러한 결과는 에어로솔이 구름의 미세물리적 특성을 변화시킨다는 것을 보여준다.

Bi-LSTM 모델을 이용한 음악 생성 시계열 예측 (Prediction of Music Generation on Time Series Using Bi-LSTM Model)

  • 김광진;이칠우
    • 스마트미디어저널
    • /
    • 제11권10호
    • /
    • pp.65-75
    • /
    • 2022
  • 딥러닝은 기존의 분석 모델이 갖는 한계를 극복하고 텍스트, 이미지, 음악 등 다양한 형태의 결과물을 생성할 수 있는 창의적인 도구로 활용되고 있다. 본 고에서는 Niko's MIDI Pack 음원 파일 1,609개를 데이터 셋으로 삼아 전처리 과정을 수행하고, 양방향 장단기 기억 순환 신경망(Bi-LSTM) 모델을 이용하여, 효율적으로 음악을 생성할 수 있는 전처리 방법과 예측 모델을 제시한다. 생성되는 으뜸음을 바탕으로 음악적 조성(調聲)에 적합한 새로운 시계열 데이터를 생성할 수 있도록 은닉층을 다층화하고, 디코더의 출력 게이트에서 인코더의 입력 데이터 중 영향을 주는 요소의 가중치를 적용하는 어텐션(Attention) 메커니즘을 적용한다. LSTM 모델의 인식률 향상을 위한 파라미터로서 손실함수, 최적화 방법 등 설정 변수들을 적용한다. 제안 모델은 MIDI 학습의 효율성 제고 및 예측 향상을 위해 높은음자리표(treble clef)와 낮은음자리표(bass clef)를 구분하여 추출된 음표, 음표의 길이, 쉼표, 쉼표의 길이와 코드(chord) 등을 적용한 다채널 어텐션 적용 양방향 기억 모델(Bi-LSTM with attention)이다. 학습의 결과는 노이즈와 구별되는 음악의 전개에 어울리는 음표와 코드를 생성하며, 화성학적으로 안정된 음악을 생성하는 모델을 지향한다.

생성형 AI의 신뢰도에 대한 탐색적 연구 (An Exploratory Study on the Trustworthiness Analysis of Generative AI)

  • 김소연;조지연;이봉규
    • 인터넷정보학회논문지
    • /
    • 제25권1호
    • /
    • pp.79-90
    • /
    • 2024
  • 본 연구는 대표적인 생성형 AI 기술인 ChatGPT의 이용자 신뢰를 중심으로 이용실태와 지속사용의도에 영향을 미치는 요인, 그리고 신뢰의 영향력이 목적에 따라 달라지는지를 탐색적으로 살펴보았다. 이를 위해 ChatGPT를 많이 이용하는 20대와 30대를 대상으로 설문조사를 실시하였으며 통계 패키지 프로그램인 IBM SPSS 27과 SmartPLS 4.0을 적용하여 분석을 수행하였다. Bhattacherjee의 기대충족모델(ECM)을 기반으로 구조방정식 모델을 구축하고, 경로분석과 다중그룹분석(MGA)를 실시하여 가설을 검증하였다. 본 연구의 결과는, 첫째, ChatGPT 이용자들은 일상적인 도구로 사용하기보다 특정 목적이나 필요에 따라 사용하고 있으며, 대부분의 사용자가 ChatGPT의 환각효과(Hallucination)에 대해 인지하고 있으나 이는 사용을 저해하는 요인은 아니었다. 둘째, 가설검정 결과 독립변수인기대충족, 인지된 유용성, 사용자 만족 요인 모두가 종속변수인 지속이용의도에 긍정적 영향을 미치고 있음을 확인하였다. 셋째, 이용자가 ChatGPT를 이용하는 목적에 따라 신뢰의 영향력이 달라짐이 확인되었다. 이용자가 정보 검색 목적으로 ChatGPT를 활용하는 경우에는 신뢰가 사용자 만족에 영향을 미친 반면, 창작 목적으로 사용하는 경우 영향을 미치지 않는 것으로 나타났다. 본 연구의 결과가 향후 사회와 기업에 있어 생성형 AI의 도입 과정에서 신뢰성의 문제를 해결하고 성공적인 도입을 위한 정책 수립 및 개선방안 도출을 위해 활용될 수 있기를 기대한다.

마우스 난자(卵子)의 체외수정(體外受精)에 관(關)한 연구(硏究) (Mouse In Vitro Fertilization)

  • 임용택;최승헌;김정구;문신용;이진용;장윤석
    • Clinical and Experimental Reproductive Medicine
    • /
    • 제11권2호
    • /
    • pp.51-57
    • /
    • 1984
  • The success of human in vitro fertilization (IVF) & embryo transfer (ET) has focused attention on the culture conditions that can provide optimal development of the preimplantation embryo. Studies of in vitro fertilization using mouse have direct implications to human IVF, since similar conditions are used for both species. Mouse IVF as a quality control system for human IVF & ET was studied since Feb., 1984. The results were as follows: 1. Egg retrieval following superovulation in IeR mice was l5.1${\pm}$5.3 eggs ovulated/mouse (Mean${\pm}$ S.D.) 2. In vitro cleavage rate was 61.7% (1146 eggs cleaved/l858 eggs inseminated) and % blastocyst was 42.6%. 3. In comparison with two media of Ham's F-10 and m-KRB, in vitro cleavage rate were 40.9%/63.l% and %blastocyst were 44.3%/61.2% (P<0.05). 4. It was concluded that mouse IVF system has a valuable place in human IVF & ET as a quality-control system and in human reproductive physiology as a research model.

  • PDF

소셜 네트워크에서 관계 랭킹 모델 (A Model for Ranking Semantic Associations in a Social Network)

  • 오선주
    • 한국전자거래학회지
    • /
    • 제18권3호
    • /
    • pp.93-105
    • /
    • 2013
  • 실생활에서 소셜 네트워크 서비스의 사용은 활성화되고 있으나 이를 비즈니스 차원에서 활용하기 위한 이론적이며 실증적인 연구가 부족한 상황이다. 기존의 다양한 데이터로부터 소셜 네트워크를 구축하고, 구축된 소셜 네트워크에서 잠재적 관계를 도출하거나 찾는 등의 유용한 활용 방법에 대한 연구가 요구된다. 본 연구는 소셜 네트워크에서 잠재되어 있는 관계를 인식하여 유용한 관계를 찾기 위한 방안으로서 소셜 네트워크에서 구성원간 관계를 검색하기 위한 랭킹 방법을 제안한다. 본 연구에서는 온톨로지를 기반으로 개체간 의미적 관계를 유추하여 확장하고 이를 바탕으로 다양한 랭킹 기준을 융통성 있게 조합하여 검색하고자 하는 관계를 효율적으로 찾기 위한 랭킹 모델을 제시하였다. 또한 제안한 연구 방법이 유의미한 것을 보이기 위하여 기업과 대학 간 사회적 네트워크에서 임의의 관계를 검색하고 강도를 측정하는 데 연구 모델을 적용하여 보았다. 본 연구에서 제안하는 시맨틱 웹기반 소셜 네트워크에서 임의의 관계를 검색하여 랭킹하는 방법은 빅데이터 시대에 유용한 관계 정보를 편리하게 검색할 수 있는 효과적인 방법으로 활용이 기대된다.

라이다 시스템을 이용한 ice-crystal cloud의 광학적 특성 관측 및 복사 전달 모델을 통한 복사강제력 산출 (Measurement of Optical Properties of Ice-crystal Cloud using LIDAR System and Retrieval of Its Radiative Forcing by Radiative Transfer Model)

  • 노영민;신동호;이경화;;김영준
    • 한국대기환경학회지
    • /
    • 제25권5호
    • /
    • pp.392-401
    • /
    • 2009
  • Ice-crystal clouds observation was conducted using a GIST/ADEMRC Multi-wavelength Raman lidar system in order to measure vertical profile and optical depth at Gwangju ($35^{\circ}$10'N, $126^{\circ}$53'E), Korea in December 2002, and March and April 2003. Ice-crystal clouds at high altitude can be distinguished from atmospheric aerosols by high depolarization ratio and high altitude. Ice-crystal clouds were observed at 5~12 km altitudes with a high depolarization ratio from 0.2 to 0.5. Optical depth of ice-crystal clouds had varied from 0.14 to 1.81. The radiative effect of observed ice-crystal cloud on climate system was estimated to be negative net flux in short wavelength (0.25~$4.0{\mu}m$) and positive net flux in short+long wavelength (0.25~$100{\mu}m$) at top of the atmosphere. Net flux by ice-crys tal cloud per unit optical depth was comparable to that of Asian dust.

한글 외곽선 폰트의 자소 분할 (Hangul Component Decomposition in Outline Fonts)

  • 구상옥;정순기
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제17권4호
    • /
    • pp.11-21
    • /
    • 2011
  • 본 논문은 한글 외곽선 폰트를 입력으로 글자의 초성, 중성, 종성 요소(컴포넌트)를 통계적-구조적 정보를 이용하여 분할하는 방법을 제안한다. 한 폰트 내에서 한글 컴포넌트는 통계적으로 일정한 위치에 나타나며, 각 컴포넌트를 이루는 획 간의 관계는 그 컴포넌트의 구조적 특징을 나타낸다. 우리는 먼저 각 컴포넌트의 위치를 저장하는 컴포넌트 히스토그램을 생성하여 컴포넌트 위치에 관한 통계 정보를 저장하였다. 그리고 글자의 구조적 정보를 반영하기 위해 픽셀의 방향성 확률을 기반으로 픽셀클러스터를 만들고, 클러스터의 위치, 방향 및 크기, 클러스터간 인접성 정보를 이용하여 후보 획을 추출하였다. 마지막으로 릴렉세이션 레이블링을 통해 후보 획 집합과 미리 정의된 글자 모델 간의 가장 적합한 구조적 매치를 구하였다. 본 논문에서 제안한 컴포넌트 분할방법은 한글 폰트의 조형적 특징에 관한 연구 및 이를 활용한 폰트분류 빛 폰트검색에 활용될 수 있다.