• 제목/요약/키워드: 주석기반

검색결과 331건 처리시간 0.026초

데이터준비를 위한 XML 기반의 분산 MDR 검색 시스템 설계 (A Design of XML-Based Distributed MDR Retrieval System for Data Preparation)

  • 고석범;윤성대
    • 한국멀티미디어학회논문지
    • /
    • 제7권9호
    • /
    • pp.1329-1338
    • /
    • 2004
  • 데이터마이닝은 방대한 데이터로부터 다차원적인 정보를 추출하는 것이다. 방대하게 구축되어 있는 데이터베이스에서 임의의 테이블의 컬럼에 대해 참조 할 수 있는 정보는 단순하게 컬럼명과 자료형 혹은 간단한 주석 정도이다. 그러한 비구조적이고 빈약한 내용만으로는 데이터마이닝을 위한 자료수집 및 자료탐색 단계에서 컬럼의 용도와 특성 및 스키마를 파악하여 데이터를 정제하고 수집하는 것이 난해 할 뿐만 아니라 너무 많은 시간이 소요된다. 이러한 문제를 해결하기 위해 본 논문에서는 관계형 데이터베이스 환경에서 데이터준비 단계 에 대부분의 시간을 소요하는 문제를 해결하기 위한 방안을 제안한다. 즉, 데이터 준비 단계에서 유용한 요소들을 메타데이터의 표준인 ISO/IEC : 11179 MDR (MetaData Registry) 규격에 맞는 표준 메타데이터를 제안하고, 이기종 및 이질 DBMS간에 호환 가능한 XML 기반의 분산 MDR 검색 시스템 구조를 제안한다.

  • PDF

영어 SentiWordNet을 이용하여 구축한 한국어 감성어휘사전의 성능 평가와 한계 연구 (Performance and Limitations of a Korean Sentiment Lexicon Built on the English SentiWordNet)

  • 신동혁;김새롬;조동희;뉘엔 민디오;박순강;어건주;남지순
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2016년도 제28회 한글및한국어정보처리학술대회
    • /
    • pp.189-194
    • /
    • 2016
  • 본 연구는 다국어 감성사전 및 감성주석 코퍼스 구축 프로젝트인 MUSE 프로젝트의 일환으로 한국어 감성사전을 구축하기 위해 대표적인 영어 감성사전인 SentiWordNet을 이용하여 한국어 감성사전을 구축하는 방법의 의의와 한계점을 검토하는 것을 목적으로 한다. 우선 영어 SentiWordNet의 117,659개의 어휘중에서 긍정/부정 0.5 스코어 이상의 어휘를 추출하여 구글 번역기를 이용해 자동 번역하는 작업을 실시하였다. 그 중에서 번역이 되지 않거나, 중복되는 경우를 제거하고, 언어학 전문가들의 수작업으로 분류해낸 결과 3,665개의 감성어휘를 획득할 수 있었다. 그러나 이마저도 병명이나 순수 감성어휘로 보기 어려운 사례들이 상당수 포함되어 있어 실제 이를 코퍼스에 적용하여 감성어휘를 자동 판별했을 때에 맛집 코퍼스에서의 재현율(recall)이 긍정과 부정에서 각각 47.4%, 37.7%, IT 코퍼스에서 각각 55.2%, 32.4%에 불과하였다. 이와 더불어 F-measure의 경우, 맛집 코퍼스에서는 긍정과 부정의 값이 각각 62.3%, 38.5%였고, IT 코퍼스에서는 각각 65.5%, 44.6%의 낮은 수치를 보여주고 있어, SentiWordNet 기반의 감성사전은 감성사전으로서의 역할을 수행하기에 충분하지 않은 것으로 나타났다. 이를 통해 한국어 감성사전을 구축할 때에는 한국어의 언어적 속성을 고려한 체계적인 접근이 필요함을 역설하고, 현재 한국어 전자사전 DECO에 기반을 두어 보완 확장중인 SELEX 감성사전에 대해 소개한다.

  • PDF

소프트웨어 개발 비용을 추정하기 위한 사용사례 점수 기반 모델 (A UCP-based Model to Estimate the Software Development Cost)

  • 박주석;정기원
    • 정보처리학회논문지D
    • /
    • 제11D권1호
    • /
    • pp.163-172
    • /
    • 2004
  • 객체지향 개발 방법론을 적용하는 소프트웨어 개발 프로젝트에서 개발 노력 추정 기법으로 사용사례점수(UCP, Use Case Point)에 대한 연구가 계속되고 있다. 기존의 연구는 기술적 요인과 환경적 요인을 적용한 AUCP(Adjusted Use Case Point)에 상수를 곱하여 개발 노력을 계산하는 선형모델을 제시하고 있으나, AUCP와 UUCP(Unadjusted Use Case Point)를 이용하여 개발노력을 추정하는 통계적인 모델은 제시되지 않고 있다. 소프트웨어 규모가 증가함에 따라 개발 기간이 기하급수적으로 증가하는 선형 회귀모델이 부적합하다는 사실과 UCP 계산과정에서 TCF(Technical Complexity Factor)와 EF(Environmental Factor)를 적용에 따른 FP(Function Point) 오차 발생 문제점을 확인하였다. 이 논문은 사용사례점수를 기반으로 하여 기존 연구의 문제점인 TCF와 EF를 고려하지 않고 직접 UUCP로부터 개발 노력을 추정한 수 있는 선형, 로그형, 다항식, 거듭제곱 및 지수함수 회귀모델의 성능을 평가한 결과, 가장 적합한 모델로 지수형태의 비선형 회귀모델을 도출하였다.

회귀분석을 이용한 UCP 기반 소프트웨어 개발 노력 추정 모델 (Software Cost Estimation Model Based on Use Case Points by using Regression Model)

  • 박주석;양해술
    • 한국콘텐츠학회논문지
    • /
    • 제9권8호
    • /
    • pp.147-157
    • /
    • 2009
  • 최근 객체지향 개발 방법론을 적용하는 소프트웨어 개발 프로젝트에서 개발 노력 추정 기법으로 사용사례점수(Use Case Point, UCP)에 대한 연구가 계속되고 있다. 기존의 연구는 기술적 요인과 환경적 요인을 적용한 AUCP(Adjusted Use Case Point)에 상수를 곱하여 개발 노력을 추정하는 선형모델을 제안하고 있다. 그러나 소프트웨어 규모가 증가하면 개발기간은 기하급수적으로 증가함으로서 비선형 회귀모델이 적합하다는 사실과 UCP 계산과정에서 TCF(Technical Complexity Factor)와 EF(Environmental Factor)를 적용함에 따른 FP(Function Point) 오차가 발생함으로서 AUCP로 규모를 추정하는 것은 비현실적이다. 이 논문은 사용사례점수 기반의 기존 연구의 문제점을 제시하고, 기존 연구의 문제점인 TCF와 EF를 고려하지 않고 직접 UUCP로 부터 개발 노력을 추정할 수 있는 모델(선형, 로그형, 다항식, 거듭제곱, 지수형)을 도출하고 평가한다. 그 결과, 기존의 선행 모델보다 비선형모델인 지수형 모델이 우수한 결과를 보였다. 따라서 개발될 소프트웨어 시스템의 UUCP를 계산한 후 제안된 모델을 이용하여 개발 노력을 추정함으로서 개발에 소요되는 직접비용 산정이 가능하다.

사무실 이벤트 검색을 위한 베이지안 네트워크 기반 사용자 선호도 모델링 (Modeling User Preference based on Bayesian Networks for Office Event Retrieval)

  • 임수정;박한샘;조성배
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제14권6호
    • /
    • pp.614-618
    • /
    • 2008
  • 인터넷 서비스의 급속한 발전으로 멀티미디어 데이타의 양이 크게 증가함에 따라, 이를 분석하여 유용한 정보를 얻기 위해 사용자 개개인에 초점을 맞춘 효율적인 검색기술이 필요하게 되었다. 하지만 최근 웹사이트에서 제공하는 사용자 모델링 서비스는 텍스트 기반 페이지 구성이나 추천 검색 등에만 국한되어 있는 단점이 있다. 본 논문에서는 사용자 모델링 기법을 동영상 검색에 적용하기 위해 사용자의 선호도를 베이지안 네트워크로 모델링하고, 추론된 확률 값을 검색에 반영하는 방법을 제안한다. 이를 위해 실제 연구실 환경 내에 존재하는 컨텍스트 정보를 정의하였고, 설치된 카메라로부터 얻어진 동영상이 포함하는 컨텍스트 정보를 텍스트의 형태로 주석을 달았다. 사용자로부터 입력받은 사용자 개인의 정보는 설계된 베이지안 네트워크 모델의 증거 값으로 사용되어, 그로부터 사용자의 선호도를 추론하도록 하였다. 베이지안 네트워크의 추론 결과로 얻어진 확률 값은 검색에 반영되어 각 사용자의 선호도에 맞는 검색 결과를 보여준다. 사용자 평가 결과, 제안하는 모델을 사용하여 선택된 결과의 만족도가 일반적인 검색의 결과에 비해 높음을 확인하였다.

입자침전법을 이용한 다결정 산화수은과 산화납 필름의 방사선 유방촬영 장치 적용성 평가 (The Evaluation of the Thick Polycrystalline HgO and PbO Films Derived by Particle Sedimentation Method for the Mammographic Application)

  • 노시철;박지군;최일홍;정형진;강상식;정봉재
    • 한국방사선학회논문지
    • /
    • 제8권7호
    • /
    • pp.429-433
    • /
    • 2014
  • 본 연구에서는 입자 침전법으로 제작된 HgO와 PbO 기반 영상 센서의 유방촬영 영역에서의 적용 가능성을 조사하였다. 이를 위하여, 다양한 두께에 따른 HgO와 PbO 필름의 물리적 특성과 x선에 대한 양자 효율을 측정하였으며, 몬테카를로 시뮬레이션 결과와 비교 평가하였다. 또한, 입자 침강법을 이용하여 인듐 주석 산화물로 코팅 된 투명 유리기판 위에 대면적 다결정 박막을 제작하였다. 본 연구에서는 단결정의 효율과 비슷한 양자 효율을 얻기 위하여 필름의 두께와 제작 조건을 변화시켜 최적화 하였다. 본 연구의 결과를 기반으로 차후 대면적 a-Si:H 패널에 적합한 대면적 필름의 제작 기술과 최적화 연구가 가능할 것으로 판단된다.

위성통신 환경에서 전파수신감도를 활용한 도심지 최적경로탐색 알고리즘 (Optimal Path Search Algorithm for Urban Applying Received Signal Strength on Satellite Communication Environment)

  • 박노욱;김주석;임주영;임태혁;유창현;권건섭;김경석
    • 한국인터넷방송통신학회논문지
    • /
    • 제12권6호
    • /
    • pp.189-197
    • /
    • 2012
  • 본 논문에서는 위성과 모바일기기 간의 전파수신감도를 활용한 최적경로탐색 알고리즘을 제안한다. 일반적인 경로탐색은 최단경로를 기반으로 하기 때문에 위성을 이용하는 모바일기기의 안정적인 멀티미디어 서비스 제공이 어렵다. 제안된 알고리즘은 전파수신감도를 기반으로 하는 경로탐색을 통해 안정적인 통신환경의 제공을 목적으로 한다. 위성통신에서 수신환경에 따라 전파수신감도 변화가 심하기 때문에 수신환경의 특성을 정확하게 분석하는 것이 매우 중요하다. 전파감쇠 요인으로 대기감쇠, 수풀감쇠, 건물에 의한 감쇠 등을 적용하여 시뮬레이션을 통해 분석하고 전파수신감도로 활용한다. 제안된 알고리즘은 도심지에서 위성을 활용한 안정적인 멀티미디어 서비스 제공을 위한 최적경로를 찾을 수 있다.

ISO 기반 Moon Pool형 다이버 보트 구조 건전성 평가 (Evaluation of Structural Integrity of the ISO-based Moon Pool Type Diver Boats)

  • 강병모;오우준;나현호;최주석
    • 해양환경안전학회지
    • /
    • 제24권5호
    • /
    • pp.597-603
    • /
    • 2018
  • 본 연구는 수중 및 여가활동에 대한 수요 증가에 따른 다이버들을 위한 보트의 구조 건전성에 관한 것이다. 대상 선박은 선체 중앙부에 Moon Pool 구조를 갖추고 있는 소형 쌍동선이며, 연구수행은 ISO Rule 기반의 허용응력 산정을 통한 유한요소 해석법을 이용하여 연구를 수행하였다. 연구수행 방법은 ISO 12215-5와 TC118.1225-7에서 정의하고 있는 계수를 산정하고, 종방향굽힘 모멘트, 비틀림 모멘트, 선저슬래밍 하중 등을 적용하여 ISO 기준과 허용응력 설계법(ASD)에 의한 적합성 여부를 판정하고 유한요소해석(FEA)를 활용한 극한강도 설계법을(LFRD)를 적용하여 수행하였다. 연구결과 문풀형 구조를 가진 선박도 ISO규정, KR규정을 적용하여 설계시 구조적 건전성을 확보하는 것으로 사료된다.

하향 수직 핸드오버 상황에서 송신자에 기반을 둔 TCP 혼잡 제어 기법 (A Novel Sender-Based TCP Congestion Control for Downward Vertical Handover)

  • 최여민;송주석
    • 한국통신학회논문지
    • /
    • 제33권6B호
    • /
    • pp.430-439
    • /
    • 2008
  • 본 논문에서는 셀룰러 망에서 무선 LAN으로 핸드오버를 수행하는 하향 수직 핸드오버 상황에서 TCP의 처리량 저하 문제를 해결하기 위한 송신자 기반의 새로운 혼잡 제어 기법을 제안한다. TCP는 하향 수직 핸드오버와 같이 링크의 특성이 급격히 변하게 되는 상황에 쉽게 적응하지 못하고 처리량이 저하되는 문제가 발생한다. 이 문제의 주된 원인은 셀룰러 망과 무선 LAN의 지연 시간 차이에 의해 생기는 패킷 재정렬에 의한 것으로, TCP는 이로 인해 필요하지 않은 혼잡 제어를 수행한다. 그 결과 TCP의 혼잡 윈도우의 크기가 줄어드는 것은 물론 무선 LAN의 대역폭마저 낭비된다. 본 논문에서는 이러한 현상을 방지하기 위해 송신자 측에서 하향 수직 핸드오버 발생 전까지 측정하던 셀룰러 망의 왕복 시간을 이용하여 재정렬로 인해 발생하는 중복된 ACK를 처리하는 한편, 중복된 ACK를 활용하여 TCP의 혼잡 윈도우 크기를 조절을 통해 TCP의 처리량을 향상 시키는 기법을 제안한다. 시뮬레이션을 통해 본 논문에서 제안한 기법이 하향 수직 핸드오버 수행 시 발생하는 재정렬에 의한 문제를 해결하고, TCP New Reno 및 기존에 제안되어 있는 nodupack 방식에 비해 처리량을 향상시킴을 보인다.

영어 SentiWordNet을 이용하여 구축한 한국어 감성어휘사전의 성능 평가와 한계 연구 (Performance and Limitations of a Korean Sentiment Lexicon Built on the English SentiWordNet)

  • 신동혁;김새롬;조동희;뉘엔 민디오;박순강;어건주;남지순
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2016년도 제28회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.189-194
    • /
    • 2016
  • 본 연구는 다국어 감성사전 및 감성주석 코퍼스 구축 프로젝트인 MUSE 프로젝트의 일환으로 한국어 감성사전을 구축하기 위해 대표적인 영어 감성사전인 SentiWordNet을 이용하여 한국어 감성사전을 구축하는 방법의 의의와 한계점을 검토하는 것을 목적으로 한다. 우선 영어 SentiWordNet의 117,659개의 어휘중에서 긍정/부정 0.5 스코어 이상의 어휘를 추출하여 구글 번역기를 이용해 자동 번역하는 작업을 실시하였다. 그 중에서 번역이 되지 않거나, 중복되는 경우를 제거하고, 언어학 전문가들의 수작업으로 분류해 낸 결과 3,665개의 감성어휘를 획득할 수 있었다. 그러나 이마저도 병명이나 순수 감성어휘로 보기 어려운 사례들이 상당수 포함되어 있어 실제 이를 코퍼스에 적용하여 감성어휘를 자동 판별했을 때에 맛집 코퍼스에서의 재현율(recall)이 긍정과 부정에서 각각 47.4%, 37.7%, IT 코퍼스에서 각각 55.2%, 32.4%에 불과하였다. 이와 더불어 F-measure의 경우, 맛집 코퍼스에서는 긍정과 부정의 값이 각각 62.3%, 38.5%였고, IT 코퍼스에서는 각각 65.5%, 44.6%의 낮은 수치를 보여주고 있어, SentiWordNet 기반의 감성사전은 감성사전으로서의 역할을 수행하기에 충분하지 않은 것으로 나타났다. 이를 통해 한국어 감성사전을 구축할 때에는 한국어의 언어적 속성을 고려한 체계적인 접근이 필요함을 역설하고, 현재 한국어 전자사전 DECO에 기반을 두어 보완 확장중인 SELEX 감성사전에 대해 소개한다.

  • PDF