• 제목/요약/키워드: 개념벡터

검색결과 189건 처리시간 0.029초

복합색인어 기반 단문텍스트 감정 인식 기법 (Short Text Emotion Recognition based on Complex Keywords)

  • 한기현;이승룡
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 추계학술발표대회
    • /
    • pp.520-522
    • /
    • 2013
  • 스마트 폰의 확산으로 대화의 개념이 음성에서 텍스트로 확대 되고 있다. 방대하게 누적되고 있는 메신저의 텍스트 데이터로부터 유용한 정보들을 찾아 사용자에게 추천서비스를 제공할 수 있다. 이를 뒷받침 해주기 위해서는 텍스트 감정 인식이 중요하다. 기존에는 PMI기법과 감정키워드를 이용하여 감정을 분류 하였다. 그러나 특정단어로 감정을 분류하기 때문에 정확도가 낮았다. 본 논문에서는 복합색인어 기반 텍스트 감정 인식 기법을 제안한다. 문장에서 동사와 복합색인어를 추출하여 음운으로 분해한다. 그리고 스트링커널에서 벡터 값을 추출하여 기계학습 알고리즘(SVM)으로 4가지 감정(행복, 슬픔. 화남, 평범)으로 분류하는 방법이다. 동사와 감정에 영향을 주는 색인어를 추출하여 감정을 인식하는 기법으로 실험결과 정확도는 기존에 동사만 사용했을 때 보다 15%향상됨을 보였다.

가변 속성 포스팅 구조의 설계 (A Design of Variable Attributes Posting Structures)

  • 안후영;이승희;박영호;이종훈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 추계학술발표대회
    • /
    • pp.759-760
    • /
    • 2009
  • 최근, 이질적인 형태의 멀티미디어 데이터들의 증가와 함께, 멀티미디어 콘텐츠들의 저장 및 검색의 중요성이 대두되고 있다. 기존의 검색 엔진들은 대부분 텍스트 데이터만을 대상으로 하고 있으며, 특별한 도메인에서는 객체 지향 데이터베이스, 객체 관계 데이터베이스 등 별도의 데이터베이스를 활용하여 검색에 사용하고 있다. 본 논문에서는 다양한 멀티미디어 콘텐츠들의 저장 및 색인에 유연한 가변 속성 포스팅 구조를 제안한다. 제안하는 가변 포스팅 구조는 벡터의 개념을 사용하여 포스팅의 속성을 추가할 수 있게 하였다. 본 논문에서 제안하는 포스팅 구조는 이질적인 형태의 멀티미디어 콘텐츠들을 각 콘텐츠들의 속성에 따라 가변적으로 저장 구조를 정의하고, 이에 따라 인덱스를 구축할 수 있는 확장성 있는 방안이다.

6 족 해저보행로봇을 위한 정적 보행 알고리즘 설계 (Design of Static Gait Algorithm for Hexapod Subsea Walking Robot: Crabster)

  • 유승열;전봉환;심형원
    • 대한기계학회논문집A
    • /
    • 제38권9호
    • /
    • pp.989-997
    • /
    • 2014
  • 본 논문에서는 6 족 다관절 해저로봇 크랩스터를 위한 정적 보행 알고리즘 설계 방법에 대하여 기술하였다. 정적 보행 알고리즘 설계를 위해 보행계획 벡터와 다리쌍 벡터의 개념을 도입하여 6 족 로봇 보행기법 설계의 편의성과 확장성을 확보하고, 이를 이용하여 수중환경이나 탐사조건에 따라 운용할 수 있는 여섯 가지 정적 보행기법을 설계하였다. 그리고, 공통 제어변수를 사용하여 각 보행 간 자유로운 연동과 자세제어와의 복합보행을 수행할 수 있도록 하였다. 설계된 여섯 가지 정적 보행기법은 시뮬레이션을 통하여 확인하였고, 크랩스터에 적용하여 보행기법 간 연동성과 복합보행 기능 등을 검증하였다.

혼합 커널을 활용한 과학기술분야 용어간 관계 추출 (Extraction of Relationships between Scientific Terms based on Composite Kernels)

  • 최성필;최윤수;정창후;맹성현
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제15권12호
    • /
    • pp.988-992
    • /
    • 2009
  • 본 논문에서는 합성곱 구문 트리 커널(convolution parse tree kernel)과, 한 문장에서 나타나는 두 개체 간의 관계를 가장 잘 설명하는 동사 상당어구에 대한 개념화를 통해 생성되는 워드넷 신셋 벡터(WordNet synsets vector) 커널을 활용하여 과학기술분야 전문용어 간의 관계 추출을 시도하였다. 본 논문에서 적용한 모델의 성능 평가를 위해서 세 가지 검증 컬렉션을 활용하였으며, 각각의 컬렉션 마다 기존의 접근 방법론 보다 우수한 성능을 보여주었다. 특히 KREC 2008 컬렉션을 대상으로 한 성능 실험에서는, 기존의 합성곱 구문 트리 커널과 동사 신셋 벡터(verb synsets vector)를 함께 적용한 합성 커널이 비교적 높은 성능 향상(8% F1)을 나타내고 있다. 이는 성능을 높이기 위해서 관계 추출에서 많이 활용하였던 개체 자질 정보와 더불어 개체 주변에 존재하는 주변 문맥 정보(동사 및 동사 상당어구)도 매우 유용한 정보임을 입증하고 있다.

이공계 대학생을 위한 Mathematica 기반의 화이트박스 이러닝 콘텐츠 설계 및 개발 (Design and Development of White-box e-Learning Contents for Science-Engineering Majors using Mathematica)

  • 전영국
    • 한국학교수학회논문집
    • /
    • 제18권2호
    • /
    • pp.223-240
    • /
    • 2015
  • 본 논문의 목적은 미적분에 관한 보충학습을 요하는 이공계 대학생들을 위하여 공업수학의 벡터미적분 교육을 중심으로 개념적 이해와 계산 과정의 단계별 풀이를 보여주는 웹 기반 이러닝 콘텐츠를 설계 및 개발하는 것이다. 이를 위하여 먼저 수학교육용 소프트웨어에 관한 고찰을 하였으며 학교 수학에서 등장하는 문제해결의 과정을 규칙 재작성으로 처리함으로써 화이트박스 형태의 콘텐츠 제작에 관한 이론적 토대를 살펴보았다. 구체적으로 Mathematica의 패턴 매칭을 이용하여 미분과 적분 연산자를 구현하였고, 이를 벡터미적분에서 등장하는 매개변수화된 곡선에 대한 길이 구하기 문제에 적용함으로써 콘텐츠 개발의 예를 제시하였다. 튜토리얼 형태로 개발된 이러닝 콘텐츠는 단계별 풀이 과정이 나오는 실습하기 콘텐츠와 퀴즈 문제를 통하여 학습자의 과정을 진단해 주는 형성평가 모듈로 구성되었다. 끝으로 개발된 이러닝 콘텐츠의 특징과 이공계 대학생들의 수학에 관한 기초학력을 증진하는데 활용될 수 있는 장점을 살펴보았으며 향후 연구 방향을 제시하였다.

상태(狀態)벡터 모형(模型)에 의한 하천유출(河川流出)의 실시간(實時間) 예측(豫測)에 관한 연구(研究) (Real-Time Prediction of Streamflows by the State-Vector Model)

  • 서병하;윤용남;강관원
    • 대한토목학회논문집
    • /
    • 제2권3호
    • /
    • pp.43-56
    • /
    • 1982
  • 상태공간(狀態空間) 개념(槪念)에 기초(基礎)를 두어 시스템의 동적(動的) 거동(擧動)을 나타낸 Kalman filter와 자기공진(自己共振) 예측자(豫測子)의 순환(循還) 알고리즘에 의한 예측방법(豫測方法)을 연구(硏究)하여 하천유출(河川流出) 예측(豫測)에의 적용성(適用性)을 검토(檢討)하고 그 결과(結果)를 제시하였다. 강우(降雨)-유출과정(流出過程)의 동적(動的) 거동(擧動)을 자색(白色) Gaussian 잡음(雜音)이 있는 선형(線型), 이산형(離散型)시스템으로 보아서 낮은 차수(次數)의 ARMA 과정(過程)으로 나타내었으며 예측모형(豫測模型)의 상태(狀態)벡터를 random walk로 나타내었다. 예측오차(豫測誤差)에 대한 통계적(統計的)인 분석(分析)으로 모형구조(模型構造)를 결정하였으며 적용(適用)된 예측(豫測)알고리즘의 검정(檢正)을 위하여 시우량(時雨量)과 시유량(時流量)의 과거(過去) 기록치(記錄値)를 사용하였다. 예측결과(豫測結果)를 분석(分析)하나 Kalman filter에 의한 알고리즘이 자기공진(自己共振) 예측자(豫測子)보다 우수하다는 것을 알 수 있었다.

  • PDF

과도한 지식을 요구하지 않는 공통기반축에 의한 용어 번역과 한영 교차정보검색에의 응용 (Knowledge-poor Term Translation using Common Base Axis with application to Korean-English Cross-Language Information Retrieval)

  • 최용석;최기선
    • 인지과학
    • /
    • 제14권1호
    • /
    • pp.29-40
    • /
    • 2003
  • 교차언어 정보검색은 다국어 정보검색의 일부분으로 질의어에서 사용하는 언어와 검색대상인 문서의 언어가 서로 다른 경우의 정보검색을 의미한다. 교차언어 정보검색의 성능 향상을 위해서는 양질의 언어자원이 대량으로 필요한 경우가 많기 때문에 이를 해결하기 쉽지 않다. 본 논문에서는 사전에 기반한 대역어 후보 선정 시, 가중치를 부여해 질의어를 변환하는 방식을 제안한다. 가중치 계산에 이용되는 의미거리는 영어 명사와 한국어 명사를 같은 벡터 공간에 표현하고, 두 벡터간의 관계를 이용해 거리를 계산한다. 서로 다른 두 언어의 명사를 한 공간에 표현하기 위해 "공통 기반축"의 개념을 제시하고, 구축 방법을 제안한다. 고급 자원인 온톨로지를 확보하지 않고, 제안하는 방법으로 우수한 정보검색 결과를 얻을 수 있다는 것을 실험을 통해 보여준다.을 통해 보여준다.

  • PDF

주파수 영역에서 에너지 확률을 이용한 얼굴 특징 추출 (Facial Feature Extraction Using Energy Probability in Frequency Domain)

  • 최진;정윤수;김기현;유장희
    • 대한전자공학회논문지SP
    • /
    • 제43권4호
    • /
    • pp.87-95
    • /
    • 2006
  • 본 논문에서는 얼굴 영상의 에너지 분포 특성을 이용한 새로운 특정추출 방법을 제안한다. 제안된 방법은 얼굴 영상의 에너지 확률과 에너지 랩을 이용해서 데이터 차원이 축소된 유효정보의 추출 및 유효정보의 LDA 해석에 기반을 둔다. 일반적으로, 얼굴 영상은 고유한 에너지 분포 특성을 가지고 있다. 그러나 기존의 많은 DCT 기반 방법들은 이러한 얼굴 영상의 특성을 효과적으로 이용하지 못하는 단점이 있다. 제안된 방법은 이러한 기존 방법의 단점을 개선하기 위해 다음의 3단계 방법을 사용한다. 먼저, DCT 도메인에서 얼굴의 에너지 확률 개념을 정의하고, 이러한 에너지 확률로부터 얼굴의 에너지 맵을 생성한다. 마지막으로, 에너지 확률 지도에 위치한 주파수 계수들에 대한 LDA 적용 및 해석을 통하여 특정 벡터 추출 및 인식을 수행한다. 제안된 방법은 ETRI 데이터베이스에서 96.8%, ORL 데이터베이스에서 100%의 인식률을 보인다. 실험을 통하여 인식 성능의 개선뿐만 아니라, 특정 벡터의 차원 축소에도 효과가 있음을 알 수 있다.

개선된 동적 타임 워핑 알고리즘을 이용한 효율적인 필기문자 감정 (Efficient Handwritten Character Verification Using an Improved Dynamic Time Warping Algorithm)

  • 장석우;박영재;김계영
    • 한국컴퓨터정보학회논문지
    • /
    • 제15권7호
    • /
    • pp.19-26
    • /
    • 2010
  • 본 논문에서는 온라인 환경에서 필기 문자열을 입력받고, 입력된 문자열의 유사성을 자동으로 분석하여 두 필적이 동일인에 의해 작성된 것인지를 판단하는 새로운 필적 감정 방법을 제안한다. 제안된 방법에서는 먼저 온라인으로 입력된 문자열에 회전 프로젝션(circular projection) 방법을 적용하여 모양, 방향 등과 같이 문자열이 가진 고유의 특징을 추출하여 벡터의 형태로 저장한다. 그런 다음, 문자 인식 분야에서 많이 사용되는 기존의 동적 타임 워핑 알고리즘을 개선하여, 이를 입력된 두 문자열의 특징 벡터의 유사성을 추출하는데 적용한다. 본 논문에서 개선된 동적 타임 워핑 알고리즘은 최적화 문제에서 좋은 결과를 산출한다고 알려진 분기한정법(branch and bound)의 개념을 기존의 동적 타임 워핑 알고리즘에 효과적으로 결합함으로써 기존의 동적 타임 워핑 알고리즘의 효율을 향상시켰다. 제안된 필기 문자열 감정 알고리즘의 성능을 확인하기 위한 실험에서는 다양하게 입력된 필기 문자열을 가지고 제안된 방법의 성능을 비교 하였으며, 그 결과 제안된 방법이 기존의 알고리즘에 비해 보다 효율적으로 필적을 감정하였음을 검증하였다.

벡터길이 비교를 이용한 고속 Matching Pursuit (Fast Matching Pursuit based on Vector Length Comparison)

  • 오석병;전병우
    • 대한전자공학회논문지SP
    • /
    • 제38권2호
    • /
    • pp.129-137
    • /
    • 2001
  • Matching Pursuit Algorithm은 저 전송 채널에서의 비디오 부호화에 뛰어난 효과를 나타내고 있지만, 주어진 입력 영상을 가장 유사하게 표현 하는데 필요한 구성 신호들을 찾아내기 위한 연산량이 많다는 현실적 문제점을 갖고 있다. 본 논문은 영상에 열화를 주지 않고 연산량을 크게 줄일 수 있는 새로운 방법을 제안한다. 이 방법은 전체적인 Matching Pursuit Algorithm중에서 가장 많은 연산을 요구하는, 영상을 구성하는 기본 신호들을 찾아내는데 필요한 내적 연산을 줄이는데 기초한다. 이를 위해 첫번째 과정으로 기존의 고속 방법인 분리성(Separable property)을 이용한 방법을 사용하여 주어진 입력영상과 수직성분의 1차원 기본 신호를 내적 하여 생성되는 결과값들을 저장한다. 두 번째 단계에서는 수평성분의 1차원 신호와의 내적 연산에 적용되는 부분들로 이루어진 1차원 신호들을 위치벡터의 개념을 도입하여 벡터길이를 측정한 후, 그 길이 값과 현재까지의 최대 내적 절대값을 서로 비교한 후 수평성분과의 내적 연산을 수행할지 하지 않을지를 판단한다. 대부분의 신호들은 다음단계의 내적 연산을 필요로 하지 않기 때문에 내적 연산랑을 크게 줄일 수 있다. 실험결과에 나타난 바와 같이, 대부분의 영상에서 화질에 전혀 열화를 수반하지 않고 기존 Neff의 고속방법보다 약 70%정도의 내적 연산량이 줄어듦을 알 수 있다.

  • PDF